CN117573613A - 数据格式转换方法、装置、存储介质及电子设备 - Google Patents
数据格式转换方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN117573613A CN117573613A CN202311487390.5A CN202311487390A CN117573613A CN 117573613 A CN117573613 A CN 117573613A CN 202311487390 A CN202311487390 A CN 202311487390A CN 117573613 A CN117573613 A CN 117573613A
- Authority
- CN
- China
- Prior art keywords
- file
- converted
- paragraph
- data format
- dividing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000004590 computer program Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/116—Details of conversion of file system types or formats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Document Processing Apparatus (AREA)
Abstract
本申请公开了一种数据格式转换方法、装置、存储介质及电子设备,其中方法应用于第二端,所述第二端与第一端连接;该方法包括:接收第一端发送的待转换文件;将所述待转换文件划分各个段落,并将各个段落划分为各个节点;基于所述待转换文件的各个段落和各个段落对应的各个节点构建所述待转换文件的中间文件;确定所述待转换文件在所述第二端的应用场景,基于所述应用场景将所述中间文件进行格式转换,得到所述第二端支持运行的最终文件;其中,所述中间文件、所述待转换文件和所述最终文件的数据格式两两不同。本申请提供的方法和装置,提高了数据格式的转换效率,提高了不同端之间数据交互效率。
Description
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种数据格式转换方法、装置、存储介质及电子设备。
背景技术
随着互联网的发展不同端系统之间的数据交换变得愈发复杂,不同系统之间的数据格式差异引发了诸多问题。
因此,如何在不同端之间进行数据格式的转换成为业界亟待解决的技术问题。
发明内容
本申请提供一种数据格式转换方法、装置、存储介质及电子设备,用以解决现有技术中不同端之间进行数据格式的转换的技术问题。
第一方面,本申请提供了一种数据格式转换方法,应用于第二端,所述第二端与第一端连接;所述方法包括:
接收第一端发送的待转换文件;
将所述待转换文件划分各个段落,并将各个段落划分为各个节点;
基于所述待转换文件的各个段落和各个段落对应的各个节点构建所述待转换文件的中间文件;
确定所述待转换文件在所述第二端的应用场景,基于所述应用场景将所述中间文件进行格式转换,得到所述第二端支持运行的最终文件;
其中,所述中间文件、所述待转换文件和所述最终文件的数据格式两两不同。
在一些实施例中,所述将所述待转换文件划分各个段落,包括:
对所述待转换文件进行解析;
在所述待转换文件存在段落标识的情况下,基于所述段落标识将所述待转换文件划分各个段落;
在所述待转换文件不存在段落标识的情况下,基于所述待转换文件的数据格式设定所述待转换文件的段落划分规则,基于所述段落划分规则将所述待转换文件划分各个段落。
在一些实施例中,所述将各个段落划分为各个节点,包括:
在所述段落对应的待转换文件为文档的情况下,基于所述段落中的句子结束符号将所述段落划分为各个句子;
基于各个句子得到各个节点。
在一些实施例中,所述将各个段落划分为各个节点,包括:
在所述段落对应的待转换文件为非文档的情况下,基于所述段落中的分隔符将所述段落划分为各个句子;
基于各个句子得到各个节点。
在一些实施例中,所述基于各个句子得到各个节点,包括:
在各个句子均为纯文本的情况下,将一个句子作为一个节点;
在任一句子不是纯文本的情况下,基于所述任一句子中各个数据的数据类型将所述任一句子划分为各个节点。
在一些实施例中,所述对所述待转换文件进行解析,包括:
识别所述待转换文件的数据格式;
基于所述数据格式确定所述待转换文件对应的解析器;
基于所述解析器对所述待转换文件进行解析。
在一些实施例中,不同待转换文件对应的中间文件的数据格式相同。
第二方面,本申请提供了一种数据格式转换装置,应用于第二端,所述第二端与第一端连接;所述装置包括:
接收第一端发送的待转换文件;
将所述待转换文件划分各个段落,并将各个段落划分为各个节点;
基于所述待转换文件的各个段落和各个段落对应的各个节点构建所述待转换文件的中间文件;
确定所述待转换文件在所述第二端的应用场景,基于所述应用场景将所述中间文件进行格式转换,得到所述第二端支持运行的最终文件;
其中,所述中间文件、所述待转换文件和所述最终文件的数据格式两两不同。
第三方面,本申请提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的方法。
第四方面,本申请提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述程序时实现上述的方法。
本申请提供的数据格式转换方法、装置、存储介质及电子设备,通过将第一端发送的待转换文件转换为中间文件,并根据应用场景将中间文件转换为第二端支持运行的最终文件,无论第一端发送哪种数据格式的待转换文件,均可以将待转换文件转换为与第二端适配的数据格式的文件,实现了不同端之间的数据格式转换;通过段落和节点构建中间文件,根据中间文件进行数据格式转换,降低了不同数据格式之间直接转换的复杂性,降低了数据格式转换难度,提高了数据格式转换效率,提高了不同端数据交互的效率和准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的数据格式转换方法的流程示意图;
图2为本申请实施例提供的中间文件的结构示意图;
图3为本申请实施例提供的生成中间文件的流程示意图之一;
图4为本申请实施例提供的生成中间文件的流程示意图之二;
图5为本申请实施例提供的数据格式转换装置的结构示意图;
图6为本申请实施例提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。
本申请实施例提供的数据格式转换方法适用于第二端,第二端可以是后端,也可以是具有显示屏并且支持网页浏览的各种电子设备对应的端口,电子设备包括但不限于服务器、智能手机、平板电脑、膝上型便携计算机和台式计算机等。
在本申请的技术方案中,所涉及的个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
图1为本申请实施例提供的数据格式转换方法的流程示意图,如图1所示,该方法包括步骤110、步骤120、步骤130和步骤140。该方法流程步骤仅仅作为本申请一个可能的实现方式。
步骤110、接收第一端发送的待转换文件。
具体地,本申请实施例提供的数据格式转换方法的执行主体为数据格式转换装置,该装置可以为第二端中独立设置的硬件设备,也可以为运行在第二端设备中的软件程序。例如,当第二端为后端时,数据格式转换装置可以体现为后端的数据转换应用程序。
第二端与第一端连接,第二端与第一端为不同端。当第二端为后端时,第一端可以为前端。
待转换文件为需要进行数据格式转换的文件。
当第一端生成待转换文件后,会将待转换文件发送至第二端,第二端接收到待转换文件,会对该待转换文件进行数据格式的转换,从而使该待转换文件能够被第二端所识别和运行。
步骤120、将待转换文件划分各个段落,并将各个段落划分为各个节点。
具体地,可以预先设置中间文件的数据格式,将不同待转换文件转换为同一数据格式的中间文件,即不同待转换文件对应的中间文件的数据格式相同,从而便于后续对中间文件进行处理。
每个待转换文件均为一个数据集合,每个待转换文件可分为多个段落,每个段落可分为多个节点。节点中的数据可以包括纯文本(text)内容样式(style)描述和行为(action)描述等。
图2为本申请实施例提供的中间文件的结构示意图。如图2所示,可以将中间文件的数据格式设置为根据段落和节点进行拆分的格式。因此需要将待转换文件划分各个段落,并将各个段落划分为各个节点。图2中的结构主要示意出中间文件的数据内部划分情况,而不是中间文件实际的数据格式。
步骤130、基于待转换文件的各个段落和各个段落对应的各个节点构建待转换文件的中间文件。
具体地,得到待转换文件的各个段落,和每个段落对应的各个节点后,可以根据待转换文件的各个段落和各个段落对应的各个节点构建待转换文件的中间文件。
该中间文件与待转换文件的数据内容相同,数据格式不同。因为中间文件中将段落和节点进行了划分,所以可以更容易识别待转换文件的数据内容,因此相比于两个数据格式的直接转换,通过中间文件进行数据格式的转换,转换效率更高。
步骤140、确定待转换文件在第二端的应用场景,基于应用场景将中间文件进行格式转换,得到第二端支持运行的最终文件;其中,中间文件、待转换文件和最终文件的数据格式两两不同。
具体地,在第二端应用中,不同待转换文件可能会对应不同的应用场景,而不同应用场景所适用的数据格式可能存在区别。
例如,应用场景为在进行数据处理和检查,则需要提供纯文本数据格式的数据;应用场景为在Web预览页面,则需要提供HTML数据格式的数据;应用场景为在移动端,则需要提供WebView数据格式的数据;应用场景为在富文本编辑模式,则需要提供为对应编辑器支持的数据格式的数据;在无法确定应用场景,或无法确定或提供应用场景所需的数据格式是,还可以提供自定义的Schame数据格式的数据。
因此在得到中间文件后,需要确定待转换文件在第二端的应用场景,并根据该应用场景确定目标数据格式,从而将中间文件的数据格式转换为目标数据格式,得到最终文件。因为最终文件的数据格式是适用于当前应用场景的,因此最终文件可以在第二端正常运行。
可以在第一端和第二端的系统中引入两端通用富文本数据格式转换工具。根据实际需求配置工具,并通过该工具将待转换文件转换为最终文件。
在除第二端之外的其他终端需要使用到该待转换文件的数据时,可以根据其他终端支持运行的数据格式类型,将第二端中待转换文件的中间文件转换成该数据格式类型的文件,或直接基于该中间文件提取对应的数据。
本申请实施例提供的数据格式转换方法,通过将第一端发送的待转换文件转换为中间文件,并根据应用场景将中间文件转换为第二端支持运行的最终文件,无论第一端发送哪种数据格式的待转换文件,均可以将待转换文件转换为与第二端适配的数据格式的文件,实现了不同端之间的数据格式转换;通过段落和节点构建中间文件,根据中间文件进行数据格式转换,降低了不同数据格式之间直接转换的复杂性,降低了数据格式转换难度,提高了数据格式转换效率,提高了不同端数据交互的效率和准确性。
需要说明的是,本申请每一个实施方式可以自由组合、调换顺序或者单独执行,并不需要依靠或依赖固定的执行顺序。
在一些实施例中,步骤120包括:
对待转换文件进行解析;
在待转换文件存在段落标识的情况下,基于段落标识将待转换文件划分各个段落;
在待转换文件不存在段落标识的情况下,基于待转换文件的数据格式设定待转换文件的段落划分规则,基于段落划分规则将待转换文件划分各个段落。
对待转换文件进行解析,包括:
识别待转换文件的数据格式;
基于数据格式确定待转换文件对应的解析器;
基于解析器对待转换文件进行解析。
具体地,第二端接收到待转换文件后,可以通过解析器对待转换文件进行解析。
图3为本申请实施例提供的生成中间文件的流程示意图之一。如图3所示,接收到待转换文件后可以识别待转换文件的数据格式,然后根据其对应的格式在存储的各种解析器中确定待转换文件对应的解析器。待转换文件的数据格式可能为JSON格式、XML格式、HTML格式、纯文本格式或富文本格式等。
例如,待转换文件的数据格式为JSON格式,则在解析器集合中找到JSON解析器,通过JSON解析器对该待转换文件进行解析。
通过解析器提取待转换文件的文本、样式和行为等数据,将解析得到的数据转换为统一的中间文件的数据格式,以确保后续转换的一致性。中间文件可以为自定义的Schame码,可以将中间文件存储在第二端的数据库(Database,DB)中。
构成中间文件的段落可以通过如下方式进行获取:
对于存在段落标识的待转换文件,根据段落标识将待转换文件拆分为各个段落。
对于无明显段落标识的待转换文件,则根据待转换文件的数据格式设定待转换文件的段落划分规则,根据段落划分规则将待转换文件划分各个段落。
例如,待转换文件的数据格式为Excel格式,可以设定待转换文件的段落划分规则为每一行为一个段落。
待转换文件的数据格式为PPT式,可以设定待转换文件的段落划分规则为一页幻灯片为一个段落。
图4为本申请实施例提供的生成中间文件的流程示意图之二。如图4所示,生成解析指令对待转换文件进行解析,识别到待转换文件的段落,将待转换文件拆分为各个段落,提取文本、样式、行为等信息。将各个段落进行解析得到每个段落对应的各个句子,对句子进行解析并将句子切分为最小节点,根据最小节点、句子和段落生成统一码,即生成数据格式相同的中间文件。
本申请实施例提供的数据格式转换方法,通过段落标识或设定的段落划分规则对待转换文件划分为各个段落,从而构建中间文件,提高了数据转换的效率,提升了不同端之间系统的灵活性和可扩展性,支持多种数据格式的转换,满足了不同系统的需求。
在一些实施例中,步骤120包括:
在段落对应的待转换文件为文档的情况下,基于段落中的句子结束符号将段落划分为各个句子;
基于各个句子得到各个节点。
在段落对应的待转换文件为非文档的情况下,基于段落中的分隔符将段落划分为各个句子;
基于各个句子得到各个节点。
基于各个句子得到各个节点,包括:
在各个句子均为纯文本的情况下,将一个句子作为一个节点;
在任一句子不是纯文本的情况下,基于任一句子中各个数据的数据类型将任一句子划分为各个节点。
具体地,当得到待转换文件的段落后,确定该待转换文件的文件类型。文件类型可包括文档和非文档。
文档类型的文件指的是具有文本内容的文件,例如Word文档、PDF文档和纯文本文件等。这些文件通常包含连续的文本片段,由句子和段落组成。在处理文档类型的待转换文件时,可以使用句子结束符号(例如句号、问号、感叹号等)作为分句的标识,将文本分割成多个句子。
非文档类型的文件指的是没有明确定义文本结构的文件,例如电子表格(Excel)、数据库文件和二进制文件等。这些文件不以文本内容为主要特征,而是以其他形式的数据存储和组织。在处理非文档类型的待转换文件时,无法直接根据句子结束符号来分隔文本,而需要根据特定的分隔符或规则进行分句。
因此,若待转换文件为文档,则以句子结束符号进行分句;非若待转换文件为非文档,则可以使用分隔符进行分句。
得到各个句子后,可以对句子进行进一步的拆分。
若各个句子均为纯文本,则拆分成句子后,自动生成一个默认节点数据{"text":"句子内容"}。即一个句子为一个节点。
若存在不是纯文本的句子,则根据该句子中各个数据的数据类型对该句子进行解析,提取该句子中含有特殊样式的文本,拆分当前句子为node节点,并记录样式和行为。
例如:“句子红色加链接的内容。”红色部分和链接部分均为不同的数据类型,可解析为[{"text":"句子"},{"text":"红色","style":"red"},{"text":"加"},{"text":"链接","action":"link":"..."},{"text":"的内容。"}],从而得到各个节点。
可以将段落拆分为句子,再将句子拆分为各个节点;也可以直接将段落拆分为各个节点,可以根据实际情况选择获取节点的方式。例如,Excel格式的待转换文本可以直接将一行定义为一个段落,一个单元格定义为一个节点,不需要进行句子的划分。
下表中示意出了不同数据格式的待转换文件对应的数据,以及对应的中间文件和得到的纯文本数据。具体如下表1所示:
表1各个数据格式的待转换文本、中间文件和纯文本数据统计
本申请实施例提供的数据格式转换方法,通过句子结束符号或分隔符将段落划分为各个句子,再根据句子中的数据类型将句子划分为各个节点,从而可以构建中间文件,提高了中间文件的构建效率,提高了数据格式的转换效率。
下面对本申请实施例提供的数据格式转换装置进行描述,下文描述的数据格式转换装置与上文描述的数据格式转换方法可相互对应参照。
图5为本申请实施例提供的数据格式转换装置的结构示意图,如图5所示,数据格式转换装置应用于第二端,第二端与第一端连接;该装置包括接收模块510、划分模块520、构建模块530和转换模块540。
接收模块,用于接收第一端发送的待转换文件;
划分模块,用于将待转换文件划分各个段落,并将各个段落划分为各个节点;
构建模块,用于基于待转换文件的各个段落和各个段落对应的各个节点构建待转换文件的中间文件;
转换模块,用于确定待转换文件在第二端的应用场景,基于应用场景将中间文件进行格式转换,得到第二端支持运行的最终文件;
其中,中间文件、待转换文件和最终文件的数据格式两两不同。
具体地,根据本申请的实施例,接收模块、划分模块、构建模块和转换模块中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。
或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。
根据本申请的实施例,接收模块、划分模块、构建模块和转换模块中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。
或者,接收模块、划分模块、构建模块和转换模块中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
本申请实施例提供的数据格式转换装置,通过将第一端发送的待转换文件转换为中间文件,并根据应用场景将中间文件转换为第二端支持运行的最终文件,无论第一端发送哪种数据格式的待转换文件,均可以将待转换文件转换为与第二端适配的数据格式的文件,实现了不同端之间的数据格式转换;通过段落和节点构建中间文件,根据中间文件进行数据格式转换,降低了不同数据格式之间直接转换的复杂性,降低了数据格式转换难度,提高了数据格式转换效率,提高了不同端数据交互的效率和准确性。
在一些实施例中,划分模块具体用于:
对待转换文件进行解析;
在待转换文件存在段落标识的情况下,基于段落标识将待转换文件划分各个段落;
在待转换文件不存在段落标识的情况下,基于待转换文件的数据格式设定待转换文件的段落划分规则,基于段落划分规则将待转换文件划分各个段落。
在一些实施例中,划分模块具体用于:
在段落对应的待转换文件为文档的情况下,基于段落中的句子结束符号将段落划分为各个句子;
基于各个句子得到各个节点。
在一些实施例中,划分模块包括拆分子模块,拆分子模块用于:
在段落对应的待转换文件为非文档的情况下,基于段落中的分隔符将段落划分为各个句子;
基于各个句子得到各个节点。
在一些实施例中,拆分子模块用于:
在各个句子均为纯文本的情况下,将一个句子作为一个节点;
在任一句子不是纯文本的情况下,基于任一句子中各个数据的数据类型将任一句子划分为各个节点。
在一些实施例中,划分模块包括解析子模块,解析子模块用于:
识别待转换文件的数据格式;
基于数据格式确定待转换文件对应的解析器;
基于解析器对待转换文件进行解析。
在一些实施例中,不同待转换文件对应的中间文件的数据格式相同。
在此需要说明的是,本申请实施例提供的数据格式转换装置,能够实现上述数据格式转换方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
图6为本申请实施例提供的电子设备的结构示意图,如图6所示,该电子设备可以包括:处理器(Processor)610、通信接口(Communications Interface)620、存储器(Memory)630和通信总线(Communications Bus)640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑命令,以执行上述方法,该方法,应用于第二端,第二端与第一端连接;该方法包括:
接收第一端发送的待转换文件;
将待转换文件划分各个段落,并将各个段落划分为各个节点;
基于待转换文件的各个段落和各个段落对应的各个节点构建待转换文件的中间文件;
确定待转换文件在第二端的应用场景,基于应用场景将中间文件进行格式转换,得到第二端支持运行的最终文件;
其中,中间文件、待转换文件和最终文件的数据格式两两不同。
此外,上述的存储器中的逻辑命令可以通过软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例提供的电子设备中的处理器可以调用存储器中的逻辑指令,实现上述方法,其具体的实施方式与前述方法实施方式一致,且可以达到相同的有益效果,此处不再赘述。
本申请实施例还提供一种非暂态计算机可读的存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法。
其具体的实施方式与前述方法实施方式一致,且可以达到相同的有益效果,此处不再赘述。
本申请实施例提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如上述方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种数据格式转换方法,其特征在于,应用于第二端,所述第二端与第一端连接;所述方法包括:
接收第一端发送的待转换文件;
将所述待转换文件划分各个段落,并将各个段落划分为各个节点;
基于所述待转换文件的各个段落和各个段落对应的各个节点构建所述待转换文件的中间文件;
确定所述待转换文件在所述第二端的应用场景,基于所述应用场景将所述中间文件进行格式转换,得到所述第二端支持运行的最终文件;
其中,所述中间文件、所述待转换文件和所述最终文件的数据格式两两不同。
2.根据权利要求1所述的数据格式转换方法,其特征在于,所述将所述待转换文件划分各个段落,包括:
对所述待转换文件进行解析;
在所述待转换文件存在段落标识的情况下,基于所述段落标识将所述待转换文件划分各个段落;
在所述待转换文件不存在段落标识的情况下,基于所述待转换文件的数据格式设定所述待转换文件的段落划分规则,基于所述段落划分规则将所述待转换文件划分各个段落。
3.根据权利要求2所述的数据格式转换方法,其特征在于,所述将各个段落划分为各个节点,包括:
在所述段落对应的待转换文件为文档的情况下,基于所述段落中的句子结束符号将所述段落划分为各个句子;
基于各个句子得到各个节点。
4.根据权利要求2所述的数据格式转换方法,其特征在于,所述将各个段落划分为各个节点,包括:
在所述段落对应的待转换文件为非文档的情况下,基于所述段落中的分隔符将所述段落划分为各个句子;
基于各个句子得到各个节点。
5.根据权利要求3或4所述的数据格式转换方法,其特征在于,所述基于各个句子得到各个节点,包括:
在各个句子均为纯文本的情况下,将一个句子作为一个节点;
在任一句子不是纯文本的情况下,基于所述任一句子中各个数据的数据类型将所述任一句子划分为各个节点。
6.根据权利要求2所述的数据格式转换方法,其特征在于,所述对所述待转换文件进行解析,包括:
识别所述待转换文件的数据格式;
基于所述数据格式确定所述待转换文件对应的解析器;
基于所述解析器对所述待转换文件进行解析。
7.根据权利要求1所述的数据格式转换方法,其特征在于,不同待转换文件对应的中间文件的数据格式相同。
8.一种数据格式转换装置,其特征在于,应用于第二端,所述第二端与第一端连接;所述装置包括:
接收模块,用于接收第一端发送的待转换文件;
划分模块,用于将所述待转换文件划分各个段落,并将各个段落划分为各个节点;
构建模块,用于基于所述待转换文件的各个段落和各个段落对应的各个节点构建所述待转换文件的中间文件;
转换模块,用于确定所述待转换文件在所述第二端的应用场景,基于所述应用场景将所述中间文件进行格式转换,得到所述第二端支持运行的最终文件;
其中,所述中间文件、所述待转换文件和所述最终文件的数据格式两两不同。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的数据格式转换方法。
10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7任一项所述的数据格式转换方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311487390.5A CN117573613A (zh) | 2023-11-07 | 2023-11-07 | 数据格式转换方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311487390.5A CN117573613A (zh) | 2023-11-07 | 2023-11-07 | 数据格式转换方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117573613A true CN117573613A (zh) | 2024-02-20 |
Family
ID=89892753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311487390.5A Pending CN117573613A (zh) | 2023-11-07 | 2023-11-07 | 数据格式转换方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117573613A (zh) |
-
2023
- 2023-11-07 CN CN202311487390.5A patent/CN117573613A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766328B (zh) | 结构化文本的文本信息提取方法、存储介质和服务器 | |
AU2012367230A1 (en) | Hierarchical information extraction using document segmentation and optical character recognition correction | |
CN108334609B (zh) | Oracle中实现JSON格式数据存取的方法、装置、设备及存储介质 | |
CN107741931A (zh) | 操作系统框架的翻译方法、移动终端和存储装置 | |
CN111241182A (zh) | 数据处理方法和装置、存储介质和电子装置 | |
CN104750663B (zh) | 页面中文本乱码的识别方法及装置 | |
CN103038762B (zh) | 自然语言处理装置、方法 | |
CN109446042A (zh) | 一种用于智能用电设备的日志管理方法及系统 | |
CN110851136A (zh) | 数据获取方法、装置、电子设备及存储介质 | |
CN115391439A (zh) | 文档数据导出方法、装置、电子设备和存储介质 | |
CN109828759A (zh) | 代码编译方法、装置、计算机装置及存储介质 | |
CN112597410A (zh) | 基于规则配置库对网页内容执行结构化提取的方法及装置 | |
CN109740074B (zh) | 参数配置信息的处理方法、装置及设备 | |
CN117573613A (zh) | 数据格式转换方法、装置、存储介质及电子设备 | |
CN116050354A (zh) | 一种实验手册的配置方法以及装置 | |
CN116010147A (zh) | 异常处理表的生成方法、系统、电子设备及存储介质 | |
CN115759029A (zh) | 文档模板处理方法、装置、电子设备及存储介质 | |
CN114281761A (zh) | 一种数据文件加载方法、装置、计算机设备及存储介质 | |
CN109241501A (zh) | 文件解析方法和装置 | |
CN115065945A (zh) | 短信链接生成方法、装置、电子设备及存储介质 | |
CN113821692A (zh) | 数据处理方法、装置、服务器及存储介质 | |
CN111475403A (zh) | 测试脚本的动态生成方法及相关装置 | |
CN112800078A (zh) | 基于javascript的轻量级文本标注方法、系统、设备及存储介质 | |
CN111783482A (zh) | 一种文本翻译方法、装置、计算机设备及存储介质 | |
CN114115833B (zh) | 协议审计代码自动生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |