CN111143297B - 多格式混合数据的分类、拼接系统及方法 - Google Patents

多格式混合数据的分类、拼接系统及方法 Download PDF

Info

Publication number
CN111143297B
CN111143297B CN201911319257.2A CN201911319257A CN111143297B CN 111143297 B CN111143297 B CN 111143297B CN 201911319257 A CN201911319257 A CN 201911319257A CN 111143297 B CN111143297 B CN 111143297B
Authority
CN
China
Prior art keywords
data
format
files
unit
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911319257.2A
Other languages
English (en)
Other versions
CN111143297A (zh
Inventor
吴非
陆欢旺
徐剑刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Sandao Intelligent Technology Co ltd
Original Assignee
Shanghai Sandao Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Sandao Intelligent Technology Co ltd filed Critical Shanghai Sandao Intelligent Technology Co ltd
Priority to CN201911319257.2A priority Critical patent/CN111143297B/zh
Publication of CN111143297A publication Critical patent/CN111143297A/zh
Application granted granted Critical
Publication of CN111143297B publication Critical patent/CN111143297B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • G06F16/1794Details of file format conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据处理技术领域,公开了多格式混合数据的分类、拼接系统及方法,系统包括:原始数据存储单元,用于存储待处理的具有数据属性标记的多格式批量数据文件;数据文件分类单元,根据数据文件的格式后缀,对原始数据存储单元中待处理的多格式批量数据文件按格式进行分类;数据文件融合单元,根据数据文件的类型,融合经数据文件分类单元分类后的具有相同类型条件的各格式数据文件;数据输出单元,根据数据文件的属性,从数据文件融合单元融合后的数据文件中输出具有相同属性的数据文件。本发明的技术方案实现了快速对成批量的不同属性、不同格式的混合数据按格式进行格式分类后再将同一属性不同格式的数据进行合并。

Description

多格式混合数据的分类、拼接系统及方法
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种多格式混合数据的分类、拼接系统及方法。
背景技术
互联网信息时代的来临和大数据技术的出现,造成了前所未有的数据洪流,众多利益相关者希望数据能够实现共享或者实现互换,但是,不同的数据往往存在存储方式不同或数据结构不同的问题,这些问题极大地阻碍了数据交流的进程。
举个例子,在进出口货品装船出运前,均需向海关进行申报,同一属性的数据(即同一货品申报的数据)均包括箱单、发票、运单、合同等多种数据,而这些数据往往通过不同的格式进行存储,如Excel、PDF等,除此之外,每天均有大量货品进行报关,因此,大量不同属性以及不同格式的数据被录入,为了实现数据与货品的匹配,以及方便后续处理,这些数据在存储入库前必须要进行清洗及分类工作。以往,此类工作一般以人工操作为主,因此不仅存在着耗时耗力,效率低下的问题,同时数据也容易被二次污染,导致无法实现数据的快速、高效应用,阻碍了数据交换共享、快速应用的进程。
发明内容
针对现有技术存在的不足,本发明的目的之一是提供一种快速对成批量的不同属性、不同格式的混合数据按格式进行分类,再根据属性将同一属性不同格式的数据进行合并的多格式混合数据的分类、拼接系统。
本发明的上述发明目的多格式混合数据的分类、拼接系统是通过以下技术方案得以实现的:
多格式混合数据的分类、拼接系统,包括:
原始数据存储单元,用于存储待处理的多格式批量数据文件,其中所述数据文件按照数据属性命名;
数据文件分类单元,根据所述数据文件的格式后缀,对原始数据存储单元中待处理的多格式批量数据文件按格式进行分类;
数据文件融合单元,根据所述数据文件的类型,融合经数据文件分类单元分类后的具有相同类型条件的各格式数据文件;
数据输出单元,根据所述数据文件的属性,从数据文件融合单元融合后的数据文件中输出具有相同属性的数据文件。
通过采用上述技术方案,数据文件分类单元根据数据文件的格式后缀对原始数据存储单元中存储的待处理的多格式批量数据文件按照格式进行分类存储,数据文件融合单元再根据文件的类型,将各个格式的具有相同类型条件的数据文件融合成特定的结构输出,从而实现了快速对成批量的不同属性、不同格式的混合数据按格式进行格式分类后再将同一属性不同格式的数据进行合并。
本发明在一较佳示例中可以进一步配置为:还包括数据获取单元,所述数据获取单元位于所述原始数据存储单元与所述数据文件分类单元之间,用于从所述原始数据存储单元获取待处理的多格式批量数据文件,并发送至所述数据文件分类单元。
通过采用上述技术方案,数据获取单元实现了数据文件的转移,将原始数据存储单元中的待处理的多格式批量数据文件发送至所述数据文件分类单元进行分类处理。
本发明在一较佳示例中可以进一步配置为:所述数据文件融合单元包括:
数据结构化处理单元,分别对分类后的数据文件进行结构化处理,以期使各数据文件生成可结构化存储的中间文件;
数据内容规则模块,预先设定有多种类型标准模型,并分配有对应的类型库,按照类型标准模型对数据结构化处理单元生成的各中间文件进行分类别存储。
通过采用上述技术方案,数据结构化处理单元分别将分类后的数据文件进行结构化处理,转化成中间文件,中间文件的特点为具有可扩展功能,相同类型的中间文件具有相同的标记,相同类型且不同格式的数据文件对应的中间文件高度相似,因此,便于后续不同格式相同类型的数据文件按照类型进行分类;数据内容规则模块预先设定有多种类型标准模型,并分配有对应的类型库,因此,将中间文件一一与各标准模型进行比对,能够实现匹配的中间文件放置对应的类型库中,从而实现了了数据文件按照类型分类。
本发明在一较佳示例中可以进一步配置为:所述数据文件融合单元还包括不合规数据文件库,所述不合规数据文件库用于存储剔除的不合规数据文件。
通过采用上述技术方案,不能与任一标准模型匹配的中间文件直接隔离存储至不合规数据文件库,便于人工干涉,进行检查、分类。
本发明在一较佳示例中可以进一步配置为:所述数据文件融合单元还包括数据分类记录单元与数据内容规则模块连接,所述数据分类记录单元用于对所述数据内容规则模块生成的类型库进行记录。
通过采用上述技术方案,数据分类记录单元用于对所述数据内容规则模块生成的类型库进行记录,从而方便使用者识别、统计。
本发明在一较佳示例中可以进一步配置为:还包括数据存储规则单元,所述数据存储规则单元与所述数据输出单元连接,预先设定有最终所需输出数据文件的标准结构。
通过采用上述技术方案,使用者通过数据存储规则单元可预先设定需要输出的数据文件的标准结构,使该系统可运用于不同领域,提高了本系统的实用性。
本发明的第二目的在于提供一种基于上述多格式混合数据的分类、拼接系统的多格式混合数据的分类、拼接方法,其能够快速对成批量的不同属性、不同格式的混合数据按格式进行分类,再根据属性将同一属性所有格式的数据进行合并。
本发明的上述发明目的多格式混合数据的分类、拼接方法是通过以下技术方案得以实现的:
多格式混合数据的分类、拼接方法,包括以下步骤:
S1:数据录入,将待处理的多格式批量数据文件按照特定的数据属性命名后存储至原始数据存储单元;
S2:获取数据,从原始数据存储单元获取待处理的多格式批量数据文件;
S3:格式分类,根据所述数据文件的格式后缀将待处理的多格式批量数据文件按格式进行分类;
S4:数据融合:将经过格式分类后的数据进行解析,将需要的字段进行清洗、分类、整理融合成一份特定格式的数据,然后输出融合后的数据。
通过采用上述技术方案,用户将各数据文件按照数据属性进行命名后存储至原始数据存储单元,数据文件分类单元根据数据文件的格式后缀对原始数据存储单元中存储的待处理的多格式批量数据文件按照格式进行分类存储,数据文件融合单元再根据文件的类型,将各个格式的具有相同类型条件的数据文件融合成特定的结构输出,从而实现了快速对成批量的不同属性、不同格式的混合数据按格式进行格式分类后再将同一属性不同格式的数据进行合并。
本发明在一较佳示例中可以进一步配置为:S2具体为:所述数据获取单元依次扫描所述原始数据存储单元中的待处理的多格式批量数据文件,并将其推送至所述数据文件分类单元。
通过采用上述技术方案,在将待处理的多格式批量数据文件录入至原始数据存储单元后,通过扫描原始数据存储单元对将待处理的多格式批量数据文件按照格式进行一一分类。
本发明在一较佳示例中可以进一步配置为:S4包括:
S41:分别对分类后的数据文件进行结构化处理,以期使各数据文件生成可结构化存储的中间文件;
S42:按照预先设定有标准模型,对结构化处理后的中间文件进行清洗、分类,存储至对应的类型库中;
S43:按照标准结构,从各类型库中抓取相同属性的数据文件整理融合后输出。
通过采用上述技术方案,结构化处理后的数据文件转化成中间文件,中间文件的特点为具有可扩展功能,相同类型的中间文件具有相同的标记,相同类型且不同格式的数据文件对应的中间文件高度相似,因此,便于后续不同格式相同类型的数据文件按照类型进行分类;数据内容规则模块预先设定有多种类型标准模型,并分配有对应的类型库,因此,将中间文件一一与各标准模型进行比对,能够实现匹配的中间文件放置对应的类型库中,从而实现了了数据文件按照类型分类;最后,再按照预设的标准结构从各类型库中抓取相同属性的数据文件整理融合后输出,从而实现了快速对成批量的不同属性、不同格式的混合数据按格式进行格式分类后再将同一属性不同格式的数据进行合并。
本发明在一较佳示例中可以进一步配置为:S4还包括S44:将与标准模型不匹配的不合规数据剔除至不合规数据文件库,不合规数据文件库中的数据通过人工归类。
通过采用上述技术方案,将与标准模型不匹配的不合规数据再通过人工检查一遍,从而放置数据文件的丢失、遗漏,保证最后输出的数据的准确性。
综上所述,本发明包括以下至少一种有益技术效果:
1. 通过数据文件分类单元根据数据文件的格式后缀对原始数据存储单元中存储的带数据属性标记的待处理的多格式批量数据文件按照格式进行分类存储,然后数据文件融合单元再根据文件的类型,将各个格式的具有相同类型条件的数据文件融合成特定的结构输出,从而实现了快速对成批量的不同属性、不同格式的混合数据按格式进行格式分类后再将同一属性不同格式的数据进行合并;
2. 通过数据文件融合单元将待处理的多格式批量数据文件转化成中间文件,中间文件的特点为具有可扩展功能,相同类型的中间文件具有相同的标记,相同类型且不同格式的数据文件对应的中间文件高度相似,因此,便于后续不同格式相同类型的数据文件按照类型进行分类。
附图说明
图1是本发明实施例1提供的多格式混合数据的分类、拼接系统的结构示意图。
图2是本发明实施例2提供的多格式混合数据的分类、拼接方法的流程图。
图3是本发明实施例3提供的多格式混合数据的分类、拼接系统的结构示意图。
图4是本发明实施例4提供的多格式混合数据的分类、拼接方法的流程图。
图5是本发明实施例5提供的多格式混合数据的分类、拼接系统的结构示意图。
图6是本发明实施例6提供的多格式混合数据的分类、拼接系统的结构示意图。
图中,1、原始数据存储单元;101、子存储单元;2、数据文件分类单元;3、数据文件融合单元;4、数据输出单元;10、数据获取单元;31、数据结构化处理单元;32、数据内容规则模块;320、类型库;330、不合规数据文件库;34、数据分类记录单元;5、数据存储规则单元。
具体实施方式
以下结合附图对本发明作进一步详细说明。
实施例1:
参照图1,为本发明公开的一种多格式混合数据的分类、拼接系统,包括:
原始数据存储单元1,用于存储待处理的多格式批量数据文件,其中,数据文件按照数据属性给予特定的命名;
与原始数据存储单元1连接的数据获取单元10,用于从原始数据存储单元1获取待处理的多格式批量数据文件;
与数据获取单元10连接的数据文件分类单元2,用于接收数据获取单元10获取的待处理的多格式批量数据文件,并根据数据文件的格式后缀,对中待处理的多格式批量数据文件按格式进行分类;
若干子存储单元101,与数据文件分类单元2连接,按照格式分类分别存储分类后的数据文件;
数据文件融合单元3,与子存储单元101连接,根据数据文件的类型,融合经数据文件分类单元2分类后的具有相同类型条件的各格式数据文件,具体的,如图1所示,数据文件融合单元3包括:
数据结构化处理单元31,与子存储单元101连接,分别对分类后的数据文件进行结构化处理,以使各数据文件生成可结构化存储的中间文件;
数据内容规则模块32,与数据结构化处理单元31连接,预先设定有多种类型标准模型,并分配有对应的类型库320,按照类型标准模型对数据结构化处理单元31生成的各中间文件进行分类别存储,存储至对用的类型库320中;
如图1所示,本发明公开的一种多格式混合数据的分类、拼接系统还包括数据存储规则单元5和数据输出单元4,数据输出单元4与数据内容规则模块32连接,数据存储规则单元5与数据输出单元4连接,数据存储规则单元5预先设定有最终所需输出数据文件的标准结构,数据输出单元4根据数据存储规则单元5设定的最终所需输出数据文件的标准结构,从各类型库320中输出具有相同属性的数据文件。
实施例2:
本发明还披露了基于实施例1中公开的多格式混合数据的分类、拼接系统的多格式混合数据的分类、拼接方法, 如图2所示,其包括以下步骤:
S1:数据录入,将待处理的多格式批量数据文件按照特定的数据属性命名后存储至原始数据存储单元1;以报关行业为例,预先将报关数据文件按照数据属性(即对应货品)进行命名,然后存储至原始数据存储单元1中,这里的报关数据文件包括所有格式的数据文件,如Excel、PDF等,均混合放置一个文件夹(即原始数据存储单元1)中;
S2:获取数据,数据获取单元10依次扫描原始数据存储单元1中的待处理的多格式批量数据文件,从原始数据存储单元1获取待处理的多格式批量数据文件,并将其推送至数据文件分类单元2;
S3:格式分类,数据文件分类单元2根据数据文件的格式后缀(.xls、.pdf等)将待处理的多格式批量数据文件按格式进行分类,分别存储至不同的子存储单元101(即不同的文件夹),同一子存储单元101中存储相同格式的数据文件,从而实现了多格式混合数据的初步格式分类;
但是,此时每个子存储单元101中包含来自不同数据属性的数据文件,因此,当需要将某一属性的数据文件按照特定的结构输出时,则需要将来自不同的子存储单元101中的不同格式的且具有相同属性的数据文件进行融合,因此,进入以下融合步骤:
S4:数据融合:数据文件融合单元3将经过数据文件分类单元2格式分类后的数据分别进行解析,将需要的字段进行清洗、分类、整理融合成一份特定格式的数据,然后输出融合后的数据,具体的,包括:
S41:数据结构化处理单元31分别对分类后的数据文件进行结构化处理,以期使各数据文件生成可结构化存储的中间文件,在本发明此实施方式中,数据结构化处理单元31转成可扩展标记语言(XML)文件。
S42:按照业务要求,预先在数据内容规则模块32中设置存储若干所需的标准模型,同时为对应的标准模型设置对应的类型库320,比如,在本发明此实施方式中,在数据内容规则模块32中设置存储箱单、发票、合同、运单等标准模型,并为对应的标准模型设置对用的类型库320,然后按照预先设定的标准模型对结构化处理后的中间文件进行清洗、分类,将不与任何标准模型匹配的数据文件剔除,并将与标准模型匹配的数据文件存储至对应的类型库320中,因此,属于箱单的类型库320中包含符合箱单标准模型的所有格式的数据文件,即Excel、PDF等所有格式的符合箱单标准模型的数据均被融合存储至属于箱单的类型库320,属于发票的类型库320中包含符合发票标准模型的所有格式的数据文件,即Excel、PDF等所有格式的符合发票标准模型的数据均被融合存储至属于发票的类型库320,等等;
S43:按照业务要求,预先在数据存储规则单元5中设置存储最终所需输出数据文件的标准结构,数据输出单元4按照数据存储规则单元5中设置存储的最终所需输出数据文件的标准结构从各类型库320中抓取相同属性的数据文件整理融合后输出,比如,预先在数据存储规则单元5中设置的标准结构为具备A属性的货品的箱单、运单及合同,则数据输出单元4分别从箱单、运单及合同的类型库320中抓取具备A属性的数据文件,并按照标准结构输出,从而实现了多格式混合数据的分类再拼接。
实施例3:
本发明实施例3披露了另一种实施方式的多格式混合数据的分类、拼接系统,如图3所示,其结构与实施例1中基本相同,其不同之处在于:
数据文件融合单元3还包括不合规数据文件库330与数据内容规则模块32连接,不合规数据文件库330用于存储剔除的不合规数据文件。
实施例4:
本发明实施例4披露了基于实施例3公开的多格式混合数据的分类、拼接系统的多格式混合数据的分类、拼接方法,如图4所示,其步骤与实施例2中基本相同,其不同之处在于还包括S44:将与S42中标准模型不匹配的不合规数据剔除至不合规数据文件库330,不合规数据文件库330中的数据通过人工筛查、归类。
实施例5、实施例6:
本发明实施例5、实施例6披露了第三种、第四种实施方式的多格式混合数据的分类、拼接系统,如图5、图6所示,其结构与实施例1、实施例3中基本相同,其不同之处在于:
数据文件融合单元3还包括数据分类记录单元34与数据内容规则模块32连接,数据分类记录单元34用于对数据内容规则模块32生成的类型库320进行记录。
本具体实施方式的实施例均为本发明的较佳实施例,并非依此限制本发明的保护范围,故:凡依本发明的结构、形状、原理所做的等效变化,均应涵盖于本发明的保护范围之内。

Claims (8)

1.多格式混合数据的分类、拼接系统,其特征在于,包括:
原始数据存储单元(1),用于存储待处理的多格式批量数据文件,其中所述数据文件按照数据属性命名;
数据文件分类单元(2),根据所述数据文件的格式后缀,对原始数据存储单元(1)中待处理的多格式批量数据文件按格式进行分类;
数据文件融合单元(3),根据所述数据文件的类型,融合经数据文件分类单元(2)分类后的具有相同类型条件的各格式数据文件;包括:数据结构化处理单元(31),分别对分类后的数据文件进行结构化处理,以期使各数据文件生成可结构化存储的中间文件;数据内容规则模块(32),预先设定有多种类型标准模型,并分配有对应的类型库(320),按照类型标准模型对数据结构化处理单元(31)生成的各中间文件进行分类别存储;
数据输出单元(4),根据所述数据文件的属性,从数据文件融合单元(3)融合后的数据文件中输出具有相同属性的数据文件。
2.根据权利要求1所述的多格式混合数据的分类、拼接系统,其特征在于,还包括数据获取单元(10),所述数据获取单元(10)位于所述原始数据存储单元(1)与所述数据文件分类单元(2)之间,用于从所述原始数据存储单元(1)获取待处理的多格式批量数据文件,并发送至所述数据文件分类单元(2)。
3.根据权利要求1所述的多格式混合数据的分类、拼接系统,其特征在于,所述数据文件融合单元(3)还包括不合规数据文件库(330),所述不合规数据文件库(330)用于存储剔除的不合规数据文件。
4.根据权利要求1所述的多格式混合数据的分类、拼接系统,其特征在于,所述数据文件融合单元(3)还包括数据分类记录单元(34)与所述数据内容规则模块(32)连接,所述数据分类记录单元(34)用于对所述数据内容规则模块(32)生成的类型库(320)进行记录。
5.根据权利要求1所述的多格式混合数据的分类、拼接系统,其特征在于,还包括数据存储规则单元(5),所述数据存储规则单元(5)与所述数据输出单元(4)连接,预先设定有最终所需输出数据文件的标准结构。
6.多格式混合数据的分类、拼接方法,其特征在于,包括以下步骤:
S1:数据录入,将待处理的多格式批量数据文件按照特定的数据属性命名后存储至原始数据存储单元(1);
S2:获取数据,从原始数据存储单元(1)获取待处理的多格式批量数据文件;
S3:格式分类,根据所述数据文件的格式后缀将待处理的多格式批量数据文件按格式进行分类;
S4:数据融合:将经过格式分类后的数据进行解析,将需要的字段进行清洗、分类、整理融合成一份特定格式的数据,然后输出融合后的数据,S4包括:
S41:分别对分类后的数据文件进行结构化处理,以期使各数据文件生成可结构化存储的中间文件;
S42:按照预先设定有标准模型,对结构化处理后的中间文件进行清洗、分类,存储至对应的类型库(320)中;
S43:按照标准结构,从各类型库(320)中抓取相同属性的数据文件整理融合后输出。
7.根据权利要求6所述的多格式混合数据的分类、拼接方法,其特征在于,S2具体为:所述数据获取单元(10)依次扫描所述原始数据存储单元(1)中的待处理的多格式批量数据文件,并将其推送至所述数据文件分类单元(2)。
8.根据权利要求6所述的多格式混合数据的分类、拼接方法,其特征在于,S4还包括S44:将与标准模型不匹配的不合规数据剔除至不合规数据文件库(330),不合规数据文件库(330)中的数据通过人工归类。
CN201911319257.2A 2019-12-19 2019-12-19 多格式混合数据的分类、拼接系统及方法 Active CN111143297B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911319257.2A CN111143297B (zh) 2019-12-19 2019-12-19 多格式混合数据的分类、拼接系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911319257.2A CN111143297B (zh) 2019-12-19 2019-12-19 多格式混合数据的分类、拼接系统及方法

Publications (2)

Publication Number Publication Date
CN111143297A CN111143297A (zh) 2020-05-12
CN111143297B true CN111143297B (zh) 2023-05-19

Family

ID=70518977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911319257.2A Active CN111143297B (zh) 2019-12-19 2019-12-19 多格式混合数据的分类、拼接系统及方法

Country Status (1)

Country Link
CN (1) CN111143297B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765173A (zh) * 2021-01-20 2021-05-07 四川湖山电器股份有限公司 一种适用于上位机的数据存储方法、系统及加载方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107526786A (zh) * 2017-08-01 2017-12-29 江苏速度信息科技股份有限公司 基于多源数据的地名地址数据整合的方法和系统
CN108427697A (zh) * 2017-08-12 2018-08-21 中民筑友科技投资有限公司 基于bim的装配式建筑数据导出方法及装置
CN109446296A (zh) * 2018-09-10 2019-03-08 上海勋立信息科技有限公司 一种海量非结构化数据处理方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7213027B1 (en) * 2000-03-21 2007-05-01 Aol Llc System and method for the transformation and canonicalization of semantically structured data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107526786A (zh) * 2017-08-01 2017-12-29 江苏速度信息科技股份有限公司 基于多源数据的地名地址数据整合的方法和系统
CN108427697A (zh) * 2017-08-12 2018-08-21 中民筑友科技投资有限公司 基于bim的装配式建筑数据导出方法及装置
CN109446296A (zh) * 2018-09-10 2019-03-08 上海勋立信息科技有限公司 一种海量非结构化数据处理方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
任国彪 ; 刘海军 ; .两类数据文件格式的转换.河南科学.2007,(01),全文. *
尹晓慧 ; .基于GeoDatabase的多源海图数据融合研究.北京测绘.2010,(04),全文. *

Also Published As

Publication number Publication date
CN111143297A (zh) 2020-05-12

Similar Documents

Publication Publication Date Title
US10546206B2 (en) Methods for mobile image capture of vehicle identification numbers in a non-document
JP4107543B2 (ja) 特許分析用データ加工および特許マップ自動生成方法とこれのためのプログラムを貯蔵するための記録媒体
US11455784B2 (en) System and method for classifying images of an evidence
JP4904878B2 (ja) システム開発支援プログラム、システム開発支援装置およびシステム開発支援方法
WO2023029353A1 (zh) 基于多模态混合模型的业务数据处理方法及装置
CN105243117A (zh) 一种数据处理系统和方法
CN114202755A (zh) 基于ocr和nlp技术的交易背景真实性审核方法和系统
CN111143297B (zh) 多格式混合数据的分类、拼接系统及方法
CN108170697B (zh) 一种国际贸易文件处理方法、系统以及一种服务器
CN112800949A (zh) 基于人工智能的纸质档案的数字化处理方法、系统及设备
CN116127105B (zh) 一种大数据平台的数据汇集方法及装置
CN112766904A (zh) 政务审批辅助管理方法和系统
CN116701506A (zh) 融合非结构化数据的需求计划合规性检验方法
CN111951081A (zh) 一种让每个材料都附上信息属性用数据构建场景的系统
CN116881512A (zh) 一种跨系统元数据血缘自动解析方法
CN111652272B (zh) 图像处理方法及装置、计算机设备、存储介质
CN113642291A (zh) 上市公司报告的逻辑结构树构建方法、系统、存储介质及终端
CN111582799B (zh) 一种物品画像的构建方法及装置
CN105808783B (zh) 一种不同域名格式的大文件数据差异性分析方法
CN111460786A (zh) 一种传统文档结构分析的技术方法
EP3093807A1 (en) Information processing apparatus, information processing method, and information processing program
JP2003316802A (ja) イメージ管理システム、イメージ管理方法及びイメージ管理プログラム
RU2795368C1 (ru) Интерфейс информационного взаимодействия системы поддержки принятия решений с информационно-аналитическим фондом
CN115640952B (zh) 一种数据导入上传的方法及系统
Kwok et al. A web services integration to manage invoice identification, metadata extraction, storage and retrieval in a multi-tenancy SaaS application

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant