CN107844464A - 基于数据插入的文件生成系统及方法 - Google Patents

基于数据插入的文件生成系统及方法 Download PDF

Info

Publication number
CN107844464A
CN107844464A CN201711092475.8A CN201711092475A CN107844464A CN 107844464 A CN107844464 A CN 107844464A CN 201711092475 A CN201711092475 A CN 201711092475A CN 107844464 A CN107844464 A CN 107844464A
Authority
CN
China
Prior art keywords
data
file
generated
read
intermediate data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711092475.8A
Other languages
English (en)
Inventor
吴宇
代丹
何斌
姚彩云
黄瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Mountain Hazards and Environment IMHE of CAS
Original Assignee
Institute of Mountain Hazards and Environment IMHE of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Mountain Hazards and Environment IMHE of CAS filed Critical Institute of Mountain Hazards and Environment IMHE of CAS
Priority to CN201711092475.8A priority Critical patent/CN107844464A/zh
Publication of CN107844464A publication Critical patent/CN107844464A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于数据插入的文件生成系统及方法,本发明数据读取模块、数据合成模块、刷新控制模块和文件输出模块。它通过数据读取模块把满足要求的数据(或图像)抽取出来,暂存到数据库中,然后通过字符转化来统一数据格式,之后插入到待生成文件模版中,最后进行指定格式的文件输出。

Description

基于数据插入的文件生成系统及方法
技术领域
本发明涉及一种基于数据插入的文件生成系统及方法。
背景技术
由于办公自动化的迅速发展,电子文档已经得到了广泛的使用,它即能节省大量的纸张又能大幅度的提高办公效率,提升文件流转效率。对于文职和财务人员来说,每天处理大量的电子文档已经变为常态,而对电子文档大部分都是进行数据插入和合并操作。他们需要将不同的数据(或图像)插入到文档中,进行合并、汇总最后形成文档保存。
目前基于这种方式的文档合成方法有很多种,其中当前应用最广泛、最普遍的是使用Excel来进行数据的插入和合并。其主要方法是通过Excel自带的函数,来对工作表单进行累加、删除、合并最后实现文件生成。
对于大规模数据的处理,在开始之前往往需要将待数据进行格式化处理,对其数据格式进行设置,比如:
1、数据的类型,字符型还是数字型,或者是混合型
2、数值的长度规范,小数点后的位数,是否进行四舍五入
3、内容的大写、小写状态、
4、索引查询的条件
在数据插入、合并过程中,随着数据文件的不断导入,如果出现错误造成中断,将会对输出文件造成影响,往往会出现数据插入过少、数据重复计算等问题,从而影响文件生成速度和工作效率。
另外,由于数据格式的特性,大部分插入的数据都不会是同一种数据类型,而对于不同的类型的数据,插入到文件后可能会导致乱码出现,从而影响到输出文件的准确性。
随着中间数据体量的增大,一般的简单Excel插入合并已不能满足要求,因此需要开展其他方式的数据插入方法设计。传统的借助于Excel进行数据插入合成的技术方案效果尚可,但仅能满足小规模数据的处理,但面对数据体量庞大,类型复杂的样本就显得比较繁琐,在处理过程中可能会遇到各种问题,从而影响工作效率。传统的技术方案采用的是Excel软件为工具,而要对Excel自带的函数进行修改,改造过程比较复杂,不适用于普通的文职工作人员。
鉴于上述的缺陷,本设计人积极加以研究创新,以期创设一种圆形钢筋构件加工设备,使其更具有产业上的利用价值。
发明内容
为解决上述技术问题,本发明的目的是提供一种能够对大数据进行处理,用户可操作性高,使用方便,简单易用的基于数据插入的文件生成系统及方法。
本发明基于数据插入的文件生成系统,包括:
数据读取模块,用于根据待生成文件从样本中读取与待生成文件有关的中间数据,将所述中间数据按照字段实时存入数据库;
数据合成模块,用于在预置的文件模版中定位数据库中的字段,将中间数据按照数据库中对应的字段逐次写入所述文件模版中的指定位置,写入完成后生成一个生成文件,对生成文件进行存储;
刷新控制模块,用于控制数据合成模块中中间数据的插入次数和方法以及用于控制文件模板的生成次数和方法;
文件输出模块,用于输出文件的格式转变,若所述生成文件格式与所需的文件格式相同则直接输出;若所述生成文件格式与所需文件格式不同,则把所述生成文件按照所需的格式进行格式转换后再进行输出。
进一步地,数据读取模块根据待生成的文件从单个文件中读取中间数据或从多个文件中读取中间数据。
进一步地,所述数据读取模块运行不同的读取算法从样本中读取与待生成文件有关的中间数据,每种算法至少识别一种数据类型的数据;
所述数据读取模块包括中间数据存储单元,所述中间数据存储单元用来将每种读取算法读取的与待生成文件有关的中间数据转化为统一的数据结构存储到数据库中,以供数据合成模块使用。
进一步地,所述刷新控制模块中的文件模板包括报表类模版或者文字类模版,与所述刷新控制模块所处理的业务有关,根据业务类型自定义为不同种类的文件模版。
本发明基于数据插入的文件生成方法,包括:
根据待生成文件从样本中读取与待生成文件有关的中间数据,将所述中间数据按照字段实时存入数据库;
在预置的文件模版中定位数据库中的字段,将中间数据按照数据库中对应的字段逐次写入所述文件模版中的指定位置,写入完成后生成一个生成文件,对生成文件进行存储;
输出文件的格式转变,若所述生成文件格式与所需的文件格式相同则直接输出;若所述生成文件格式与所需文件格式不同,则把所述生成文件按照所需的格式进行格式转换后再进行输出。
进一步地,根据待生成文件从单个文件中读取中间数据或从多个文件中读取中间数据。
进一步地,基于不同的读取算法从样本中读取与待生成文件有关的数据,每种算法至少识别一种数据类型的数据;
将每种读取算法读取的与待生成文件有关的中间数据转化为统一的数据结构存储到数据库中。
进一步地,文件模板包括报表类模版或者文字类模版,与所述刷新控制模块所处理的业务有关,根据业务类型自定义为不同种类的文件模版。
借由上述方案,本发明基于数据插入的文件生成系统及方法至少具有以下优点:
(1)具备不同类型样本的处理能力(2)不会因不同样本(包括图像)影响到插入和合成结果,(3)同时还可以自定义输出文件的类型。
(4)能自定义文件插入模版,(5)可按照不同的要求自定义文件生成的款式和文件格式,比如生成word文件或pdf文件。
批注A3优点在于:
1、不同类型样本的处理能力:使用者能根据自身业务,处理多种类型的数据,比如涉及公司人事的人员信息,工资信息等;涉及工程项目的材料采购数据、耗材数据;还涉及不同的文档类型,比如word文档、excel文档等等。
2、不会因为不同的样本影响插入和合成结果:由于本方法在数据读取模块中的前置处理过程,按照先读数再插入的流程依次进行操作,整个插入过程和样本文件无关,这样就不会因样本的种类不同而影响插入和生成结果。
3、自定义输出文件类型,本方法基于文件输出模块,在数据插入到模版再生成文件后,会根据用户需求转换数据类型输出。对于输出类型的转换仅限于文本数据处理,基于现有技术分列复制方法。
4、能自定义文件插入模版:用于可以自定义插入模版,按照业务需要自行修改、编辑和删除对应字段。由于数据插入位置是按照数据库中对应字段来控制的,用户只需要在插入位置标识相应字段,就可以实现自定义文件模版的优点。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
附图说明
图1是本发明基于数据插入的文件生成系统的框图;
图2是本发明基于数据插入的文件生成方法的流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例1
本实施例本发明基于数据插入的文件生成系统,包括:
数据读取模块,用于数据插入的前置处理过程,从样本中采集数据,并按照字段实时存入数据库。
数据合成模块,用于数据的写入和文件的生成,首先在预置的文件模版中定位数据库中的字段,再将数据按照数据库中对应的字段逐次写入模版中的指定位置,写入完成后生成为一个新的文件,存储到缓存区域。
刷新控制模块,用于控制上述步骤中数据与文件模版插入和生成的次数和方式。
文件输出模块,用于输出文件的格式转变,如果生成的文件格式与所需的文件格式相同则直接输出;如果生成文件格式与所需文件格式不同,则把生成文件按照所需的格式进行转换后再进行输出。
本实施例中,数据读取模块根据待生成的文件从单个文件中读取中间数据或从多个文件中读取中间数据。所述数据读取模块运行不同的读取算法从样本中读取与待生成文件有关的中间数据,每种算法至少识别一种数据类型的数据;
所述数据读取模块包括中间数据存储单元,所述中间数据存储单元用来将每种读取算法读取的与待生成文件有关的中间数据转化为统一的数据结构存储到数据库中,以供数据合成模块使用。所述刷新控制模块中的文件模板包括报表类模版或者文字类模版,与所述刷新控制模块所处理的业务有关,根据业务类型自定义为不同种类的文件模版。
图1是根据本发明示例的文件生成系统的结构示意图。该系统主要包括数据读取模块10、数据合成模块11、刷新控制模块12和文件输出模块13。数据读取模块10从样本中读取与待生成文件有关的数据,并存入到数据库中做为中间数据。根据待生成的文件,数据读取模块10可以仅从单个文件读取数据,也可以从多个文件读取而且这些文件的类型可以不同。数据合成模块11处理存放在数据库中的中间数据,这些数据在这里进行格式转换。例如,数据合成模块11基于预设算法处理中间数据已获得符合最终生成文件所需的内容。预设算法由操作者预先写入到配置中,数据组合模块11根据预设算法可知待生成文件所需要的数据类型,由此依据进行中间数据的处理。控制刷新模块12从数据库中获取所需要的文件模版信息,并将其在与数据组合模块11中所获得的以转换数据相结合,最后在数据输出模块13中生成制定格式的文件,然后把文件输出到指定路径。
根据本发明的示例,数据读取模块10含有不同的读取算法,每种算法至少识别一种数据类型的数据。例如,在数据库中读取数据的算法、在Word文件中读取数据的算法以及在以txt文本文件中读取的算法。另外数据读取模块10还包括中间数据存储单元,该单元主要用来将每种算法读取的数据转化能标准统一的数据结构存储到数据库中,以供数据合成模块11使用。不同的读写算法读取的数据类型可能不尽相同,且不一定可由数据合成模块11所识别,所以设置中间数据存储单元,由将其读取的数据转化成可由数据组合模块11识别的类型再统一存储。
刷新控制模块12中的生成模版主要为报表类模版或者文字类模版,且根据其所处理的业务有关,能根据业务的自定义为不同种类的模版。在此情况下,刷新控制模块12从数据库中获取所待中间数据与其模板进行组合最后通过文件输出模块13生成制定格式的文件。例如,doc格式的Word文件或者pdf格式的Adobe Reader文件。
实施例2
本实施例基于数据插入的文件生成方法,包括:
根据待生成文件从样本中读取与待生成文件有关的中间数据,将所述中间数据按照字段实时存入数据库;
在预置的文件模版中定位数据库中的字段,将中间数据按照数据库中对应的字段逐次写入所述文件模版中的指定位置,写入完成后生成一个生成文件,对生成文件进行存储;
输出文件的格式转变,若所述生成文件格式与所需的文件格式相同则直接输出;若所述生成文件格式与所需文件格式不同,则把所述生成文件按照所需的格式进行格式转换后再进行输出。
本实施例中,根据待生成文件从单个文件中读取中间数据或从多个文件中读取中间数据。基于不同的读取算法从样本中读取与待生成文件有关的数据,每种算法至少识别一种数据类型的数据;将每种读取算法读取的与待生成文件有关的中间数据转化为统一的数据结构存储到数据库中。文件模板包括报表类模版或者文字类模版,与所述刷新控制模块所处理的业务有关,根据业务类型自定义为不同种类的文件模版。
对于以上所描述的数据插入的文件生成方法不仅可以由软件实现,也可以由硬件实现,还可通过软件和硬件两者相结合来实现。所实现的算法不仅可以加载在服务器端,也可以加载到台式电脑PC端,具有一定的通用性。本发明与常规的文件生成方式相比,根据其数据读取模块将样本的读取与处理、与文件模版及刷新控制逻辑三者分开,从而提高了该算法的可用性和稳定性,同时该算法的数据输入、输出还能根据自身业务的不同进行自定义设计,相比之前的传统的方法,大大提高了可操作性。
1、本发明所述的文件生成方法,将样本读取与数据类型的转化、处理生成文件模版与文件输出分开管理,提高了开发的便利性,提升了数据插入与生成效率,有利于批量大规模数据的插入生成工作,稳定性好。
2、支持的数据多样化,不受单一的数据格式所影响,能从可以多格式、多类型的样本中读取数据资源,再统一转化为所需要的数据样式插入到文件模版。
3、操作简单,满足不同应用水平的操作人员,可以按需设计文件生成模版和输出格式,使用方便不需要专业的技术培训。
4、这种基于数据插入的文件生成算法提供一种快速的文件生成方式,其集数据(图像)读取、数据组合、刷新控制和文件合成、输出等几个模块构成;它能快速的合成数据(或图片)并按照提供的模版,快速生成按照要求的文档。这种算法相比于常规方法具有兼容性和扩展性强,处理速度快捷,使用方便等优点。
以上所述仅是本发明的优选实施方式,并不用于限制本发明,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (8)

1.一种基于数据插入的文件生成系统,其特征在于,包括:
数据读取模块,用于根据待生成文件从样本中读取与待生成文件有关的中间数据,将所述中间数据按照字段实时存入数据库;
数据合成模块,用于在预置的文件模版中定位数据库中的字段,将中间数据按照数据库中对应的字段逐次写入所述文件模版中的指定位置,写入完成后生成一个生成文件,对生成文件进行存储;
刷新控制模块,用于控制数据合成模块中中间数据的插入次数和方法以及用于控制文件模板的生成次数和方法;
文件输出模块,用于输出文件的格式转变,若所述生成文件格式与所需的文件格式相同则直接输出;若所述生成文件格式与所需文件格式不同,则把所述生成文件按照所需的格式进行格式转换后再进行输出。
2.根据权利要求1所述的基于数据插入的文件生成系统,其特征在于,数据读取模块根据待生成的文件从单个文件中读取中间数据或从多个文件中读取中间数据。
3.根据权利要求2所述的基于数据插入的文件生成系统,其特征在于,所述数据读取模块运行不同的读取算法从样本中读取与待生成文件有关的中间数据,每种算法至少识别一种数据类型的数据;
所述数据读取模块包括中间数据存储单元,所述中间数据存储单元用来将每种读取算法读取的与待生成文件有关的中间数据转化为统一的数据结构存储到数据库中,以供数据合成模块使用。
4.根据权利要求3所述的基于数据插入的文件生成系统,其特征在于,所述刷新控制模块中的文件模板包括报表类模版或者文字类模版,与所述刷新控制模块所处理的业务有关,根据业务类型自定义为不同种类的文件模版。
5.一种基于数据插入的文件生成方法,其特征在于,包括:
根据待生成文件从样本中读取与待生成文件有关的中间数据,将所述中间数据按照字段实时存入数据库;
在预置的文件模版中定位数据库中的字段,将中间数据按照数据库中对应的字段逐次写入所述文件模版中的指定位置,写入完成后生成一个生成文件,对生成文件进行存储;
输出文件的格式转变,若所述生成文件格式与所需的文件格式相同则直接输出;若所述生成文件格式与所需文件格式不同,则把所述生成文件按照所需的格式进行格式转换后再进行输出。
6.根据权利要求5所述的基于数据插入的文件生成方法,其特征在于,根据待生成文件从单个文件中读取中间数据或从多个文件中读取中间数据。
7.根据权利要求6所述的基于数据插入的文件生成方法,其特征在于,基于不同的读取算法从样本中读取与待生成文件有关的数据,每种算法至少识别一种数据类型的数据;
将每种读取算法读取的与待生成文件有关的中间数据转化为统一的数据结构存储到数据库中。
8.根据权利要求7所述的基于数据插入的文件生成方法,其特征在于,文件模板包括报表类模版或者文字类模版,与所述刷新控制模块所处理的业务有关,根据业务类型自定义为不同种类的文件模版。
CN201711092475.8A 2017-11-08 2017-11-08 基于数据插入的文件生成系统及方法 Pending CN107844464A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711092475.8A CN107844464A (zh) 2017-11-08 2017-11-08 基于数据插入的文件生成系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711092475.8A CN107844464A (zh) 2017-11-08 2017-11-08 基于数据插入的文件生成系统及方法

Publications (1)

Publication Number Publication Date
CN107844464A true CN107844464A (zh) 2018-03-27

Family

ID=61682486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711092475.8A Pending CN107844464A (zh) 2017-11-08 2017-11-08 基于数据插入的文件生成系统及方法

Country Status (1)

Country Link
CN (1) CN107844464A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274769A (zh) * 2020-01-09 2020-06-12 山东汇贸电子口岸有限公司 一种跨文件格式自动生成证照文件的方法及模型
CN112232038A (zh) * 2020-09-22 2021-01-15 苏州艾特律宝智能科技有限公司 文档输出方法、系统、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101202646A (zh) * 2006-12-13 2008-06-18 中兴通讯股份有限公司 动态生成报告装置
CN101650710A (zh) * 2009-08-03 2010-02-17 金蝶软件(中国)有限公司 一种在线软件服务系统及其报表生成方法和装置
US8055997B2 (en) * 2006-06-26 2011-11-08 Lexmark International Technology, S.A. System and method for implementing dynamic forms
CN104750714A (zh) * 2013-12-30 2015-07-01 中国银联股份有限公司 文件生成系统及方法
CN106407172A (zh) * 2016-11-21 2017-02-15 成都鼎桥通信技术有限公司 一种基于xml的报表生成方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8055997B2 (en) * 2006-06-26 2011-11-08 Lexmark International Technology, S.A. System and method for implementing dynamic forms
CN101202646A (zh) * 2006-12-13 2008-06-18 中兴通讯股份有限公司 动态生成报告装置
CN101650710A (zh) * 2009-08-03 2010-02-17 金蝶软件(中国)有限公司 一种在线软件服务系统及其报表生成方法和装置
CN104750714A (zh) * 2013-12-30 2015-07-01 中国银联股份有限公司 文件生成系统及方法
CN106407172A (zh) * 2016-11-21 2017-02-15 成都鼎桥通信技术有限公司 一种基于xml的报表生成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274769A (zh) * 2020-01-09 2020-06-12 山东汇贸电子口岸有限公司 一种跨文件格式自动生成证照文件的方法及模型
CN112232038A (zh) * 2020-09-22 2021-01-15 苏州艾特律宝智能科技有限公司 文档输出方法、系统、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
JP6857689B2 (ja) データ検索装置、プログラム、及び記録媒体
Bazan et al. A new version of rough set exploration system
Karnitis et al. Migration of relational database to document-oriented database: structure denormalization and data transformation
US8037035B2 (en) Apparatus for searching and managing compressed files
US8418053B2 (en) Division program, combination program and information processing method
Bartram et al. Untidy data: The unreasonable effectiveness of tables
CN110738037B (zh) 用于自动生成电子表格的方法、装置、设备及存储介质
JP2624753B2 (ja) 上位仕様書作成方法
Kall et al. SLP-IOR: An interactive model management system for stochastic linear programs
Mavrov Software for InterCriteria Analysis: Implementation of the main algorithm
JP2014149564A (ja) 情報処理装置、情報処理方法及びプログラム
JPH05197734A (ja) データ処理システム
CN107844464A (zh) 基于数据插入的文件生成系统及方法
JP7339628B2 (ja) エクセルツールを用いたオンラインレポート作成システム
KR20160117965A (ko) NoSQL 모델 생성 방법 및 그 장치
CA2936485C (en) Optimized data condenser and method
CN101882147B (zh) 一种曲线数据存储装置及其存储方法
CN103150632A (zh) 基于水利云平台的防汛防旱简报生成系统的构建方法
JP2006244283A (ja) データベース管理装置およびデータベース管理方法
Badgujar et al. A comparative study: Business intelligence tools
CN113569543B (zh) 一种核电工程自动报告生成技术的实现方法
JP5388881B2 (ja) 帳票入出力装置
US20040205657A1 (en) Method and system for linking project information
US11861735B1 (en) Method for generating a balance sheet that includes operating materials and supplies costs
JP2006221616A (ja) 情報処理装置ならびにファイルデータマージ方法およびファイル名称付与方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180327

RJ01 Rejection of invention patent application after publication