CN114372445B - 文档生成方法、装置、电子设备及介质 - Google Patents

文档生成方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN114372445B
CN114372445B CN202210274680.0A CN202210274680A CN114372445B CN 114372445 B CN114372445 B CN 114372445B CN 202210274680 A CN202210274680 A CN 202210274680A CN 114372445 B CN114372445 B CN 114372445B
Authority
CN
China
Prior art keywords
data
processed
chart
generating
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210274680.0A
Other languages
English (en)
Other versions
CN114372445A (zh
Inventor
常月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qianxin Technology Group Co Ltd
Original Assignee
Qianxin Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qianxin Technology Group Co Ltd filed Critical Qianxin Technology Group Co Ltd
Priority to CN202210274680.0A priority Critical patent/CN114372445B/zh
Publication of CN114372445A publication Critical patent/CN114372445A/zh
Application granted granted Critical
Publication of CN114372445B publication Critical patent/CN114372445B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Abstract

本发明提供一种文档生成方法、装置、电子设备及介质,包括:获取包含待处理数据的数据集合;判断数据集合中的各个待处理数据是否用于生成图表;在第一待处理数据用于生成图表的情况下,利用预先设定的图表生成方法对第一待处理数据进行处理,得到第一待处理数据的属性名与处理后数据,所述处理后数据为预设数据类型的数据;基于数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档。本发明具有更高的灵活度,使得文档生成过程简化,大大节省了生成时间,提升了效率。

Description

文档生成方法、装置、电子设备及介质
技术领域
本发明涉及文本处理技术领域,尤其涉及一种文档生成方法、装置、电子设备及介质。
背景技术
随着信息化程度的不断提高,数据量的激增,传统的根据固定模板来手动生成Word文档的方式已经不能满足高效率工作的需求,这种传统的Word文档手动生成方法需要人工重复输入,从而造成耗时久、易错等问题。而Word文档自动生成方法则恰好能克服上述问题。
现有的Word文档自动生成技术手段包括Jacob、Apache POI、Java2Word、iText、JSP、XML等。其中,Jacob虽然功能强大,但是代码量大,设置样式繁琐,且需要windows平台支持,无法跨平台;而Apache POI针对excel的读写功能强大且操作简单,但是它只能够创建简单的Word,不能设置样式,功能较少;而Java2Word与Jacob一样,均需要windows平台支持;iText则不能直接生成或操作doc文档,只能生成rtf格式的文档,用Word打开可以打开rtf格式的文档;JSP能把当前页面导出简单的Word,不能设置样式,美观性差,无法操作Word;XML则需要提前设计好Word模板,把需要替换的地方用特殊标记标出来。
综上所述,现有的Word文档自动生成技术要么需要特定平台支持,要么样式少,整体应用起来不够灵活简便。
发明内容
本发明提供一种文档生成方法、装置、电子设备及介质,用以解决上述现有的Word文档自动生成方法中不够灵活简便的问题。
本发明提供一种文档生成方法,包括:
获取包含待处理数据的数据集合;
判断所述数据集合中的各个待处理数据是否用于生成图表;
在第一待处理数据用于生成图表的情况下,利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据,所述处理后数据为预设数据类型的数据;其中,所述图表生成方法对所述第一待处理数据进行处理包括对所述第一待处理数据进行属性名的获取,以及对所述第一待处理数据进行数据类型的转换,以得到预设数据类型的处理后数据;
基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档。
根据本发明提供的一种文档生成方法,方法还包括:
在第二待处理数据未用于生成图表的情况下,对所述第二待处理数据进行处理,得到所述第二待处理数据的属性名与处理后数据。
根据本发明提供的一种文档生成方法,所述判断所述数据集合中的各个待处理数据是否用于生成图表,包括:
判断所述数据集合中的各个待处理数据的数据类型是否为List链表类型;
在第三待处理数据的数据类型为非List链表类型的情况下,确定所述第三待处理数据为不用于生成图表的第二待处理数据;其中,所述第三待处理数据为所述数据集合中的任意一个待处理数据;
在第三待处理数据的数据类型为List链表类型的情况下,判断所述第三待处理数据是否用于生成图表;
根据判断结果确定所述第三待处理数据为用于生成图表的第一待处理数据,或为不用于生成图表的第二待处理数据。
根据本发明提供的一种文档生成方法,所述在第二待处理数据未用于生成图表的情况下,对所述第二待处理数据进行处理,得到所述第二待处理数据的属性名与处理后数据,包括:
在所述第二待处理数据未用于生成图表,且所述第二待处理数据的数据类型为List链表类型的情况下,获取所述第二待处理数据所对应List链表上的各个节点的属性名与处理后数据。
根据本发明提供的一种文档生成方法,所述基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档,包括:
基于所述数据集合中的各个待处理数据的属性名,在所述目标文档模板中查找与所述属性名相匹配的标签;
将所述标签的值替换为所匹配的待处理数据所对应的处理后数据,得到目标文档。
根据本发明提供的一种文档生成方法,方法还包括:
对Word模板引擎Poi-tl中的图表生成方法重新定义,得到所述预先设定的图表生成方法。
根据本发明提供的一种文档生成方法,所述预先设定的图表生成方法至少包括用于生成表格的第一图表生成方法、用于生成柱状图或折线图的第二图表生成方法以及、用于生成多模块柱状图的第三图表生成方法以及用于生成饼图或柱状折线图的第四图表生成方法;
相应地,所述利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据后,所述方法还包括:
根据所述第一待处理数据的属性名从所述第一图表生成方法、第二图表生成方法、以及第三图表生成方法以及第四图表生成方法中确定目标图表生成方法;
判断所述处理后数据是否为空;
在所述处理后数据不为空的情况下,基于所述处理后数据通过所述目标图表生成方法生成对应图表。
根据本发明提供的一种文档生成方法,在所述目标图表生成方法为第一图表生成方法的情况下,所述基于所述处理后数据通过所述目标图表生成方法生成对应图表,包括:
获取所述数据集合中以列形式呈现的处理后数据的中间层数据,将所述中间层数据以行形式呈现,得到行数据;其中,中间层数据为所述第一待处理数据在处理过程中的数据;
利用所述Word模板引擎Poi-tl中的图表生成方法对应的表格生成方法,并基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,将所述行数据填充到所述目标文档的表格中,生成对应图表。
根据本发明提供的一种文档生成方法,在所述目标图表生成方法为第二图表生成方法的情况下,所述基于所述处理后数据通过所述目标图表生成方法生成对应图表,包括:
从所述数据集合中的各个待处理数据所对应的处理后数据中获取系列数;其中,所述系列数为柱状图或折线图中系列名数量;
根据所述系列数遍历所述处理后数据,根据遍历顺序将每个所述处理后数据复赋值给用于生成柱状图或折线图的数据集合;
基于所述用于生成柱状图或折线图的数据集合在所述目标文档中生成柱状图或折线图。
根据本发明提供的一种文档生成方法,在所述目标图表生成方法为第三图表生成方法的情况下,所述基于所述处理后数据通过所述目标图表生成方法生成对应图表,包括:
根据所述数据集合中所有处理后数据对应的系列数与模块数;其中,所述系列数为多模块柱状图中系列名数量,所述模块数为多模块柱状图中模块名数量;
将所述模块数作为循环数对所述处理后数据进行循环,在所述目标文档中生成多模块柱状图。
本发明还提供一种文档生成装置,包括:
数据获取模块,用于获取包含待处理数据的数据集合;
图表数据判断模块,用于判断所述数据集合中的各个待处理数据是否用于生成图表;
图表数据处理模块,用于在第一待处理数据用于生成图表的情况下,利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据,处理后数据为预设数据类型的数据;其中,所述图表生成方法对所述第一待处理数据进行处理包括对所述第一待处理数据进行属性名的获取,以及对所述第一待处理数据进行数据类型的转换,以得到预设数据类型的处理后数据;
文档生成模块,用于基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如上述任一种文档生成方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一种文档生成方法。
本发明提供的文档生成方法、装置、电子设备及介质,通过对数据集合中所有用于生成图表的第一待处理数据进行包括数据类型转换的处理,从而获得所有第一待处理数据的属性名与处理后数据,并基于第一待处理数据的属性名与目标文档模板中的标签之间的匹配关系,将处理后数据填充至目标文档模板中标签对应的位置,从而形成目标文档。因此,在不需要特定平台支持的情况下,可以对所有用于生成图表的数据进行处理,从而支持不同类型的图表生成,具有更高的灵活度,并且,目标文档是根据第一待处理数据的属性名与目标文档模板中的标签之间的匹配关系,直接将所有处理后数据填充至目标文档模板中生成,而不是逐一将第一待处理数据插入目标文档模板中,从而使得文档生成过程简化,大大节省了生成时间,提升了效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的文档生成方法流程示意图;
图2为本发明实施例提供的文档生成方法实现的示意图;
图3为本发明实施例提供的第一图表生成方法实现的示意图;
图4为本发明实施例提供的第二图表生成方法实现的示意图;
图5为本发明实施例提供的第三图表生成方法实现的示意图;
图6为本发明实施例提供的第四图表生成方法实现的示意图;
图7为本发明实施例提供的柱状折线图模板的示意图;
图8为本发明实施例提供的目标文档中的柱状折线图示意图;
图9为本发明实施例提供的文档生成装置结构示意图;
图10为本发明实施例提供的一种电子设备的实体结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的基于Apache-POI的Word模板引擎Poi-tl中不同图表生成方法存在如下缺陷:
1)Poi-tl官网中生成柱状图的方法比较笼统,不管是普通柱状图还是多模块柱状图统称都是柱状图,都统一用一种柱状图生成方法生成,但其实普通柱状图与多模块柱状图的生成方法存在差别;
2)Poi-tl官网中特殊的图表没有给出具体实现方法;
3)Poi-tl官网针对表格的生成只关注行数据;
4)Poi-tl官方中实现单系列图和多系列图是两个方法,且多系列图生成需一行一行插入数据;
5)Poi-tl官方对所有的图表生成方法都关注具体实现方式。
本发明实施例提供一种文档生成方法来解决上述缺陷,下面结合附图进行具体说明:
图1为本发明实施例提供的文档生成方法流程示意图;
图2为本发明实施例提供的文档生成方法实现的示意图。
如图1以及图2所示,一种文档生成方法,包括:
步骤101,获取包含待处理数据的数据集合。
其中,待处理数据是用于生成Word文档的数据,例如Word文档中需要的文本、图片、表格等数据。
本实施例中,包含待处理数据的数据集合可以是对大量数据进行数据分析后形成,也可以直接从数据库中获取,本发明对数据的种类与获取方式不做限定。
步骤102,判断所述数据集合中的各个待处理数据是否用于生成图表。
具体地,通过判断各个待处理数据对应的属性名中是否具有表示图表的关键词来确定待处理数据是否用于生成图表,若待处理数据的属性名中有“图”、“表”等关键词,则说明该待处理数据用于生成图表;若是没有“图”、“表”等关键词,则默认该待处理数据用于生成文本。本实施例中,各个待处理数据对应的属性名通过Java的反射机制获得。
步骤103,在第一待处理数据用于生成图表的情况下,利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据;其中,所述图表生成方法对所述第一待处理数据进行属性名的获取,以及对所述第一待处理数据进行处理包括对所述第一待处理数据进行数据类型的转换。
具体地,若待处理数据用于生成图表,将该待处理数据作为第一待处理数据,并利用预先设定的图表生成方法对所述第一待处理数据的数据类型进行转换,得到预设数据类型的处理后数据,以及利用Java的反射机制获取第一待处理数据(即实体数据entity)对应的属性名和处理后数据value,其中,处理后数据为预设数据类型的数据。
本实施例中,第一待处理数据包括表格、饼图、柱状或折线图、多模块柱状图、柱状折线图。其中,表格的原始数据类型为TableRenderData,饼图的原始数据类型为ChartSingleSeriesRenderData,其他系列的图形对应的原始数据类型均为ChartMultiSeriesRenderData数据结构。其中,TableRenderData和ChartMultiSeriesRenderData均是一种特殊的数据结构,是poi-tl定义的数据结构。
相应地,不同类型的第一待处理数据其所对应的数据转换过程也不同,具体为:
1)表格:将传入的每一列数据,转换为行数据,RowRenderData接收每行的数据,再将每个RowRenderData数据赋值给List<RowRenderData>,得到表格的所有数据,List<RowRenderData>传给TableRenderData,有了TableRenderData即可生成表格。其中,RowRenderData与TableRenderData均为poi-tl内部定义的数据结构。
2)饼图:将饼图的系列名和各系列对应的数据传给ChartSingleSeriesRenderData,系列名类型为List<String>,各系列数据的数据类型为List<Number>。其中,ChartSingleSeriesRenderData为poi-tl内部定义的数据结构。
3)柱状或折线图:将传入的系列名和各系列对应的数据传给List<SeriesRenderData>,系类名类型为List<String>,数据的类型为List<Number>,然后将List<SeriesRenderData>赋值给ChartMultiSeriesRenderData。其中,SeriesRenderData为poi-tl内部定义的数据结构。
4)多模块柱状图:模块名类型为List<String>,系列名类型List<String>,各系列对应的数值类型为List<Number>,将模块名赋值给ChartMultiSeriesRenderData的categories属性,系列名与系列数据赋值给List<SeriesRenderData>,再将List<SeriesRenderData>赋值给ChartMultiSeriesRenderData。
5)柱状折线图:将折线系列和柱状系列的数据和名称赋值给ChartMultiSeriesRenderData。名称的类型为List<String>;数据类型为List<Number>。
上述转换过程中传入的数据都是List结构,list类型为String或者Number类型,转换过程就是将上述String或者Number类型转换为对应的图表类型。
步骤104,基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档。
其中,目标文档模板可以生成特定格式的Word文档,其为了使得文档数据与文档格式分离而产生的。目标文档模板中包含多个标签,每个标签根据目标文档中的特定格式要求所处的位置也不同,比如,在目标文档模板中文字部分对应的是文字标签,在图表部分对应的是图表标签。目标文档是结合了待处理数据与特定格式的文档所生成的文档,例如待处理数据为城市安全状况数据,特定格式的文档为用户选中的报告样式,则目标文档为基于城市安全状况数据与特定格式的城市安全报告。本实施例中目标文档为Word文档,且根据用户需求自定义其特定格式。
具体地,根据数据集合中的各个待处理数据的属性名与标签的匹配关系,将待处理数据对应的处理后数据填充至相关标签位置,从而形成适用于该数据集合的Word文档。
本发明实施例提供的文档生成方法,通过对数据集合中所有用于生成图表的第一待处理数据进行包括数据类型转换的处理,从而获得所有第一待处理数据的属性名与处理后数据,并基于第一待处理数据的属性名与目标文档模板中的标签之间的匹配关系,将处理后数据填充至目标文档模板中标签对应的位置,从而形成目标文档。因此,在不需要特定平台支持的情况下,可以对所有用于生成图表的数据进行处理,从而支持不同类型的图表生成,具有更高的灵活度,并且,目标文档是根据第一待处理数据的属性名与目标文档模板中的标签之间的匹配关系,直接将所有处理后数据填充至目标文档模板中生成,而不是逐一将第一待处理数据插入目标文档模板中,从而使得文档生成过程简化,大大节省了生成时间,提升了效率。
进一步地,方法还包括:
在第二待处理数据未用于生成图表的情况下,对所述第二待处理数据进行处理,得到所述第二待处理数据的属性名与处理后数据。
其中,第二待处理数据与上述第一待处理数据均为数据集合中任一待处理数据。
具体地,在步骤102中,待处理数据被判断为不是用于生成图表时,将待处理数据作为第二待处理数据,该第二待处理数据一般用于生成文本,对第二待处理数据直接进行属性名的获取,并将获取属性名后的第二待处理数据作为处理后数据,中间不涉及数据类型的转换。
本发明实施例提供的文档生成方法,能够支持文本等非图表数据的生成,并且也是基于第二待处理数据的属性名与目标文档模板中的标签之间的匹配关系,将所有文本等形式的非图表数据全部填充至目标文档模板中,不需要逐一将第二待处理数据对应的处理后数据插入,从而简化了文档生成过程,提升了效率。
进一步地,所述判断所述数据集合中的各个待处理数据是否用于生成图表,包括:
判断所述数据集合中的各个待处理数据的数据类型是否为List链表类型;
在第三待处理数据的数据类型为非List链表类型的情况下,确定所述第三待处理数据为不用于生成图表的第二待处理数据;其中,所述第三待处理数据为所述数据集合中的任意一个待处理数据;
在第三待处理数据的数据类型为List链表类型的情况下,判断所述第三待处理数据是否用于生成图表;
根据判断结果确定所述第三待处理数据为用于生成图表的第一待处理数据,或为不用于生成图表的第二待处理数据。
具体地,在判断所述数据集合中的各个待处理数据是否用于生成图表过程中,首先,判断所述数据集合中的各个待处理数据的数据类型是否为List链表类型,将经过判断后的待处理数据作为第三待处理数据,也即第三待处理数据为所述数据集合中的任意一个待处理数据。
其中,List链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。链表由一系列结点(链表中每一个元素称为结点)组成,结点可以在运行时动态生成。每个结点包括两个部分:一个是存储数据元素的数据域,另一个是存储下一个结点地址的指针域。List可以用来存对某一事物同属性的描述数据,比如通过List链表来存储全国排名gdp排名前十的数据时,可以一次存取,不用像一一对应的方式,通过预先为10条数据设置10个属性,进而一一将10条数据存储到相应位置。并且在需要将这10条数据填充到模板中时,只要在模板中设置对应的标签即可。
另外,用于生成图表的数据所对应的数据结构为List链表类型,但是数据类型为List链表类型的数据并非全都用于生成图表,还需要在数据类型为List链表类型的条件下,进一步判断数据所对应的属性名中是否有“图”、“表”等用于生成图表的关键词。
若第三待处理数据对应的判断结果为非List链表类型,则直接将第三待处理数据作为第二待处理数据,也即不用于生成图表的待处理数据;若第三待处理数据对应的判断结果为List链表类型,则进一步判断第三待处理数据是否用于生成图表,也即判断第三待处理数据对应的属性名中是否包含“图”、“表”等用于生成图表的关键词。
进一步地,在判断结果为第三待处理数据用于生成图表的情况下,将第三待处理数据作为第一待处理数据,并利用预先设定的图表生成方法对所述第一待处理数据进行处理;在判断结果为第三待处理数据不用于生成图表的情况下,将第三待处理数据作为第二待处理数据,针对第二待处理数据均直接进行简单处理,得到所述第二待处理数据的属性名与处理后数据,不需要进行数据类型的转换。
本发明实施例提供的文档生成方法,通过数据类型是否为List链表类型以及是否用于生成图表双重判断来准确出用于生成图表的待处理数据,进而便于后续对所有用于生成图表的待处理数据进行包括数据类型转换与属性名获取的处理,也便于针对所有不用于生成图表的待处理数据仅进行属性名获取的处理,从而在根据属性名与标签的匹配关系,将处理后数据填充至目标文档模板的过程中,简化了目标文档生成程序,并加快了目标文档的生成速度,无需将每一条待处理数据逐一填充至对应的标签所在位置中。
进一步地,所述在第二待处理数据未用于生成图表的情况下,对所述第二待处理数据进行处理,得到所述第二待处理数据的属性名与处理后数据,包括:
在所述第二待处理数据未用于生成图表,且所述第二待处理数据的数据类型为List链表类型的情况下,获取所述第二待处理数据所对应List链表上的各个节点的属性名与处理后数据。
具体地,针对未用于生成图表且数据类型为List链表类型的第二待处理数据,通过获取该第二待处理数据所对应List链表上的各个节点的属性名与处理后数据;继而根据各个节点的属性名与标签的匹配关系,将处理后数据填充至对应的标签所在位置。
本发明实施例提供的文档生成方法,针对数据类型为List链表类型且不用来生成图表的待处理数据,从其对应List链表上的各个节点的属性名来与标签匹配,提升了数据类型为List链表类型且不用来生成图表的待处理数据插入目标文档模板的准确性,保证目标文档内容的准确性,降低人工复查调整的成本。
进一步地,所述基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档,包括:
基于所述数据集合中的各个待处理数据的属性名,在所述目标文档模板中查找与所述属性名相匹配的标签;
将所述标签的值替换为所匹配的待处理数据所对应的处理后数据,得到目标文档。
其中,标签包括文本标签、表格标签、图像标签等等,根据属性名与不同标签之间的匹配关系,将处理后数据替换掉对应标签的值。下面通过举例的方式进行说明。
假设目标文档模板为:“2015年,A国有{{APopulation}}亿人口位居世界第一,B国有{{BPopulation}}亿人口,位居世界第三。”,则其中,APopulation与BPopulation均为文本标签。其对应的替换过程为:
public class populationEntity {
/**
* B国人口数
*/
private Long BPopulation;
/**
* A国人口数
*/
private Long APopulation;
/**
* 饼图数据
*/
private List<chartEntity> pieChart;
}
其中,populationEntity可以接收到数据通过反射机制拿到各个属性名对应的数据,属性名为BPopulation的数据传给文本标签{{BPopulation}},属性名为APopulation的数据传给文本标签{{APopulation}}。而List<chartEntity>pieChart,则表示该数据用来生成饼图(假设饼图的关键字为pie),此时需要调用饼图的生成方法,以此来生成饼图。
另外,在目标文档模板中表格标签的形式一般为{{#table}},将处理后数据填充至对应标签位置后,具体如下表所示:
表1 目标文档中的示意表
Figure 675941DEST_PATH_IMAGE001
本发明实施例提供的文档生成方法,通过在所述目标文档模板中查找与所述属性名相匹配的标签,从而将处理后数据填充至目标文档模板中,自动生成目标文档,节省人力。
进一步地,方法还包括:
对Word模板引擎Poi-tl中的图表生成重新定义,得到所述预先设定的图表生成方法。
本实施例中,目标文档为Word文档,其根据用户需求创建,且图表生成方法也是对Word模板引擎Poi-tl中的图表生成方法重新定义得到。具体的图表生成方法参见下文的用于生成表格的第一图表生成方法、用于生成柱状图或折线图的第二图表生成方法以及用于生成多模块柱状图的第三图表生成方法的描述。另外,针对第二待处理数据的处理则是直接基于Word模板引擎Poi-tl中文本生成方法完成。
进一步地,所述预先设定的图表生成方法至少包括用于生成表格的第一图表生成方法、用于生成柱状图或折线图的第二图表生成方法、以及用于生成多模块柱状图的第三图表生成方法以及用于生成饼图或柱状折线图的第四图表生成方法;
相应地,所述利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据后,所述方法还包括:
根据所述第一待处理数据的属性名从所述第一图表生成方法、第二图表生成方法以及、第三图表生成方法以及第四图表生成方法中确定目标图表生成方法;
判断所述处理后数据是否为空;
在所述处理后数据不为空的情况下,基于所述处理后数据通过所述目标图表生成方法生成对应图表。
具体地,由于Word模板引擎Poi-tl支持的图表具体包括表格、柱状图或折线图、多模块柱状图、饼图以及柱状折线图等,相应地,针对不同类型的图表,其对应的图表生成方法有所区别。因此,需要预先根据第一待处理数据的属性名从用于生成表格的第一图表生成方法、用于生成柱状图或折线图的第二图表生成方法、用于生成多模块柱状图的第三图表生成方法以及用于生成饼图或柱状折线图的第四图表生成方法确定一种适用于当前处理后数据的图表生成方法,作为目标图表生成方法。以用于生成柱状图或折线图的第二图表生成方法为例,若属性名中包含“Bar”,则表示第一待处理数据是用来生成柱状图或折线图。具体字段的对应关系,可以自由定义。本发明对此不做限定。
然后,判断处理后数据是否为空,判断为空时,对下一处理后数据进行判断。
在所述处理后数据不为空的情况下,利用选定的目标图表生成方法将处理后数据处理成目标文档中的图表。例如,第一图表生成方法将处理后数据填充至目标文档的表格中;第二图表生成方法对处理后数据处理后,在目标文档中生成柱状图或折线图。
本发明实施例提供的文档生成方法,通过多种图表生成方法来在Word文档中生成多种图与表,增加了文档样式的多样性,更能满足用户的需求。
进一步地,在所述目标图表生成方法为第一图表生成方法的情况下,所述基于所述处理后数据通过所述目标图表生成方法生成对应图表,包括:
获取所述数据集合中以列形式呈现的处理后数据的中间层数据,将所述中间层数据以行形式呈现,得到行数据;其中,中间层数据为所述第一待处理数据在处理过程中的数据;
基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,将所述行数据填充到所述目标文档的表格中,生成对应图表。
图3为本发明实施例提供的第一图表生成方法实现的示意图。
如图3所示,在处理后数据不为空的情况下,对接收到的多条以列形式呈现的处理后数据进行遍历,将每一列的中间一层数据整合成一条行数据。继而,利用Word模板引擎Poi-tl中的图表生成方法对应的表格生成方法,对所有行数据进行处理,在Word文档中生成表格。
本发明实施例提供的文档生成方法,通过将所述中间层数据以行形式呈现,得到行数据,因此,相较于现有的表格生成方法而言,更加关注列数据,从而在表格生成过程中无需逐一将数据插入表格中,简化了表格生成过程,提升效率。
进一步地,在所述目标图表生成方法为第二图表生成方法的情况下,所述基于所述处理后数据通过所述目标图表生成方法生成对应图表,包括:
从所述数据集合中的各个待处理数据所对应的处理后数据中获取系列数;其中,所述系列数为柱状图或折线图中系列名数量;
根据所述系列数遍历所述处理后数据,根据遍历顺序将每个所述处理后数据赋值给用于生成柱状图或折线图的数据集合;
基于所述用于生成柱状图或折线图的数据集合在所述目标文档中生成柱状图或折线图。
图4为本发明实施例提供的第二图表生成方法实现的示意图。
如图4所示,在处理后数据不为空的情况下,从接收到的处理后数据中获取指定的系列数,根据指定的系列数遍历处理后数据,在遍历过程中,将每条处理后数据赋值给用于生成柱状图或折线图的数据集合,根据该数据集合在Word文档中生成柱状图或折线图。
下面以柱状图为例,对第二图表生成方法的实现过程进行说明:
假设柱状图模板中包括初始数据、初始系列名(例如系列1、系列2、系列3)以及初始种类名(例如类别1、类别2、类别3、类别4)。本实施例中,用于生成柱状图的处理后数据具体为:
List<String> categoryNames为种类名,其对应的数据为{“苹果”,“香蕉”,“梨子”};
List<String> seriesName为系列名,其对应的数据{“数量”,“重量”};
List<Number[]> value为各系列对应的数据。
其中,List里面存的是Number类型的数组,本实施例中共有两个系列(数量与重量),则有两个数组:
value.get(0) =>{200000,300000,180000};
value.get(1) =>{100000,80000,60000}。
通过第二图表生成方法对上述用于生成柱状图的处理后数据进行处理后得到目标文档中的柱状图,该柱状图中的初始系列名变为了数量与重量,初始种类名变为了苹果、香蕉与梨子,初始数据根据上述两个数组也发生了相应改变。
本发明实施例提供的文档生成方法,通过根据遍历顺序将每个所述处理后数据复赋值给用于生成柱状图或折线图的数据集合,因此,在多系列柱状(折线)图生成过程中,相较于现有的多系列图生成方法而言,无需一行一行插入数据,简化了表格生成过程,提升效率。
进一步地,在所述目标图表生成方法为第三图表生成方法的情况下,所述基于所述处理后数据通过所述目标图表生成方法生成对应图表,包括:
根据所述数据集合中所有处理后数据对应的系列数与模块数;其中,所述系列数为多模块柱状图中系列名数量,所述模块数为多模块柱状图中模块名数量;
将所述模块数作为循环数对所述处理后数据进行循环,在所述目标文档中生成多模块柱状图。
图5为本发明实施例提供的第三图表生成方法实现的示意图。
如图5所示,在处理后数据不为空的情况下,根据接收到的处理后数据所对应的系列数与模块数,求出每个模块的系列数,并将模块数作为循环数对处理后数据进行循环,在循环过程中将接收到的处理后数据分配到对应的模块中,基于完成模块分配后的处理后数据,在Word文档中生成多模块柱状图。
下面对第三图表生成方法的实现过程进行说明:
假设多模块柱状图模板中包括初始数据、初始模块名称(例如,模块1、模块2、模块3)、初始系列名称(系列1、系列2、系列3等)等内容。本实施例中,用于生成多模块柱状图的处理后数据具体为:
List<String> moudelNames为模块名,其对应的数据是 {“水果”,“蔬菜”,“肉类”};
List<String> seriesNames为系列名,其对应的数据是{“苹果”,“香蕉”,“梨子”,“土豆”,“西红柿”,“毛豆”,“猪肉”,“牛肉”,“羊肉”};
List<Number> seriesValues为各系列对应的数据,其对应的数据是{60000,70000,50000,80000,20000,50000,90000,70000,40000}。
通过第三图表生成方法对上述用于生成多模块柱状图的处理后数据进行处理后得到目标文档中的多模块柱状图,该多模块柱状图中的初始模块名称变为了水果、蔬菜与肉类,初始系列名称变为了苹果、香蕉、梨子、土豆等,初始数据根据上述数据也发生了相应改变。
本发明实施例提供的文档生成方法,通过根据所述数据集合中所有处理后数据对应的系列数与模块数;将所述模块数作为循环数对所述处理后数据进行循环,在所述目标文档中生成多模块柱状图,因此,可以将整个柱状图划分为多个模块,每个模块包含对应系列数据,现有技术中并无该类型图的实现方式,从而增加了Word文档样式的多样性。
除此之外,若是所述第一待处理数据的属性名中包含用于生成饼图或柱状折线图的关键词,则判定使用用于生成饼图或柱状折线图的第四图表生成方法,进行饼图或柱状折线图的生成,具体地:
利用Word模板引擎Poi-tl中的图表生成方法对应的饼图或柱状折线图生成方法,并基于所述处理后数据,在所述目标文档中生成饼图或柱状折线图。
图6为本发明实施例提供的第四图表生成方法实现的示意图。
如图6所示,在处理后数据不为空的情况下,直接调用Word模板引擎Poi-tl中用于生成饼图或柱状折线图的方法对处理后数据进行处理,在Word文档中生成对应的饼图或柱状折线图。
下面以饼图为例,对第四图表生成方法的实现过程进行说明:
假设饼图模板中包括初始占比值以及初始系列名(例如,系列1、系列2等)。本实施例中,处理后数据具体为:
List<String> names为系列名,其对应的数据为{“苹果”,“香蕉”,“梨子”,“桃子”,“其他”};
List<Number> value是各系列对应的数据{1000,2000,500,300,100}。
通过第四图表生成方法对上述处理数据进行处理后得到目标文档中的饼图,该饼图中的初始系列名变为了苹果、香蕉、梨子、桃子与其他,初始占比值根据上述数据也发生了相应改变。
下面以柱状折线图为例,对第四图表生成方法的实现过程进行说明:
图7为本发明实施例提供的Word模板引擎Poi-tl中的柱状折线图模板;如图7所示,柱状折线图模板中包括初始数据、初始类别名以及初始系列名。本实施例中,用于生成柱状折线图的处理后数据具体为:
String barName为柱状的系列名称,其对应的数据是“数量”;
String lineName为折线的系列名称,其对应的数据是“占比”;
List<String> axisSeries 为类别名称,其对应的数据是{“苹果”,“香蕉”,“梨子”,“桃子”};
List<Number>barSeries为柱状图的数据{140000,80000,60000,50000};
List<Number> lineSeries 为折线的数据{0.5,0.3,0.1,0.1}。
通过第四图表生成方法对上述用于生成柱状折线图的处理数据进行处理后得到图8,图8中的数据、类别名以及系列名均已由上述处理后数据替换。
本发明实施例提供的文档生成方法,通过直接对Word模板引擎Poi-tl中的饼图或柱状折线图生成方法进行封装,从而无需关注具体生成方法,简化了生成过程。
除此之外,在上述利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据,或者在对所述第二待处理数据进行处理,得到所述第二待处理数据的属性名与处理后数据之后,均将待处理数据的属性名和处理后数据以key-value传输至Map集合中,基于该Map集合,自动生成Word文档。
具体地,基于Map集合中各个待处理数据的属性名key值,在Word文档模板中找到与key相匹配的标签,然后将该key对应的处理后数据value替换到匹配到的标签所对应的值,对Map集合中所有待处理数据完成上述匹配与替换工作后,得到Word文档。
下面对本发明提供的文档生成装置进行描述,下文描述的文档生成装置与上文描述的文档生成方法可相互对应参照。
图9为本发明实施例提供的文档生成装置结构示意图,如图9所示,一种文档生成装置,包括:
数据获取模块701,用于获取包含待处理数据的数据集合。
其中,待处理数据是用于生成Word文档的数据,例如Word文档中需要的文本、图片、表格等数据。
本实施例中,包含待处理数据的数据集合可以是对大量数据进行数据分析后形成,也可以直接从数据库中获取,本发明对数据的种类与获取方式不做限定。
图表数据判断模块702,用于判断所述数据集合中的各个待处理数据是否用于生成图表。
具体地,通过判断各个待处理数据对应的属性名中是否具有表示图表的关键词,若待处理数据对应的属性名中有“图”、“表”等关键词,则说明该待处理数据用于生成图表;若是没有“图”、“表”等关键词,则默认该待处理数据用于生成文本。
图表数据处理模块703,用于在第一待处理数据用于生成图表的情况下,利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据,处理后数据为预设数据类型的数据;其中,所述图表生成方法对所述第一待处理数据进行处理包括对所述第一待处理数据进行属性名的获取,以及对所述第一待处理数据进行数据类型的转换,以得到预设数据类型的处理后数据。
具体地,若待处理数据用于生成图表,将该待处理数据作为第一待处理数据,并利用预先设定的图表生成方法对所述第一待处理数据的数据类型进行转换,以及利用Java的反射机制获取第一待处理数据(即实体数据entity)对应的属性名和处理后数据value。
文档生成模块704,用于基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档。
其中,目标文档模板可以生成特定格式的文档,其是为了使得文档数据与文档格式分离而产生的。目标文档模板中包含多个标签,每个标签根据目标文档中的特定格式要求所处的位置也不同,比如,在目标文档模板中文字部分对应的是文字标签,在图表部分对应的是图表标签。目标文档是结合了待处理数据与特定格式的文档所生成的文档,例如待处理数据为城市安全状况数据,特定格式的文档为用户选中的报告样式,则目标文档为基于城市安全状况数据与特定格式的城市安全报告。本实施例中目标文档为Word文档。
具体地,根据数据集合中的各个待处理数据的属性名与标签的匹配关系,将待处理数据对应的处理后数据填充至相关标签位置,从而形成适用于该数据集合的Word文档。
本发明实施例提供的文档生成装置,通过对数据集合中所有用于生成图表的第一待处理数据进行包括数据类型转换的处理,从而获得所有第一待处理数据的属性名与处理后数据,并基于第一待处理数据的属性名与目标文档模板中的标签之间的匹配关系,将处理后数据填充至目标文档模板中标签对应的位置,从而形成目标文档。因此,在不需要特定平台支持的情况下,可以对所有用于生成图表的数据进行处理,从而支持不同类型的图表生成,具有更高的灵活度,也不需要预先设计Word模板,并且,目标文档是根据第一待处理数据的属性名与目标文档模板中的标签之间的匹配关系,直接将所有处理后数据填充至目标文档模板中生成,而不是逐一将第一待处理数据插入目标文档模板中,从而使得文档生成过程简化,大大节省了生成时间,提升了效率。
图10为本发明实施例提供的一种电子设备的实体结构示意图,如图10所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行文档生成方法,该方法包括:获取包含待处理数据的数据集合;
判断所述数据集合中的各个待处理数据是否用于生成图表;
在第一待处理数据用于生成图表的情况下,利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据,处理后数据为预设数据类型的数据;其中,所述图表生成方法对所述第一待处理数据进行处理包括对所述第一待处理数据进行属性名的获取,以及对所述第一待处理数据进行数据类型的转换,以得到预设数据类型的处理后数据;
基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述个方法所提供的文档生成方法,该方法包括:获取包含待处理数据的数据集合;
判断所述数据集合中的各个待处理数据是否用于生成图表;
在第一待处理数据用于生成图表的情况下,利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据,处理后数据为预设数据类型的数据;其中,所述图表生成方法对所述第一待处理数据进行处理包括对所述第一待处理数据进行属性名的获取,以及对所述第一待处理数据进行数据类型的转换,以得到预设数据类型的处理后数据;
基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种文档生成方法,其特征在于,包括:
获取包含待处理数据的数据集合;
判断所述数据集合中的各个待处理数据是否用于生成图表;
在第一待处理数据用于生成图表的情况下,利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据,所述处理后数据为预设数据类型的数据;其中,所述图表生成方法对所述第一待处理数据进行处理包括对所述第一待处理数据进行属性名的获取,以及对所述第一待处理数据进行数据类型的转换,以得到预设数据类型的处理后数据;
基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档;
其中,所述判断所述数据集合中的各个待处理数据是否用于生成图表,包括:
判断所述数据集合中的各个待处理数据的数据类型是否为List链表类型;
在第三待处理数据的数据类型为非List链表类型的情况下,确定所述第三待处理数据为不用于生成图表的第二待处理数据;其中,所述第三待处理数据为所述数据集合中的任意一个待处理数据;
在第三待处理数据的数据类型为List链表类型的情况下,判断所述第三待处理数据是否用于生成图表;
根据判断结果确定所述第三待处理数据为用于生成图表的第一待处理数据,或为不用于生成图表的第二待处理数据。
2.根据权利要求1所述的文档生成方法,其特征在于,方法还包括:
在第二待处理数据未用于生成图表的情况下,对所述第二待处理数据进行处理,得到所述第二待处理数据的属性名与处理后数据。
3.根据权利要求1所述的文档生成方法,其特征在于,在第二待处理数据未用于生成图表的情况下,对所述第二待处理数据进行处理,得到所述第二待处理数据的属性名与处理后数据,包括:
在所述第二待处理数据未用于生成图表,且所述第二待处理数据的数据类型为List链表类型的情况下,获取所述第二待处理数据所对应List链表上的各个节点的属性名与处理后数据。
4.根据权利要求1所述的文档生成方法,其特征在于,所述基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档,包括:
基于所述数据集合中的各个待处理数据的属性名,在所述目标文档模板中查找与所述属性名相匹配的标签;
将所述标签的值替换为所匹配的待处理数据所对应的处理后数据,得到目标文档。
5.根据权利要求1至4任一项所述的文档生成方法,其特征在于,方法还包括:
对Word模板引擎Poi-tl中的图表生成方法重新定义,得到所述预先设定的图表生成方法。
6.根据权利要求5所述的文档生成方法,其特征在于,所述预先设定的图表生成方法至少包括用于生成表格的第一图表生成方法、用于生成柱状图或折线图的第二图表生成方法以及、用于生成多模块柱状图的第三图表生成方法以及用于生成饼图或柱状折线图的第四图表生成方法;
相应地,所述利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据后,所述方法还包括:
根据所述第一待处理数据的属性名从所述第一图表生成方法、第二图表生成方法以及、第三图表生成方法以及第四图表生成方法中确定目标图表生成方法;
判断所述处理后数据是否为空;
在所述处理后数据不为空的情况下,基于所述处理后数据通过所述目标图表生成方法生成对应图表。
7.根据权利要求6所述的文档生成方法,其特征在于,在所述目标图表生成方法为第一图表生成方法的情况下,所述基于所述处理后数据通过所述目标图表生成方法生成对应图表,包括:
获取所述数据集合中以列形式呈现的处理后数据的中间层数据,将所述中间层数据以行形式呈现,得到行数据;其中,中间层数据为所述第一待处理数据在处理过程中的数据;
基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,将所述行数据填充到所述目标文档的表格中,生成对应图表。
8.根据权利要求6所述的文档生成方法,其特征在于,在所述目标图表生成方法为第二图表生成方法的情况下,所述基于所述处理后数据通过所述目标图表生成方法生成对应图表,包括:
从所述数据集合中的各个待处理数据所对应的处理后数据中获取系列数;其中,所述系列数为柱状图或折线图中系列名数量;
根据所述系列数遍历所述处理后数据,根据遍历顺序将每个所述处理后数据复赋值给用于生成柱状图或折线图的数据集合;
基于所述用于生成柱状图或折线图的数据集合在所述目标文档中生成柱状图或折线图。
9.根据权利要求6所述的文档生成方法,其特征在于,在所述目标图表生成方法为第三图表生成方法的情况下,所述基于所述处理后数据通过所述目标图表生成方法生成对应图表,包括:
根据所述数据集合中所有处理后数据对应的系列数与模块数;其中,所述系列数为多模块柱状图中系列名数量,所述模块数为多模块柱状图中模块名数量;
将所述模块数作为循环数对所述处理后数据进行循环,在所述目标文档中生成多模块柱状图。
10.一种文档转换装置,其特征在于,包括:
数据获取模块,用于获取包含待处理数据的数据集合;
图表数据判断模块,用于判断所述数据集合中的各个待处理数据是否用于生成图表;
图表数据处理模块,用于在第一待处理数据用于生成图表的情况下,利用预先设定的图表生成方法对所述第一待处理数据进行处理,得到所述第一待处理数据的属性名与处理后数据,所述处理后数据为预设数据类型的数据;其中,所述图表生成方法对所述第一待处理数据进行处理包括对所述第一待处理数据进行数据类型的转换,以得到预设数据类型的处理后数据;
文档生成模块,用于基于所述数据集合中的各个待处理数据的属性名与目标文档模板中的标签之间的匹配关系,以及对应的处理后数据生成目标文档;
其中,所述图表数据判断模块具体用于:
判断所述数据集合中的各个待处理数据的数据类型是否为List链表类型;
在第三待处理数据的数据类型为非List链表类型的情况下,确定所述第三待处理数据为不用于生成图表的第二待处理数据;其中,所述第三待处理数据为所述数据集合中的任意一个待处理数据;
在第三待处理数据的数据类型为List链表类型的情况下,判断所述第三待处理数据是否用于生成图表;
根据判断结果确定所述第三待处理数据为用于生成图表的第一待处理数据,或为不用于生成图表的第二待处理数据。
11.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至9任一项所述文档生成方法。
12.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述文档生成方法。
CN202210274680.0A 2022-03-21 2022-03-21 文档生成方法、装置、电子设备及介质 Active CN114372445B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210274680.0A CN114372445B (zh) 2022-03-21 2022-03-21 文档生成方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210274680.0A CN114372445B (zh) 2022-03-21 2022-03-21 文档生成方法、装置、电子设备及介质

Publications (2)

Publication Number Publication Date
CN114372445A CN114372445A (zh) 2022-04-19
CN114372445B true CN114372445B (zh) 2022-08-12

Family

ID=81145833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210274680.0A Active CN114372445B (zh) 2022-03-21 2022-03-21 文档生成方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN114372445B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279457A (zh) * 2013-05-22 2013-09-04 北京京东尚科信息技术有限公司 一种基于Excel生成图表的方法及装置
CN104216825A (zh) * 2013-06-04 2014-12-17 北京神州泰岳软件股份有限公司 问题定位方法及系统
CN106933862A (zh) * 2015-12-30 2017-07-07 北京神州泰岳软件股份有限公司 一种生成邮件报告的方法和装置
CN107688664A (zh) * 2017-09-25 2018-02-13 平安科技(深圳)有限公司 图表生成方法、装置、计算机设备和存储介质
CN109657215A (zh) * 2018-09-27 2019-04-19 深圳壹账通智能科技有限公司 基于模板的文档生成方法、设备、存储介质及装置
CN110609998A (zh) * 2019-08-07 2019-12-24 中通服建设有限公司 一种电子文档信息的数据提取方法、电子设备及存储介质
CN111325012A (zh) * 2020-01-22 2020-06-23 奇安信科技集团股份有限公司 word报表生成方法与系统
CN113449502A (zh) * 2021-06-29 2021-09-28 平安资产管理有限责任公司 基于动态数据的文档生成方法与系统
CN113535983A (zh) * 2021-08-06 2021-10-22 中国电力科学研究院有限公司 一种电力运检的知识图谱构建方法和装置
CN114154474A (zh) * 2021-11-26 2022-03-08 杭州安恒信息技术股份有限公司 数据导出方法、系统、计算机设备及可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339169A (zh) * 2018-12-18 2020-06-26 北京奇虎科技有限公司 一种兼容多种大数据图表库引擎的图表生成方法及装置
CN111967262B (zh) * 2020-06-30 2024-01-12 北京百度网讯科技有限公司 实体标签的确定方法和装置
CN112597158A (zh) * 2020-12-17 2021-04-02 平安普惠企业管理有限公司 数据匹配方法、装置、计算机设备和存储介质
CN112966469B (zh) * 2021-03-08 2023-08-01 北京百度网讯科技有限公司 文档中的图表处理方法、装置、设备及存储介质
CN113850065A (zh) * 2021-09-17 2021-12-28 奇安信科技集团股份有限公司 报告生成方法、装置、计算机设备和存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279457A (zh) * 2013-05-22 2013-09-04 北京京东尚科信息技术有限公司 一种基于Excel生成图表的方法及装置
CN104216825A (zh) * 2013-06-04 2014-12-17 北京神州泰岳软件股份有限公司 问题定位方法及系统
CN106933862A (zh) * 2015-12-30 2017-07-07 北京神州泰岳软件股份有限公司 一种生成邮件报告的方法和装置
CN107688664A (zh) * 2017-09-25 2018-02-13 平安科技(深圳)有限公司 图表生成方法、装置、计算机设备和存储介质
CN109657215A (zh) * 2018-09-27 2019-04-19 深圳壹账通智能科技有限公司 基于模板的文档生成方法、设备、存储介质及装置
CN110609998A (zh) * 2019-08-07 2019-12-24 中通服建设有限公司 一种电子文档信息的数据提取方法、电子设备及存储介质
CN111325012A (zh) * 2020-01-22 2020-06-23 奇安信科技集团股份有限公司 word报表生成方法与系统
CN113449502A (zh) * 2021-06-29 2021-09-28 平安资产管理有限责任公司 基于动态数据的文档生成方法与系统
CN113535983A (zh) * 2021-08-06 2021-10-22 中国电力科学研究院有限公司 一种电力运检的知识图谱构建方法和装置
CN114154474A (zh) * 2021-11-26 2022-03-08 杭州安恒信息技术股份有限公司 数据导出方法、系统、计算机设备及可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
POI操作word模板并生成新的word;TryCatch菌;《https://www.jianshu.com/p/6603b1ea3ad1》;20181005;1-10 *
传染病监测分析报告的WORD文档自动生成;张静靖等;《预防医学情报杂志》;20100530;第26卷(第05期);393-396 *
基于报表和模板的报告生成方法研究;毛燠锋等;《软件工程》;20210530;第24卷(第05期);30-32、21 *

Also Published As

Publication number Publication date
CN114372445A (zh) 2022-04-19

Similar Documents

Publication Publication Date Title
CN109960810B (zh) 一种实体对齐方法及装置
JP2022541199A (ja) データテーブルの画像表現に基づいて構造化されたデータベースにデータ挿入するためのシステムおよび方法。
CN109508420B (zh) 一种知识图谱属性的清洗方法及装置
CN110096434A (zh) 一种接口测试方法及装置
US20100293179A1 (en) Identifying synonyms of entities using web search
CN108090104B (zh) 用于获取网页信息的方法和装置
CN108496190B (zh) 用于从电子数据结构中提取属性的注释系统
US20100217742A1 (en) Generating A Domain Corpus And A Dictionary For An Automated Ontology
CN108228676A (zh) 信息抽取方法和系统
RU2004104017A (ru) Декларативная последовательная параметризация отчетов
US20220067575A1 (en) Automatically generating a pipeline of a new machine learning project from pipelines of existing machine learning projects stored in a corpus
CN106960058A (zh) 一种网页结构变更检测方法及系统
CN106503003A (zh) 一种可扩展标记语言xml文档的压缩、解压方法和装置
CN111694967B (zh) 属性抽取方法、装置、电子设备及介质
CN115203309A (zh) 网页中标数据结构化方法及装置
CN114372445B (zh) 文档生成方法、装置、电子设备及介质
CN106777140B (zh) 用于非结构化文档搜索的方法及装置
CN111078564B (zh) 一种ui测试用例管理方法、装置、计算机设备以及计算机可读存储介质
CN106557564A (zh) 一种对象数据分析方法及装置
CN106951429B (zh) 增强网页评论显示的方法、浏览器及设备
CN114004209A (zh) Pdf格式数据导出方法、装置、电子设备及可读存储介质
CN113536762A (zh) Json文本的比对方法及装置
CN109992293B (zh) Android系统组件版本信息的组装方法及装置
CN111401005B (zh) 文本转换方法、装置及可读存储介质
CN109725982B (zh) 数据对象构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant