CN118012916A - 报表的生成方法、装置、设备及存储介质 - Google Patents

报表的生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN118012916A
CN118012916A CN202410229996.7A CN202410229996A CN118012916A CN 118012916 A CN118012916 A CN 118012916A CN 202410229996 A CN202410229996 A CN 202410229996A CN 118012916 A CN118012916 A CN 118012916A
Authority
CN
China
Prior art keywords
report
data
task
target
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410229996.7A
Other languages
English (en)
Inventor
谭旭明
谭阳
谭文豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xutai Internet Co ltd
Original Assignee
Shenzhen Xutai Internet Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xutai Internet Co ltd filed Critical Shenzhen Xutai Internet Co ltd
Priority to CN202410229996.7A priority Critical patent/CN118012916A/zh
Publication of CN118012916A publication Critical patent/CN118012916A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及数据处理技术领域,公开了一种报表的生成方法、装置、设备及存储介质。所述方法包括:构建内部数据仓库和外部数据仓库,并生成每个数据处理任务的任务知识图谱;创建数据提取逻辑;生成报表生成请求的多个待填充报表数据;进行报表数据填充和发布,得到初始在线报表;对初始在线报表的报表数据填充和发布过程进行异常检测,得到目标填充和发布异常值集合,并将目标填充和发布异常值集合输入报表生成策略优化模型进行报表生成策略优化分析,得到目标报表优化策略;根据目标报表优化策略和任务报表模板生成多个待填充报表数据对应的可视化在线报表,本申请实现了在线报表的智能生成并提高了报表的生成准确率。

Description

报表的生成方法、装置、设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种报表的生成方法、装置、设备及存储介质。
背景技术
随着数据的爆炸性增长,组织和企业需要更有效地分析和利用内部和外部数据,以支持业务决策和战略规划。传统的报表生成方法通常依赖于手动数据提取和报表设计,但这种方式在大规模数据和复杂需求下变得不可行。因此,自动化报表生成方法成为了研究和应用的热点。
然而,目前自动化报表生成方法还存在一些挑战和问题。数据源的多样性和复杂性使得数据的集成和准备变得困难,需要有效的数据仓库和数据提取逻辑。其次,如何根据不同的业务需求和数据特性生成具有高度可视化和交互性的报表仍然是一个挑战,需要综合考虑报表结构、布局、样式以及数据相关性。报表生成过程中的异常检测和优化策略需要更精确和智能的算法,以确保生成的报表质量和决策价值。
发明内容
本申请提供了一种报表的生成方法、装置、设备及存储介质,用于实现了在线报表的智能生成并提高了报表的生成准确率。
第一方面,本申请提供了一种报表的生成方法,所述报表的生成方法包括:
获取多个内部数据源并通过所述多个内部数据源构建内部数据仓库,同时,获取多个外部数据源并通过所述多个外部数据源构建外部数据仓库;
获取多个数据处理任务,并根据所述内部数据仓库和所述外部数据仓库生成每个数据处理任务的任务知识图谱;
获取所述任务知识图谱的任务实体以及属性关系,并根据所述任务实体以及所述属性关系创建每个数据处理任务的数据提取逻辑;
查询待处理的报表生成请求,并根据所述数据提取逻辑生成所述报表生成请求的多个待填充报表数据;
根据预置的任务报表模板计算每个待填充报表数据的目标报表交互式元素,并基于所述目标报表交互式元素分别对所述多个待填充报表数据进行报表数据填充和发布,得到初始在线报表;
对所述初始在线报表的报表数据填充和发布过程进行异常检测,得到目标填充和发布异常值集合,并将所述目标填充和发布异常值集合输入预置的报表生成策略优化模型进行报表生成策略优化分析,得到目标报表优化策略;
根据所述目标报表优化策略和所述任务报表模板生成所述多个待填充报表数据对应的可视化在线报表。
第二方面,本申请提供了一种报表的生成装置,所述报表的生成装置包括:
获取模块,用于获取多个内部数据源并通过所述多个内部数据源构建内部数据仓库,同时,获取多个外部数据源并通过所述多个外部数据源构建外部数据仓库;
处理模块,用于获取多个数据处理任务,并根据所述内部数据仓库和所述外部数据仓库生成每个数据处理任务的任务知识图谱;
创建模块,用于获取所述任务知识图谱的任务实体以及属性关系,并根据所述任务实体以及所述属性关系创建每个数据处理任务的数据提取逻辑;
查询模块,用于查询待处理的报表生成请求,并根据所述数据提取逻辑生成所述报表生成请求的多个待填充报表数据;
计算模块,用于根据预置的任务报表模板计算每个待填充报表数据的目标报表交互式元素,并基于所述目标报表交互式元素分别对所述多个待填充报表数据进行报表数据填充和发布,得到初始在线报表;
分析模块,用于对所述初始在线报表的报表数据填充和发布过程进行异常检测,得到目标填充和发布异常值集合,并将所述目标填充和发布异常值集合输入预置的报表生成策略优化模型进行报表生成策略优化分析,得到目标报表优化策略;
生成模块,用于根据所述目标报表优化策略和所述任务报表模板生成所述多个待填充报表数据对应的可视化在线报表。
本申请第三方面提供了一种报表的生成设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述报表的生成设备执行上述的报表的生成方法。
本申请的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的报表的生成方法。
本申请提供的技术方案中,通过获取和整合多个内部和外部数据源,构建了内部和外部数据仓库,有助于实现数据的集中管理和统一访问,提高了数据的可用性和一致性。通过生成任务知识图谱和数据提取逻辑,实现了对数据处理任务的自动化描述和规划,提高了数据处理的效率和准确性。根据预置的任务报表模板动态生成报表,根据数据的变化自动调整报表内容,使报表生成更加灵活和自适应。通过异常检测和报表生成策略优化,能够及时识别和处理数据异常,提高了报表的可信度和数据质量。通过计算目标报表交互式元素,生成可视化在线报表,增强了报表的可读性和用户体验,使决策者更容易理解数据。减少了手动数据处理和报表生成的工作量,提高了效率,降低了人工错误的风险。根据不同的任务需求和数据源特点,定制报表生成流程和规则,满足各种业务场景的需求。通过自动化生成高质量的报表,有助于企业更好地进行数据分析,支持决策制定和战略规划,进而实现了在线报表的智能生成并提高了报表的生成准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以基于这些附图获得其他的附图。
图1为本申请实施例中报表的生成方法的一个实施例示意图;
图2为本申请实施例中报表的生成装置的一个实施例示意图。
具体实施方式
本申请实施例提供了一种报表的生成方法、装置、设备及存储介质。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本申请实施例的具体流程进行描述,请参阅图1,本申请实施例中报表的生成方法的一个实施例包括:
步骤S101、获取多个内部数据源并通过多个内部数据源构建内部数据仓库,同时,获取多个外部数据源并通过多个外部数据源构建外部数据仓库;
可以理解的是,本申请的执行主体可以为报表的生成装置,还可以是终端或者服务器,具体此处不做限定。本申请实施例以服务器为执行主体为例进行说明。
具体的,通过多种数据采集技术和接口,如API调用、数据库连接和文件传输等,从内部系统如企业资源规划(ERP)系统、客户关系管理(CRM)系统、以及其他业务管理系统中获取内部数据。这些数据包括销售记录、客户互动数据、财务信息等,涉及各种格式如结构化数据表、文本文件或实时流数据。针对外部数据源,关注市场趋势、社交媒体信息、公共数据库以及行业报告等,这些数据来源于第三方数据提供商、公开数据集或在线社交平台,形式上是非结构化或半结构化数据,如文本、图像、视频或网络爬虫获取的数据。进行数据预处理,包括数据清洗、格式转换、数据去重和归一化等,以确保数据质量和一致性。使用现代数据仓库技术,如Apache Hadoop或Apache Spark等大数据平台,根据数据的特点和使用需求,设计合理的数据模型,选择适当的存储格式(如HDFS、Parquet或NoSQL数据库),并实施有效的数据分区和索引策略,以提升数据存取效率。这些数据仓库不仅需要支持高效的数据读写操作,还要提供良好的扩展性和容错能力,以适应不断增长和变化的数据量。在构建完内外部数据仓库后,通过定期或实时的数据同步机制,保持数据仓库的数据更新,确保报表生成系统能够访问到最新和最完整的数据资源。
步骤S102、获取多个数据处理任务,并根据内部数据仓库和外部数据仓库生成每个数据处理任务的任务知识图谱;
具体的,获取多个数据处理任务,这些任务涉及数据分类、聚合、预测或其他形式的数据操作。对每个数据处理任务进行数据处理特征分析,包括识别任务所需的数据类型、数据源、数据量、处理频率和预期输出等,构建出一个全面且详细的数据处理特征集合。根据特征集合,对内部数据仓库和外部数据仓库进行关系强度分析,评估和量化数据处理任务与数据仓库中数据之间的关联度。例如,某个任务需要重点关注客户交易数据,而这些数据在内部数据仓库中的占比和相关性将决定其关系强度,从而得到一组目标关系强度数据,它们表征了数据处理任务与数据仓库中不同数据集之间的关联程度。基于目标关系强度数据,采用图数据库算法为每个数据处理任务生成相应的任务知识图谱。在这个阶段,算法会构建一个图形结构,其中节点代表数据实体(如特定的数据集、数据字段等),而边代表它们之间的关系(如关联、依赖等)。通过这样的方式,每个任务的知识图谱不仅反映了任务所需的数据实体及其属性,而且揭示了这些实体之间的复杂关系。
步骤S103、获取任务知识图谱的任务实体以及属性关系,并根据任务实体以及属性关系创建每个数据处理任务的数据提取逻辑;
具体的,对任务知识图谱进行实体和关系解析。识别图谱中的各个节点(任务实体)及其属性,同时明确节点之间的关系,如数据依赖性、关联规则等,获得一个清晰的结构图,其中包含了所有相关实体和它们之间的相互作用。基于这些解析出的任务实体和属性关系,分别为每个数据处理任务匹配初始提取逻辑。将任务知识图谱中的实体和关系映射到具体的数据操作上。例如,如果某个实体表示特定的客户数据,且与销售数据存在强关联,那么相应的数据提取逻辑将包括从数据库中提取这两类数据并进行关联分析。对每个数据处理任务按照其初始提取逻辑进行数据提取影响评分。评估初始提取逻辑的有效性和效率,即该逻辑在实际操作中的表现如何,是否能够准确、快速地提取所需数据。此评分过程涉及到多种指标,包括数据提取的准确率、速度、资源消耗等。通过这种方式,得到一个客观的、量化的数据提取影响评分值,这为进一步的逻辑优化提供了依据。根据数据提取影响评分值,对初始提取逻辑进行优化。这包括调整数据查询的参数、优化数据处理流程、改善数据提取算法等。例如,如果某个数据提取逻辑的评分显示其处理速度较慢,则需要通过引入更高效的数据索引、使用更快的查询算法或调整数据处理流程来提升速度。通过这种方式,每个数据处理任务的数据提取逻辑经过反复的测试和优化,最终形成一个高效、准确且可靠的数据提取策略。
步骤S104、查询待处理的报表生成请求,并根据数据提取逻辑生成报表生成请求的多个待填充报表数据;
具体的,查询并识别待处理的报表生成请求,从用户界面、自动化任务调度或API调用中获取请求。进行请求解析,以确定目标请求地址。目标请求地址包含了关于所需报表类型、数据范围、时间区间等重要信息,这些信息将直接影响后续的数据提取逻辑。根据解析出的目标请求地址,确定与该报表生成请求相关联的数据提取逻辑。这个逻辑是根据前面创建的任务知识图谱而定制的,旨在确保从内部和外部数据仓库中提取最相关、最准确的数据。例如,如果报表是关于特定时间段的销售分析,那么数据提取逻辑将专注于提取相应时间范围内的销售数据和相关客户信息。根据数据提取逻辑,对报表生成请求中涉及的数据进行分类,生成多个初始数据流。这些初始数据流包括结构化数据如数据库表格、半结构化数据如日志文件,或者非结构化数据如文本描述等。对初始数据流进行数据格式化与预处理,以生成报表生成请求的多个待填充报表数据。通过对数据进行清洗、转换、标准化等操作,确保数据格式符合报表模板的要求,并且数据质量足以支撑准确的分析和决策。例如,数据清洗包括去除重复记录、修正错误输入,而数据转换则涉及将文本日期转换为统一格式或将非结构化数据提炼为结构化数据。
步骤S105、根据预置的任务报表模板计算每个待填充报表数据的目标报表交互式元素,并基于目标报表交互式元素分别对多个待填充报表数据进行报表数据填充和发布,得到初始在线报表;
具体的,获取预先配置的报表结构、布局和样式。这些配置决定了报表的外观和用户交互方式,是整个报表设计的基础。报表结构定义了数据如何组织,例如,它指定哪些数据显示为表格、图表或文本块;报表布局决定了这些元素在页面上的位置和大小;而报表样式则涉及颜色方案、字体选择和其他视觉元素,以确保报表既美观又易于阅读。计算每个待填充报表数据的数据相关性。分析数据之间的关系,如何将这些数据有效地呈现在报表中。例如,如果某数据集显示了销售量随时间的变化,那么与之相关的交互式元素是时间序列图表。数据相关性的计算不仅基于数据本身的性质,还需要考虑用户的需求和预期的报表用途,确保所选择的交互式元素能够有效地传达所需信息。根据目标报表交互式元素,分别对多个待填充报表数据进行数据填充和发布,得到初始在线报表。将处理后的数据注入到之前定义的报表模板中,确保每个数据元素正确地显示在其预定的位置。在填充数据的同时,应用预设的样式,如调整图表的颜色或更改文本的字体,以提高报表的整体美观和可读性。此外,交互式元素如下拉菜单、滑动条或数据过滤器等也会被集成到报表中,以提供更丰富的用户交互体验。
步骤S106、对初始在线报表的报表数据填充和发布过程进行异常检测,得到目标填充和发布异常值集合,并将目标填充和发布异常值集合输入预置的报表生成策略优化模型进行报表生成策略优化分析,得到目标报表优化策略;
具体的,对初始在线报表的报表数据填充和发布过程进行异常检测。通过数据分析技术,以监测和识别数据填充和发布中出现的任何异常模式或数据不一致性,从而获得初始异常检测数据。对初始异常检测数据进行时序信息关联处理,识别异常数据之间的时序关系,以及异常发生的时间点和持续时间。通过预置的循环变分自编码器对时序异常检测数据进行深度学习驱动的异常检测。循环变分自编码器是一种高级的机器学习模型,适用于处理时序数据,能够有效识别异常模式和数据不一致性,从而得到目标填充和发布异常值集合。对目标填充和发布异常值集合进行编码映射,将异常数据转换为多个目标填充和发布异常编码值,将异常数据转化为更适合机器学习模型处理的格式。对异常编码值进行向量转换,生成目标填充和发布异常状态向量。这些向量是对异常情况的数学表征,为接下来的优化分析提供了可操作的输入数据。将异常状态向量输入预置的报表生成策略优化模型,其中包括多个决策树以及遗传算法层。这个模型结合了决策树分析和遗传算法,形成了一个复合的策略优化框架。通过多个决策树,对目标填充和发布异常状态向量进行详尽的分析,每个决策树都会从不同的角度审视数据,从而得出一系列初步的报表生成策略优化方案,这些方案被视为第一报表优化策略。将第一报表优化策略输入遗传算法层进行进一步的优化。在遗传算法层中,各个策略被视为个体,通过群体初始化和策略优化过程,模仿自然选择和遗传机制,以产生更加适应的策略。这个过程包括策略的交叉、变异和选择,通过迭代过程不断提升策略的效果,最终生成一系列经过优化的第二报表优化策略。对第二报表优化策略进行策略最优化求解,从一系列优化策略中找到最优的解决方案。这涉及到评估每个策略的效果,如准确性、效率和可行性,并对它们进行比较。
步骤S107、根据目标报表优化策略和任务报表模板生成多个待填充报表数据对应的可视化在线报表。
具体的,根据目标报表优化策略和任务报表模板,对每个待填充报表数据进行优化处理。包括对报表数据的格式、排列、显示方式等进行调整和优化,确保数据能够以最适合的方式在报表中展现。例如,优化处理涉及到改变某些数据块的显示位置,或调整图表的大小和类型以更好地展示数据趋势。对经过优化处理的目标填充报表数据进行动态调整和报表可视化分析。动态调整是为了确保报表数据能够反映最新的信息和趋势,这涉及到根据实时数据更新图表或调整数据显示的格式。而报表可视化分析则是将这些数据转化成直观、易于理解的图表和图形,以帮助用户更好地分析和理解数据。在进行报表可视化分析时,考虑数据的呈现方式对用户理解的影响,运用各种图表、颜色编码和交互元素来增强报表的可读性和交互性。生成多个与待填充报表数据相对应的可视化在线报表。这些报表不仅准确地反映了优化策略的指导思想,还通过精心设计的布局和可视化元素,使得报表既信息丰富又易于用户理解和操作。
本申请实施例中,通过获取和整合多个内部和外部数据源,构建了内部和外部数据仓库,有助于实现数据的集中管理和统一访问,提高了数据的可用性和一致性。通过生成任务知识图谱和数据提取逻辑,实现了对数据处理任务的自动化描述和规划,提高了数据处理的效率和准确性。根据预置的任务报表模板动态生成报表,根据数据的变化自动调整报表内容,使报表生成更加灵活和自适应。通过异常检测和报表生成策略优化,能够及时识别和处理数据异常,提高了报表的可信度和数据质量。通过计算目标报表交互式元素,生成可视化在线报表,增强了报表的可读性和用户体验,使决策者更容易理解数据。减少了手动数据处理和报表生成的工作量,提高了效率,降低了人工错误的风险。根据不同的任务需求和数据源特点,定制报表生成流程和规则,满足各种业务场景的需求。通过自动化生成高质量的报表,有助于企业更好地进行数据分析,支持决策制定和战略规划,进而实现了在线报表的智能生成并提高了报表的生成准确率。
在一具体实施例中,执行步骤S102的过程可以具体包括如下步骤:
(1)获取多个数据处理任务,并对每个数据处理任务进行数据处理特征分析,得到每个数据处理任务的数据处理特征集合;
(2)根据每个数据处理任务的数据处理特征集合,对内部数据仓库与外部数据仓库进行关系强度分析,得到目标关系强度数据;
(3)根据目标关系强度数据,并采用图数据库算法分别生成每个数据处理任务的任务知识图谱。
具体的,从各种数据源中获取多个数据处理任务,这些任务涉及从简单的数据查询到复杂的数据分析和预测。每个任务都需要进行详细的特征分析,以确定其关键参数,例如数据源、数据类型、处理频率、所需的处理算法和预期的输出格式。例如,一个数据处理任务涉及从内部数据库中提取特定时间段的销售数据,并将其与来自外部数据源的市场趋势数据结合起来,以预测未来的销售趋势。任务的特征集合包括销售数据的时间范围、数据粒度、关联的市场趋势指标等。根据特征集合对内部数据仓库与外部数据仓库中的数据进行关系强度分析。评估任务特征与数据仓库中数据之间的相关性和重要性,以确定哪些数据对完成任务最为关键。例如,这包括分析销售数据与市场趋势指标之间的相关性,以及确定这些数据在预测模型中的重要性。这种分析有助于优化数据提取过程,确保仅聚焦于对完成任务最重要的数据集。基于关系强度数据,采用图数据库算法为每个数据处理任务生成任务知识图谱。任务知识图谱以图形方式呈现,其中节点代表数据实体,如特定的数据集或数据字段,边代表实体之间的关系,如数据间的依赖性或相关性。例如,知识图谱包含代表不同销售数据集的节点,以及表示这些数据集与市场趋势指标关联的边。
在一具体实施例中,执行步骤S103的过程可以具体包括如下步骤:
(1)对任务知识图谱进行实体和关系解析,得到任务实体以及属性关系;
(2)根据任务实体以及属性关系,分别匹配每个数据处理任务的初始提取逻辑;
(3)根据初始提取逻辑对每个数据处理任务进行数据提取影响评分,得到初始提取逻辑的数据提取影响评分值;
(4)根据数据提取影响评分值对初始提取逻辑进行提取逻辑优化,得到每个数据处理任务的数据提取逻辑。
具体的,对任务知识图谱进行实体和关系解析。任务知识图谱是一个包含大量实体和这些实体间复杂关系的数据结构。实体指的是图谱中的节点,它们可以是任何具体的数据点,如个人、地点、事件等。而关系则是连接这些实体的边,表示实体之间的各种联系。运用自然语言处理(NLP)技术和图谱数据库技术,识别并理解这些实体和它们之间的属性关系。通过实体识别、关系抽取等算法,以确保每个实体和关系都能被准确地标识和理解。根据任务知识图谱中的实体和属性关系,匹配每个数据处理任务的初始提取逻辑。将图谱中的实体和关系映射到具体的数据处理任务中。明确每个数据处理任务的具体需求,然后根据这些需求从图谱中提取相关的实体和关系。对每个数据处理任务进行数据提取影响评分,评分过程通常涉及到对提取逻辑的准确性、完整性和效率的综合评估。通过模拟数据提取过程或者在真实数据集上运行提取逻辑,然后通过一系列量化指标(如准确率、召回率、响应时间等)来评估其性能。最后。根据数据提取影响评分值对初始提取逻辑进行优化,得到每个数据处理任务的数据提取逻辑。综合考虑评分结果和任务需求,对提取逻辑进行调整和改进。的优化措施包括调整实体识别的算法以提高准确率,重新定义实体间的关系以反映更加复杂或隐蔽的联系,或者优化查询策略以提高数据提取的效率和响应速度。这个过程需要多次迭代,每次都基于前一次的评分结果来调整和改进逻辑。
在一具体实施例中,执行步骤S104的过程可以具体包括如下步骤:
(1)查询待处理的报表生成请求,并对报表生成请求进行请求解析,得到目标请求地址;
(2)根据目标请求地址,确定报表生成请求对应的数据提取逻辑;
(3)根据数据提取逻辑,对报表生成请求进行数据分类,得到多个初始数据流;
(4)对多个初始数据流进行数据格式化与预处理,生成报表生成请求的多个待填充报表数据。
具体的,查询并识别出所有待处理的报表生成请求。这些请求来源于不同的用户或系统,包含了需要生成报表的具体需求。每个请求通常包含了目标请求地址,这决定了请求所对应的数据源和相关参数。为了处理这些请求,进行请求解析,从每个请求中提取出目标请求地址和其他相关信息,如请求的时间范围、数据分类等。根据目标请求地址,确定与之对应的数据提取逻辑。不同的请求地址对应不同的数据源,甚至不同类型的数据处理逻辑。例如,一个请求地址指向一个内部的销售数据库,而另一个则指向一个外部的市场研究报告。每种数据源都有其特定的数据结构和访问方式。根据数据提取逻辑,对报表生成请求进行数据分类。基于请求中的信息以及数据源的特性,将数据分成不同的类别,以便进行更有效的处理。例如,对于销售报表的生成请求,数据被分类为销售额、客户类型、地区等。完成数据分类后,进行数据格式化与预处理。数据格式化是指将不同数据源中的数据转换成一种统一的格式,以便于处理和展示。而预处理则包括清洗数据、处理缺失值、数据归一化等步骤,从而确保数据的质量和一致性。这些经过格式化和预处理的数据流将成为生成报表的基础。这些数据将根据报表模板和用户需求被填充到相应的报表中,生成最终的报表。
在一具体实施例中,执行步骤S105的过程可以具体包括如下步骤:
(1)获取预先配置的报表结构、报表布局和报表样式,并根据报表结构、报表布局和报表样式定义任务报表模板;
(2)计算每个待填充报表数据对应的数据相关性,并根据数据相关性确定对应的目标报表交互式元素;
(3)基于目标报表交互式元素分别对多个待填充报表数据进行报表数据填充和发布,得到初始在线报表。
具体的,获取预先配置的报表结构、报表布局和报表样式。这些配置是报表设计的基础,它们定义了报表的基本框架和视觉表现形式。报表结构涉及到数据如何组织和展示,例如是否按照时间序列、地理位置或其他维度来组织数据。报表布局则是指数据和图表如何在页面上排列,以及它们之间的空间关系。而报表样式则涉及到颜色方案、字体选择和其他视觉元素。计算每个待填充报表数据对应的数据相关性。数据相关性是指数据之间的关联程度和模式,这有助于确定报表中哪些信息应该被突出显示以及如何显示这些信息。例如,如果数据显示销售额和某项营销活动之间有强烈的相关性,那么这种关系应该在报表中被展示出来。计算数据相关性通常涉及到复杂的统计分析和数据挖掘技术,目的是找出数据中的重要模式和趋势。根据计算出的数据相关性,确定对应的目标报表交互式元素。这些交互式元素包括图表、滑块、下拉菜单等,它们不仅使报表的信息展示更加直观,还允许用户与报表进行交互,例如筛选特定的数据视图或深入了解某个数据点。基于目标报表交互式元素,对待填充报表数据进行填充和发布,从而生成初始在线报表。将处理过的数据按照报表模板中定义的结构和样式填充到报表中。数据填充不仅要确保数据的准确性和完整性,还要确保数据的展示方式与用户的期望和报表的设计目标一致。例如,系统会将销售数据以时间序列图的形式展示,同时提供一个交互式的元素,让用户可以选择查看不同时间段的销售趋势。完成填充后,报表将被发布为在线版本,用户可以通过网络访问这些报表,进行查看和交互。
在一具体实施例中,执行步骤S106的过程可以具体包括如下步骤:
(1)对初始在线报表的报表数据填充和发布过程进行异常检测,得到初始异常检测数据;
(2)对初始异常检测数据进行时序信息关联处理,得到时序异常检测数据;
(3)通过预置的循环变分自编码器对时序异常检测数据进行异常检测,得到目标填充和发布异常值集合;
(4)对目标填充和发布异常值集合进行编码映射,得到多个目标填充和发布异常编码值;
(5)对多个目标填充和发布异常编码值进行向量转换,生成目标填充和发布异常状态向量;
(6)将目标填充和发布异常状态向量输入预置的报表生成策略优化模型,其中,报表生成策略优化模型包括:多个决策树以及遗传算法层;
(7)通过多个决策树分别对目标填充和发布异常状态向量进行报表生成策略优化分析,得到每个决策树的第一报表优化策略;
(8)通过遗传算法层对每个决策树的第一报表优化策略进行群体初始化和策略优化,生成多个第二报表优化策略;
(9)对多个第二报表优化策略进行策略最优化求解,得到目标报表优化策略。
具体的,对初始在线报表的报表数据填充和发布过程进行异常检测,获取初始异常检测数据。识别出在数据填充和发布过程中出现的任何异常,如数据不一致、缺失或错误。异常检测可以通过各种统计方法和机器学习算法来实现,例如,使用标准差方法来识别数值异常,或使用分类算法来检测数据模式的偏差。获得初始异常检测数据后,对这些数据进行时序信息关联处理,以得到时序异常检测数据。通过考虑数据随时间变化的特性,理解数据异常的根本原因。例如,在财务报表中,某个季度的异常销售数字与前一个季度的市场活动密切相关。时序信息关联处理通常涉及到时间序列分析和模式识别技术。通过预置的循环变分自编码器(CVAE)对时序异常检测数据进行进一步的异常检测。CVAE是一种机器学习模型,它能够有效地处理和分析时间序列数据,在识别隐含模式和异常值方面表现出色。通过CVAE的分析,得到目标填充和发布异常值集合,这些集合代表了报表数据中最存在问题的部分。得到异常值集合后,对这些值进行编码映射,以得到目标填充和发布异常编码值。编码映射是一个将原始数据转换为更易于处理的格式的过程。例如,在编码映射过程中,将不同类型的异常值分配给不同的编码,以便更有效地进行后续分析。将这些异常编码值进行向量转换,生成目标填充和发布异常状态向量。向量转换是一个将数据转换为数学上可操作的形式的过程,它使得数据可以被用于各种算法和模型。通过这个过程,异常数据被转换为一组可以在机器学习模型中使用的数值向量。将异常状态向量输入到预置的报表生成策略优化模型中,该模型包括多个决策树和一个遗传算法层。决策树是一种常用的机器学习方法,它通过创建一系列基于特定条件的决策路径来分析数据。本实施例中,每个决策树将对异常状态向量进行分析,以生成第一报表优化策略。这些策略基于数据的特定特征和已知的异常模式,旨在识别最有效的数据处理和报表生成方法。通过遗传算法层对每个决策树生成的第一报表优化策略进行进一步的优化。遗传算法是一种模仿自然选择的优化技术,它通过模拟基因变异和交叉过程来迭代地改进解决方案。在这个过程中,每个决策树的策略被视为一个“个体”,通过组合和变异这些策略,得到一系列的改进方案。这个过程重复进行,直到找到最优的报表优化策略。对多个第二报表优化策略进行策略最优化求解,确定哪些策略最有效地解决了初始的异常问题,并优化了报表的整体质量和准确性。例如,如果系统识别出特定类型的数据常常导致异常,最优化策略包括对这类数据进行更加严格的验证和清洗。或者,如果发现某些数据模式在不同时间点表现不一致,策略涉及调整数据收集或处理的时间框架。
在一具体实施例中,执行步骤S107的过程可以具体包括如下步骤:
(1)根据目标报表优化策略和任务报表模板,分别对每个待填充报表数据进行优化处理,得到多个目标填充报表数据;
(2)对多个目标填充报表数据进行动态调整和报表可视化分析,生成多个待填充报表数据对应的可视化在线报表。
具体的,根据目标报表优化策略和任务报表模板对每个待填充报表数据进行优化处理,确保报表数据不仅准确无误,而且与报表的最终目标和格式紧密对应。报表优化策略包括多种元素,如数据清洗、错误修正、数据转换等,目的是改善数据的质量和适应性。同时,任务报表模板则定义了报表的结构和布局,它指导了数据如何在报表中展示。之后对多个目标填充报表数据进行动态调整和报表可视化分析。动态调整是指根据实时数据和用户反馈对报表内容进行更新和调整,确保报表能够反映最新的数据趋势和用户需求,提高了报表的实用性和互动性。报表可视化分析则涉及到将数据以图形和图表的形式展示出来,这不仅使得数据更容易理解,还能帮助用户发现数据中的模式和趋势。例如,系统会使用条形图来展示不同产品的销售量,或者使用热力图来显示销售热点区域。将这些经过动态调整和可视化分析的数据填充到相应的在线报表中。这些报表是交互式的,允许用户根据自己的需求进行探索和分析。
上面对本申请实施例中报表的生成方法进行了描述,下面对本申请实施例中报表的生成装置进行描述,请参阅图2,本申请实施例中报表的生成装置一个实施例包括:
获取模块201,用于获取多个内部数据源并通过所述多个内部数据源构建内部数据仓库,同时,获取多个外部数据源并通过所述多个外部数据源构建外部数据仓库;
处理模块202,用于获取多个数据处理任务,并根据所述内部数据仓库和所述外部数据仓库生成每个数据处理任务的任务知识图谱;
创建模块203,用于获取所述任务知识图谱的任务实体以及属性关系,并根据所述任务实体以及所述属性关系创建每个数据处理任务的数据提取逻辑;
查询模块204,用于查询待处理的报表生成请求,并根据所述数据提取逻辑生成所述报表生成请求的多个待填充报表数据;
计算模块205,用于根据预置的任务报表模板计算每个待填充报表数据的目标报表交互式元素,并基于所述目标报表交互式元素分别对所述多个待填充报表数据进行报表数据填充和发布,得到初始在线报表;
分析模块206,用于对所述初始在线报表的报表数据填充和发布过程进行异常检测,得到目标填充和发布异常值集合,并将所述目标填充和发布异常值集合输入预置的报表生成策略优化模型进行报表生成策略优化分析,得到目标报表优化策略;
生成模块207,用于根据所述目标报表优化策略和所述任务报表模板生成所述多个待填充报表数据对应的可视化在线报表。
通过上述各个组成部分的协同合作,通过获取和整合多个内部和外部数据源,构建了内部和外部数据仓库,有助于实现数据的集中管理和统一访问,提高了数据的可用性和一致性。通过生成任务知识图谱和数据提取逻辑,实现了对数据处理任务的自动化描述和规划,提高了数据处理的效率和准确性。根据预置的任务报表模板动态生成报表,根据数据的变化自动调整报表内容,使报表生成更加灵活和自适应。通过异常检测和报表生成策略优化,能够及时识别和处理数据异常,提高了报表的可信度和数据质量。通过计算目标报表交互式元素,生成可视化在线报表,增强了报表的可读性和用户体验,使决策者更容易理解数据。减少了手动数据处理和报表生成的工作量,提高了效率,降低了人工错误的风险。根据不同的任务需求和数据源特点,定制报表生成流程和规则,满足各种业务场景的需求。通过自动化生成高质量的报表,有助于企业更好地进行数据分析,支持决策制定和战略规划,进而实现了在线报表的智能生成并提高了报表的生成准确率。
本申请还提供一种报表的生成设备,所述报表的生成设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述报表的生成方法的步骤。
本申请还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述报表的生成方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,系统和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random acceS memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种报表的生成方法,其特征在于,所述报表的生成方法包括:
获取多个内部数据源并通过所述多个内部数据源构建内部数据仓库,同时,获取多个外部数据源并通过所述多个外部数据源构建外部数据仓库;
获取多个数据处理任务,并根据所述内部数据仓库和所述外部数据仓库生成每个数据处理任务的任务知识图谱;
获取所述任务知识图谱的任务实体以及属性关系,并根据所述任务实体以及所述属性关系创建每个数据处理任务的数据提取逻辑;
查询待处理的报表生成请求,并根据所述数据提取逻辑生成所述报表生成请求的多个待填充报表数据;
根据预置的任务报表模板计算每个待填充报表数据的目标报表交互式元素,并基于所述目标报表交互式元素分别对所述多个待填充报表数据进行报表数据填充和发布,得到初始在线报表;
对所述初始在线报表的报表数据填充和发布过程进行异常检测,得到目标填充和发布异常值集合,并将所述目标填充和发布异常值集合输入预置的报表生成策略优化模型进行报表生成策略优化分析,得到目标报表优化策略;
根据所述目标报表优化策略和所述任务报表模板生成所述多个待填充报表数据对应的可视化在线报表。
2.根据权利要求1所述的报表的生成方法,其特征在于,所述获取多个数据处理任务,并根据所述内部数据仓库和所述外部数据仓库生成每个数据处理任务的任务知识图谱,包括:
获取多个数据处理任务,并对每个数据处理任务进行数据处理特征分析,得到每个数据处理任务的数据处理特征集合;
根据每个数据处理任务的数据处理特征集合,对所述内部数据仓库与所述外部数据仓库进行关系强度分析,得到目标关系强度数据;
根据所述目标关系强度数据,并采用图数据库算法分别生成每个数据处理任务的任务知识图谱。
3.根据权利要求1所述的报表的生成方法,其特征在于,所述获取所述任务知识图谱的任务实体以及属性关系,并根据所述任务实体以及所述属性关系创建每个数据处理任务的数据提取逻辑,包括:
对所述任务知识图谱进行实体和关系解析,得到任务实体以及属性关系;
根据所述任务实体以及所述属性关系,分别匹配每个数据处理任务的初始提取逻辑;
根据所述初始提取逻辑对每个数据处理任务进行数据提取影响评分,得到所述初始提取逻辑的数据提取影响评分值;
根据所述数据提取影响评分值对所述初始提取逻辑进行提取逻辑优化,得到每个数据处理任务的数据提取逻辑。
4.根据权利要求1所述的报表的生成方法,其特征在于,所述查询待处理的报表生成请求,并根据所述数据提取逻辑生成所述报表生成请求的多个待填充报表数据,包括:
查询待处理的报表生成请求,并对所述报表生成请求进行请求解析,得到目标请求地址;
根据所述目标请求地址,确定所述报表生成请求对应的数据提取逻辑;
根据所述数据提取逻辑,对所述报表生成请求进行数据分类,得到多个初始数据流;
对所述多个初始数据流进行数据格式化与预处理,生成所述报表生成请求的多个待填充报表数据。
5.根据权利要求1所述的报表的生成方法,其特征在于,所述根据预置的任务报表模板计算每个待填充报表数据的目标报表交互式元素,并基于所述目标报表交互式元素分别对所述多个待填充报表数据进行报表数据填充和发布,得到初始在线报表,包括:
获取预先配置的报表结构、报表布局和报表样式,并根据所述报表结构、所述报表布局和所述报表样式定义任务报表模板;
计算每个待填充报表数据对应的数据相关性,并根据所述数据相关性确定对应的目标报表交互式元素;
基于所述目标报表交互式元素分别对所述多个待填充报表数据进行报表数据填充和发布,得到初始在线报表。
6.根据权利要求1所述的报表的生成方法,其特征在于,所述对所述初始在线报表的报表数据填充和发布过程进行异常检测,得到目标填充和发布异常值集合,并将所述目标填充和发布异常值集合输入预置的报表生成策略优化模型进行报表生成策略优化分析,得到目标报表优化策略,包括:
对所述初始在线报表的报表数据填充和发布过程进行异常检测,得到初始异常检测数据;
对所述初始异常检测数据进行时序信息关联处理,得到时序异常检测数据;
通过预置的循环变分自编码器对所述时序异常检测数据进行异常检测,得到目标填充和发布异常值集合;
对所述目标填充和发布异常值集合进行编码映射,得到多个目标填充和发布异常编码值;
对所述多个目标填充和发布异常编码值进行向量转换,生成目标填充和发布异常状态向量;
将所述目标填充和发布异常状态向量输入预置的报表生成策略优化模型,其中,所述报表生成策略优化模型包括:多个决策树以及遗传算法层;
通过所述多个决策树分别对所述目标填充和发布异常状态向量进行报表生成策略优化分析,得到每个决策树的第一报表优化策略;
通过所述遗传算法层对每个决策树的第一报表优化策略进行群体初始化和策略优化,生成多个第二报表优化策略;
对所述多个第二报表优化策略进行策略最优化求解,得到目标报表优化策略。
7.根据权利要求1所述的报表的生成方法,其特征在于,所述根据所述目标报表优化策略和所述任务报表模板生成所述多个待填充报表数据对应的可视化在线报表,包括:
根据所述目标报表优化策略和所述任务报表模板,分别对每个待填充报表数据进行优化处理,得到多个目标填充报表数据;
对所述多个目标填充报表数据进行动态调整和报表可视化分析,生成所述多个待填充报表数据对应的可视化在线报表。
8.一种报表的生成装置,其特征在于,所述报表的生成装置包括:
获取模块,用于获取多个内部数据源并通过所述多个内部数据源构建内部数据仓库,同时,获取多个外部数据源并通过所述多个外部数据源构建外部数据仓库;
处理模块,用于获取多个数据处理任务,并根据所述内部数据仓库和所述外部数据仓库生成每个数据处理任务的任务知识图谱;
创建模块,用于获取所述任务知识图谱的任务实体以及属性关系,并根据所述任务实体以及所述属性关系创建每个数据处理任务的数据提取逻辑;
查询模块,用于查询待处理的报表生成请求,并根据所述数据提取逻辑生成所述报表生成请求的多个待填充报表数据;
计算模块,用于根据预置的任务报表模板计算每个待填充报表数据的目标报表交互式元素,并基于所述目标报表交互式元素分别对所述多个待填充报表数据进行报表数据填充和发布,得到初始在线报表;
分析模块,用于对所述初始在线报表的报表数据填充和发布过程进行异常检测,得到目标填充和发布异常值集合,并将所述目标填充和发布异常值集合输入预置的报表生成策略优化模型进行报表生成策略优化分析,得到目标报表优化策略;
生成模块,用于根据所述目标报表优化策略和所述任务报表模板生成所述多个待填充报表数据对应的可视化在线报表。
9.一种报表的生成设备,其特征在于,所述报表的生成设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述报表的生成设备执行如权利要求1-7中任一项所述的报表的生成方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述的报表的生成方法。
CN202410229996.7A 2024-02-29 2024-02-29 报表的生成方法、装置、设备及存储介质 Pending CN118012916A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410229996.7A CN118012916A (zh) 2024-02-29 2024-02-29 报表的生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410229996.7A CN118012916A (zh) 2024-02-29 2024-02-29 报表的生成方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN118012916A true CN118012916A (zh) 2024-05-10

Family

ID=90953723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410229996.7A Pending CN118012916A (zh) 2024-02-29 2024-02-29 报表的生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN118012916A (zh)

Similar Documents

Publication Publication Date Title
US10977293B2 (en) Technology incident management platform
US11327935B2 (en) Intelligent data quality
US20240070487A1 (en) Systems and methods for enriching modeling tools and infrastructure with semantics
Begoli et al. Design principles for effective knowledge discovery from big data
US20070156787A1 (en) Apparatus and method for strategy map validation and visualization
US20070021992A1 (en) Method and system for generating a business intelligence system based on individual life cycles within a business process
US20100179951A1 (en) Systems and methods for mapping enterprise data
US20150134401A1 (en) In-memory end-to-end process of predictive analytics
US11893341B2 (en) Domain-specific language interpreter and interactive visual interface for rapid screening
US10289704B1 (en) Method and system for implementing categorically organized relationship effects
US10586169B2 (en) Common feature protocol for collaborative machine learning
CN118012916A (zh) 报表的生成方法、装置、设备及存储介质
US20140149186A1 (en) Method and system of using artifacts to identify elements of a component business model
US8374897B2 (en) Apparatus and method for forecasting qualitative assessments
WO2021240370A1 (en) Domain-specific language interpreter and interactive visual interface for rapid screening
Oberhauser Rethinking Enterprise Architecture Frameworks for the Digital Age: The Digital Diamond Framework and EA Tool
Alspaugh Understanding Data Analysis Activity via Log Analysis
Rana et al. A Study of Business Insight Tool using Big Data Analytics
CN113486630B (zh) 一种供应链数据向量化和可视化处理方法及装置
Oosten On the need and value of trace link recovery in Model-Driven Development
Louhi An empirical study on feature data management practices and challenges
CN118260698A (zh) 基于动态表单对工业数据分析方法及系统
Liljeström et al. BUSINESS INTELLIGENCE–ENABLING SELF-SERVICE
CN116305378A (zh) 一种快速开发评分卡、策略树和融合模型的建模系统
CN117971947A (zh) 一种基于用户端多源数据贯通与业务融合的系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination