CN117077635A - 报表文件生成方法、装置、计算机设备和存储介质 - Google Patents

报表文件生成方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN117077635A
CN117077635A CN202310808376.4A CN202310808376A CN117077635A CN 117077635 A CN117077635 A CN 117077635A CN 202310808376 A CN202310808376 A CN 202310808376A CN 117077635 A CN117077635 A CN 117077635A
Authority
CN
China
Prior art keywords
data
file
information data
report
fixed index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310808376.4A
Other languages
English (en)
Inventor
董宏越
朱阿龙
田林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202310808376.4A priority Critical patent/CN117077635A/zh
Publication of CN117077635A publication Critical patent/CN117077635A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种报表文件生成方法、装置、计算机设备和存储介质。方法包括:获取数据文件生成请求;根据文件标识,获取文件参数信息;根据文件参数信息,通过查询接口得到各类型信息数据,其中,各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据;通过k‑平均聚类算法,将基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件。采用本方案能够提高报表生成效率。

Description

报表文件生成方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种报表文件生成方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
报表用于为管理系统的各级使用者生成各类口径的统计报表,在各种企业级管理系统的开发中,报表是其中一个必不可少的功能,主要供给用户分析决策使用。然而,由于报表组件对接第三方产品数量庞大,且每个对接产品均有大量的报表加工需求,传统的批量程序无法满足大数据量的批量文件加工需求。
传统的报表生成方法需要针对每一个报表进行相应的完整的程序开发,每新增一个报表就需要新增一整套代码。
所以,传统的报表生成方法的效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种高效的报表文件生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种报表文件生成方法。所述方法包括:
获取数据文件生成请求,所述数据文件生成请求中携带有文件标识;
根据所述文件标识,获取文件参数信息;
根据所述文件参数信息,通过查询接口得到各类型信息数据,其中,所述各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据,所述基础信息数据用于表征报表文件公有字段数据;所述固定指标数据用于表征不同类型报表文件固定字段数据;所述控制信息数据用于表征报表文件检验字段数据;
通过k-平均聚类算法,将所述基础信息数据、所述固定指标数据、以及所述控制信息数据进行聚类组合处理,生成报表文件。
在其中一个实施例中,报表文件生成方法还包括:
采用朴素贝叶斯分类方法,将所述基础信息数据、所述固定指标数据、以及所述控制信息数据进行分组;
通过k-平均聚类算法,将分组的数据进行基于相似度的聚类组合处理,生成报表文件。
在其中一个实施例中,所述根据所述文件参数信息,通过查询接口得到各类型信息数据包括:
将所述文件参数信息输入到预设启动脚本中;
执行所述预设启动脚本,通过查询接口得到各类型信息数据。
在其中一个实施例中,所述执行所述预设启动脚本,通过查询接口得到各类型信息数据包括:
执行所述预设启动脚本,根据所述文件参数信息,生成查询文件,所述查询文件中包括多个查询语句;
执行所述多个查询语句,通过查询接口得到各类型信息数据。
在其中一个实施例中,报表文件生成方法还包括:
若生成的报表文件字节数大于预设字节阈值,则根据预设字节阈值将所述报表文件进行拆分;
将拆分后的文件压缩存储至预设指定目录下。
在其中一个实施例中,所述数据文件生成请求中携带权限信息,所述权限信息与所述固定指标数据之间存在预设映射关系;
所述通过k-平均聚类算法,将所述基础信息数据、所述固定指标数据、以及所述控制信息数据进行聚类组合处理,生成报表文件包括:
获取与权限信息映射对应的固定指标数据;
通过k-平均聚类算法,将所述基础信息数据、所述与权限信息映射对应的固定指标数据、以及所述控制信息数据组合,生成报表文件。
第二方面,本申请还提供了一种报表文件生成装置。所述装置包括:
请求获取模块,用于获取数据文件生成请求,所述数据文件生成请求中携带有文件标识;
参数获取模块,用于根据所述文件标识,获取文件参数信息;
数据获取模块,用于根据所述文件参数信息,通过查询接口得到各类型信息数据,其中,所述各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据,所述基础信息数据用于表征报表文件公有字段数据;所述固定指标数据用于表征不同类型报表文件固定字段数据;所述控制信息数据用于表征报表文件检验字段数据;
文件生成模块,用于通过k-平均聚类算法,将所述基础信息数据、所述固定指标数据、以及所述控制信息数据进行聚类组合处理,生成报表文件。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取数据文件生成请求,所述数据文件生成请求中携带有文件标识;
根据所述文件标识,获取文件参数信息;
根据所述文件参数信息,通过查询接口得到各类型信息数据,其中,所述各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据,所述基础信息数据用于表征报表文件公有字段数据;所述固定指标数据用于表征不同类型报表文件固定字段数据;所述控制信息数据用于表征报表文件检验字段数据;
通过k-平均聚类算法,将所述基础信息数据、所述固定指标数据、以及所述控制信息数据进行聚类组合处理,生成报表文件。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取数据文件生成请求,所述数据文件生成请求中携带有文件标识;
根据所述文件标识,获取文件参数信息;
根据所述文件参数信息,通过查询接口得到各类型信息数据,其中,所述各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据,所述基础信息数据用于表征报表文件公有字段数据;所述固定指标数据用于表征不同类型报表文件固定字段数据;所述控制信息数据用于表征报表文件检验字段数据;
通过k-平均聚类算法,将所述基础信息数据、所述固定指标数据、以及所述控制信息数据进行聚类组合处理,生成报表文件。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取数据文件生成请求,所述数据文件生成请求中携带有文件标识;
根据所述文件标识,获取文件参数信息;
根据所述文件参数信息,通过查询接口得到各类型信息数据,其中,所述各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据,所述基础信息数据用于表征报表文件公有字段数据;所述固定指标数据用于表征不同类型报表文件固定字段数据;所述控制信息数据用于表征报表文件检验字段数据;
通过k-平均聚类算法,将所述基础信息数据、所述固定指标数据、以及所述控制信息数据进行聚类组合处理,生成报表文件。
上述报表文件生成方法、装置、计算机设备、存储介质和计算机程序产品,获取数据文件生成请求,数据文件生成请求中携带有文件标识;根据文件标识,获取文件参数信息;根据所述的文件参数信息,通过查询接口得到各类型信息数据,其中,各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据;通过k-平均聚类算法,将基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件。本方案中,通过k-平均聚类算法,将基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件,能使相似的数据组合在一起,同时减少数据获取次数,无需为获取不同的报表执行不同的代码,提高报表生成效率。
附图说明
图1为一个实施例中报表文件生成方法的应用环境图;
图2为一个实施例中报表文件生成方法的流程示意图;
图3为另一个实施例中报表文件生成方法的流程示意图;
图4为一个实施例中报表文件生成装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的报表文件生成方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。其中,用户在终端102侧进行操作,终端102生成数据文件生成请求,并将数据文件生成请求发送至服务器104,服务器104接收数据文件生成请求,数据文件生成请求中携带有文件标识,根据文件标识,获取文件参数信息,根据文件参数信息,通过查询接口得到各类型信息数据,通过k-平均聚类算法,将基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种报表文件生成方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
S200,获取数据文件生成请求。
其中,数据文件生成请求是根据用户输入的报表文件生成命令生成的请求,可以根据报表文件生成请求,发起生成报表文件。
具体地,用户在报表文件生成系统中选择需要生成文件的类型,每一种报表文件类型都有对应唯一标识,其中,用户可以在文本框选择需要生成的报表文件类型,也可以直接在文本框直接输入文件标识,发送报表文件生成命令给服务器,生成数据文件生成请求,服务器中加载的报表文件生成系统获取数据文件生成请求,提取该请求中携带文件标识。
S400,根据文件标识,获取文件参数信息。
其中,文件标识是用来识别要生成文件的类型,其中文件标识可以是文件编号、符号等;文件参数信息是输入到文件生成程序模块中的参数信息,通过将文件参数输入到文件生成程序模块中,可以得到各类型信息数据。
具体地,文件生成系统获取数据文件生成请求,提取数据文件生成请求中携带有文件标识,获取要生成文件对应的参数信息,其中,参数信息可以包括报表文件编号、数据日期、报表文件名称等。
S600,根据文件参数信息,通过查询接口得到各类型信息数据。
其中,各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据,基础信息数据用于表征报表文件公有字段数据;固定指标数据用于表征不同类型报表文件固定字段数据;控制信息数据用于表征报表文件检验字段数据;进一步的,基础信息数据可以包括日期信息(年、月、日、旬、周)、银行号、机构号、数据统计日期、数据来源等,固定指标数据可以包括客户交易明细报表中的客户姓名、客户号、交易类型、交易时间等,控制信息数据可以包括报表文件总数、报表文件序号、记录数、周期标识等。
具体地,将文件参数信息输入到文件生成程序中,其中,文件生成程序可以是Scala程序,它由基础信息数据生成模块、固定指标数据生成模块、以及控制信息数据生成模块构成,相应的文件参数信息会输入到对应不同文件生成程序模块中,例如,可以将报表文件编号数据输入到基础信息数据生成模块中,得到基础信息数据,可以将报表文件名称输入到固定指标数据生成模块中,得到固定指标数据。
S800,通过k-平均聚类算法,将基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件。
其中,k-平均聚类算法是一种迭代求解的聚类分析算法,其步骤是,预将数据分为k组,则随机选取k个数据对象作为初始的聚类中心,然后计算每个数据对象与各个初始聚类中心之间的距离,把每个数据对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。
具体地,先调用基础信息数据生成模块和固定指标数据生成模块,得到基础信息数据和固定指标数据,二者为报表正文信息,然后调用控制信息生成模块生成报表数据文件的控制信息数据,再通过k-平均聚类算法,将得到的基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件。
上述报表文件生成方法中,通过获取数据文件生成请求,根据文件标识,获取文件参数信息,根据文件参数信息,通过查询接口得到各类型信息数据,通过k-平均聚类算法,将基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件,能使相似的数据组合在一起,同时减少数据获取次数,无需为获取不同的报表执行不同的代码,提高报表生成效率。
在一个实施例中,报表文件生成方法还包括:
采用朴素贝叶斯分类方法,将基础信息数据、固定指标数据、以及控制信息数据进行分组;通过k-平均聚类算法,将分组的数据进行基于相似度的聚类组合处理,生成报表文件。
具体地,采用朴素贝叶斯分类方法对从数据库获取的基础信息数据、固定指标数据、以及控制信息数据进行先分组,不同类型的数据属于不同的分组,例如,基础信息数据可以分为一个组、固定指标数据可以分为一个组等,通过k-平均聚类算法,将分组的数据进行基于相似度的聚类组合处理,生成报表文件,其中,每组的数据通过相似性度量分为多个簇,每一个簇中的数据具有较高的相似度。
本实施例中,通过采用朴素贝叶斯分类方法,将基础信息数据、固定指标数据、以及控制信息数据进行分组,通过k-平均聚类算法,将分组的数据进行基于相似度的聚类组合处理,能通过k-平均聚类算法进行聚类组合处理,以生成报表文件。
在一个实施例中,如图3所示,S600包括:
S620,将文件参数信息输入到预设启动脚本中。
S640,执行预设启动脚本,通过查询接口得到各类型信息数据。
具体地,预设启动脚本主要接收报表文件编号、报表文件名称、数据日期、频率等文件参数信息,将文件参数信息输入到预设启动脚本后,执行预设启动脚本,启动文件生成程序,其中,基础信息数据生成模块根据文件参数信息,通过查询接口查询能得到报表调度信息、数据来源、银行号下发机构号等基础信息数据,固定指标数据生成模块根据文件参数信息,通过查询接口查询能得到对应业务固定指标数据;根据基础信息数据和固定指标数据计算报表文件的记录数、文件数量等信息,得到控制信息数据。
本实施例中,通过将文件参数信息输入到预设启动脚本中,执行预设启动脚本,通过查询接口得到各类型信息数据,能根据查询得到的各类型信息数据,生成报表文件。
在一个实施例中,执行预设启动脚本,通过查询接口得到各类型信息数据包括:
执行预设启动脚本,根据文件参数信息,生成查询文件,查询文件中包括多个查询语句;执行多个查询语句,通过查询接口得到各类型信息数据。
具体地,通过报表文件生成系统中使用的数据库持久层框架构建查询文件,查询文件可以为多个也可以为一个,一般是按照一张数据库表对应一个查询文件设置。根据报表的需求,根据文件参数信息,构建若干查询语句,并将若干查询语句插入至查询文件中,执行查询文件中的查询语句,通过查询接口得到基础信息数据、固定指标数据、以及控制信息数据。
本实施例中,通过执行预设启动脚本,根据文件参数信息,生成查询文件,查询文件中包括多个查询语句,执行多个查询语句,通过查询接口得到各类型信息数据,能根据生成的查询文件中的查询语句,从数据库得到各类型信息数据,以根据各类型信息数据,生成报表文件。
在一个实施例中,报表文件生成方法还包括:
若生成的报表文件字节数大于预设字节阈值,则根据预设字节阈值将报表文件进行拆分;将拆分后的文件压缩存储至预设指定目录下。
具体地,将报表文件字节数与预设字节阈值比较,若生成的报表文件字节数大于预设字节阈值,则根据预设字节阈值将报表文件进行拆分,例如,生成的报表文件字节大小为4GB,预设字节阈值为1GB,此时,报表文件的字节数大于预设字节阈值,要将报表文件拆分为4个1GB大小的报表文件;将拆分后的文件打包压缩,压缩完成后存储至预设指定目录下。
本实施例中,通过若生成的报表文件字节数大于预设字节阈值,则根据预设字节阈值将报表文件进行拆分,将拆分后的文件压缩存储至预设指定目录下,能通过拆分,提高文件压缩、传输等处理的效率。
在一个实施例中,通过k-平均聚类算法,将基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件包括:
获取与权限信息映射对应的固定指标数据;通过k-平均聚类算法,将基础信息数据、与权限信息映射对应的固定指标数据、以及控制信息数据组合,生成报表文件。
具体地,获取服务器发送的文件生成请求中携带权限信息,权限信息与固定指标数据之间存在预设映射关系,即不用的用户所得到的固定指标数据不同,得到的文件报表也不同,通过k-平均聚类算法,将基础信息数据、与权限信息映射对应的固定指标数据、以及控制信息数据组合,生成报表文件。
本实施例中,通过获取与权限信息映射对应的固定指标数据,通过k-平均聚类算法,将基础信息数据、与权限信息映射对应的固定指标数据、以及控制信息数据组合,生成报表文件,能根据预设映射关系,为不同的用户设置对应的权限,以得到对应的固定指标数据。
为详细说明本申请报表文件生成方法的技术方案及其效果,下面将采用具体应用实例展开描述。在实际应用中,整个报表文件生成方法包括以下步骤:
步骤一:获取数据文件生成请求,数据文件生成请求中携带有文件标识。
步骤二:根据文件标识,获取文件参数信息。
步骤三:根据文件参数信息,通过查询接口得到各类型信息数据,其中,各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据,基础信息数据用于表征报表文件公有字段数据;固定指标数据用于表征不同类型报表文件固定字段数据;控制信息数据用于表征报表文件检验字段数据。具体包括以下步骤:
(1)将文件参数信息输入到预设启动脚本中。
(2)执行预设启动脚本,根据文件参数信息,生成查询文件,查询文件中包括多个查询语句。
(3)执行多个查询语句,通过查询接口得到各类型信息数据。
步骤四:采用朴素贝叶斯分类方法,将基础信息数据、固定指标数据、以及控制信息数据进行分组。
步骤五:通过k-平均聚类算法,将分组的数据进行基于相似度的聚类组合处理,生成报表文件。具体包括以下步骤:
(1)获取与权限信息映射对应的固定指标数据。
(2)通过k-平均聚类算法,将基础信息数据、与权限信息映射对应的固定指标数据、以及控制信息数据组合,生成报表文件。
步骤六:若生成的报表文件字节数大于预设字节阈值,则根据预设字节阈值将报表文件进行拆分;将拆分后的文件压缩存储至预设指定目录下。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的报表文件生成方法的报表文件生成装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个报表文件生成装置实施例中的具体限定可以参见上文中对于报表文件生成方法的限定,在此不再赘述。
在一个实施例中,如图4所示,提供了一种报表文件生成装置,包括:请求获取模块200、参数获取模块400、数据获取模块600和文件生成模块800,其中:
请求获取模块200,用于获取数据文件生成请求,数据文件生成请求中携带有文件标识;
参数获取模块400,用于根据文件标识,获取文件参数信息;
数据获取模块600,用于根据文件参数信息,通过查询接口得到各类型信息数据,其中,各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据,基础信息数据用于表征报表文件公有字段数据;固定指标数据用于表征不同类型报表文件固定字段数据;控制信息数据用于表征报表文件检验字段数据;
文件生成模块800,用于通过k-平均聚类算法,将基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件。
在一个实施例中,报表文件生成装置还包括组合模块,用于采用朴素贝叶斯分类方法,将基础信息数据、固定指标数据、以及控制信息数据进行分组;通过k-平均聚类算法,将分组的数据进行基于相似度的聚类组合处理,生成报表文件。
在一个实施例中,数据获取模块600还用于将文件参数信息输入到预设启动脚本中;执行预设启动脚本,通过查询接口得到各类型信息数据。
在一个实施例中,数据获取模块600还用于执行预设启动脚本,根据文件参数信息,生成查询文件,查询文件中包括多个查询语句;执行多个查询语句,通过查询接口得到各类型信息数据。
在一个实施例中,报表文件生成装置还包括拆分模块,用于若生成的报表文件字节数大于预设字节阈值,则根据预设字节阈值将报表文件进行拆分;将拆分后的文件压缩存储至预设指定目录下。
在一个实施例中,文件生成模块800还用于获取与权限信息映射对应的固定指标数据;通过k-平均聚类算法,将基础信息数据、与权限信息映射对应的固定指标数据、以及控制信息数据组合,生成报表文件。
上述报表文件生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文件数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种报表文件生成方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取数据文件生成请求,数据文件生成请求中携带有文件标识;根据文件标识,获取文件参数信息;根据文件参数信息,通过查询接口得到各类型信息数据,其中,各类型信息数据包括基础信息数据、固定指标数据、控制信息数据,基础信息数据用于表征报表文件公有字段数据;固定指标数据用于表征不同类型报表文件固定字段数据;控制信息数据用于表征报表文件检验字段数据;通过k-平均聚类算法,将基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
采用朴素贝叶斯分类方法,将基础信息数据、固定指标数据、以及控制信息数据进行分组;通过k-平均聚类算法,将分组的数据进行基于相似度的聚类组合处理,生成报表文件。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将文件参数信息输入到预设启动脚本中;执行预设启动脚本,通过查询接口得到各类型信息数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
执行预设启动脚本,根据文件参数信息,生成查询文件,查询文件中包括多个查询语句;执行多个查询语句,通过查询接口得到各类型信息数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若生成的报表文件字节数大于预设字节阈值,则根据预设字节阈值将报表文件进行拆分;将拆分后的文件压缩存储至预设指定目录下。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取与权限信息映射对应的固定指标数据;通过k-平均聚类算法,将基础信息数据、与权限信息映射对应的固定指标数据、以及控制信息数据组合,生成报表文件。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取数据文件生成请求,数据文件生成请求中携带有文件标识;根据文件标识,获取文件参数信息;根据文件参数信息,通过查询接口得到各类型信息数据,其中,各类型信息数据包括基础信息数据、固定指标数据、控制信息数据,基础信息数据用于表征报表文件公有字段数据;固定指标数据用于表征不同类型报表文件固定字段数据;控制信息数据用于表征报表文件检验字段数据;通过k-平均聚类算法,将基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
采用朴素贝叶斯分类方法,将基础信息数据、固定指标数据、以及控制信息数据进行分组;通过k-平均聚类算法,将分组的数据进行基于相似度的聚类组合处理,生成报表文件。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将文件参数信息输入到预设启动脚本中;执行预设启动脚本,通过查询接口得到各类型信息数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
执行预设启动脚本,根据文件参数信息,生成查询文件,查询文件中包括多个查询语句;执行多个查询语句,通过查询接口得到各类型信息数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若生成的报表文件字节数大于预设字节阈值,则根据预设字节阈值将报表文件进行拆分;将拆分后的文件压缩存储至预设指定目录下。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取与权限信息映射对应的固定指标数据;通过k-平均聚类算法,将基础信息数据、与权限信息映射对应的固定指标数据、以及控制信息数据组合,生成报表文件。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取数据文件生成请求,数据文件生成请求中携带有文件标识;根据文件标识,获取文件参数信息;根据文件参数信息,通过查询接口得到各类型信息数据,其中,各类型信息数据包括基础信息数据、固定指标数据、控制信息数据,基础信息数据用于表征报表文件公有字段数据;固定指标数据用于表征不同类型报表文件固定字段数据;控制信息数据用于表征报表文件检验字段数据;通过k-平均聚类算法,将基础信息数据、固定指标数据、以及控制信息数据进行聚类组合处理,生成报表文件。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
采用朴素贝叶斯分类方法,将基础信息数据、固定指标数据、以及控制信息数据进行分组;通过k-平均聚类算法,将分组的数据进行基于相似度的聚类组合处理,生成报表文件。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将文件参数信息输入到预设启动脚本中;执行预设启动脚本,通过查询接口得到各类型信息数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
执行预设启动脚本,根据文件参数信息,生成查询文件,查询文件中包括多个查询语句;执行多个查询语句,通过查询接口得到各类型信息数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若生成的报表文件字节数大于预设字节阈值,则根据预设字节阈值将报表文件进行拆分;将拆分后的文件压缩存储至预设指定目录下。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取与权限信息映射对应的固定指标数据;通过k-平均聚类算法,将基础信息数据、与权限信息映射对应的固定指标数据、以及控制信息数据组合,生成报表文件。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种报表文件生成方法,其特征在于,所述方法包括:
获取数据文件生成请求,所述数据文件生成请求中携带有文件标识;
根据所述文件标识,获取文件参数信息;
根据所述文件参数信息,通过查询接口得到各类型信息数据,其中,所述各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据,所述基础信息数据用于表征报表文件公有字段数据;所述固定指标数据用于表征不同类型报表文件固定字段数据;所述控制信息数据用于表征报表文件检验字段数据;
通过k-平均聚类算法,将所述基础信息数据、所述固定指标数据、以及所述控制信息数据进行聚类组合处理,生成报表文件。
2.根据权利要求1所述的方法,其特征在于,还包括:
采用朴素贝叶斯分类方法,将所述基础信息数据、所述固定指标数据、以及所述控制信息数据进行分组;
通过k-平均聚类算法,将分组的数据进行基于相似度的聚类组合处理,生成报表文件。
3.根据权利要求1所述的方法,其特征在于,所述根据所述文件参数信息,通过查询接口得到各类型信息数据包括:
将所述文件参数信息输入到预设启动脚本中;
执行所述预设启动脚本,通过查询接口得到各类型信息数据。
4.根据权利要求3所述的方法,其特征在于,所述执行所述预设启动脚本,通过查询接口得到各类型信息数据包括:
执行所述预设启动脚本,根据所述文件参数信息,生成查询文件,所述查询文件中包括多个查询语句;
执行所述多个查询语句,通过查询接口得到各类型信息数据。
5.根据权利要求1所述的方法,其特征在于,还包括:
若生成的报表文件字节数大于预设字节阈值,则根据预设字节阈值将所述报表文件进行拆分;
将拆分后的文件压缩存储至预设指定目录下。
6.根据权利要求1所述的方法,其特征在于,所述数据文件生成请求中携带权限信息,所述权限信息与所述固定指标数据之间存在预设映射关系;
所述通过k-平均聚类算法,将所述基础信息数据、所述固定指标数据、以及所述控制信息数据进行聚类组合处理,生成报表文件包括:
获取与权限信息映射对应的固定指标数据;
通过k-平均聚类算法,将所述基础信息数据、所述与权限信息映射对应的固定指标数据、以及所述控制信息数据组合,生成报表文件。
7.一种报表文件生成装置,其特征在于,所述装置包括:
请求获取模块,用于获取数据文件生成请求,所述数据文件生成请求中携带有文件标识;
参数获取模块,用于根据所述文件标识,获取文件参数信息;
数据获取模块,用于根据所述文件参数信息,通过查询接口得到各类型信息数据,其中,所述各类型信息数据包括基础信息数据、固定指标数据、以及控制信息数据,所述基础信息数据用于表征报表文件公有字段数据;所述固定指标数据用于表征不同类型报表文件固定字段数据;所述控制信息数据用于表征报表文件检验字段数据;
文件生成模块,用于通过k-平均聚类算法,将所述基础信息数据、所述固定指标数据、以及所述控制信息数据进行聚类组合处理,生成报表文件。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202310808376.4A 2023-07-03 2023-07-03 报表文件生成方法、装置、计算机设备和存储介质 Pending CN117077635A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310808376.4A CN117077635A (zh) 2023-07-03 2023-07-03 报表文件生成方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310808376.4A CN117077635A (zh) 2023-07-03 2023-07-03 报表文件生成方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN117077635A true CN117077635A (zh) 2023-11-17

Family

ID=88715981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310808376.4A Pending CN117077635A (zh) 2023-07-03 2023-07-03 报表文件生成方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN117077635A (zh)

Similar Documents

Publication Publication Date Title
US10726356B1 (en) Target variable distribution-based acceptance of machine learning test data sets
CN101405728B (zh) 具有动态加载能力的关系数据库架构
CN111177302B (zh) 业务单据处理方法、装置、计算机设备和存储介质
CN110019017B (zh) 一种基于访问特征的高能物理文件存储方法
CN116719822B (zh) 一种海量结构化数据的存储方法及系统
CN116483822B (zh) 业务数据预警方法、装置、计算机设备、存储介质
CN107430633B (zh) 用于数据存储的系统及方法和计算机可读介质
CN117151045A (zh) 基于区块链的报表加工方法、装置及计算机设备
CN117077635A (zh) 报表文件生成方法、装置、计算机设备和存储介质
CN117540056B (zh) 数据查询的方法、装置、计算机设备和存储介质
CN118260330A (zh) 业务数据存储方法、装置、计算机设备以及存储介质
CN116401323A (zh) 指标数据处理方法、装置及计算机设备
CN117312283A (zh) 分库分表的数据校验方法、装置、计算机设备和存储介质
CN116561074A (zh) 资源数据的分组方法、装置、计算机设备和存储介质
CN116880927A (zh) 规则管理方法、装置、计算机设备和存储介质
CN117632009A (zh) 基于业务应用的数据存储方法、装置和计算机设备
CN117954025A (zh) 问卷文本生成方法、装置、计算机设备、存储介质
CN115456583A (zh) 问卷调查数据处理方法、设备、计算机设备和存储介质
CN117435589A (zh) 数据转存方法、装置、计算机设备、存储介质
CN118332002A (zh) 数据查询方法、装置、计算机设备和存储介质
CN117290350A (zh) 数据同步方法、装置、计算机设备、存储介质和程序产品
CN117312306A (zh) 金融业务数据表转换方法、装置、设备、介质和程序产品
CN116842107A (zh) 实时数据仓库构建方法、装置、设备和存储介质
CN117009821A (zh) 数据库选型方法、装置、计算机设备、存储介质
CN116483532A (zh) 排程处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination