CN116993859A - 一种基于图片数据提取技术生成统计报表的方法 - Google Patents
一种基于图片数据提取技术生成统计报表的方法 Download PDFInfo
- Publication number
- CN116993859A CN116993859A CN202311264319.0A CN202311264319A CN116993859A CN 116993859 A CN116993859 A CN 116993859A CN 202311264319 A CN202311264319 A CN 202311264319A CN 116993859 A CN116993859 A CN 116993859A
- Authority
- CN
- China
- Prior art keywords
- data
- data storage
- statistical
- storage
- storage node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000013075 data extraction Methods 0.000 title claims abstract description 22
- 238000005516 engineering process Methods 0.000 title claims abstract description 20
- 238000012896 Statistical algorithm Methods 0.000 claims abstract description 11
- 238000013500 data storage Methods 0.000 claims description 145
- 238000003860 storage Methods 0.000 claims description 86
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 13
- 238000005457 optimization Methods 0.000 claims description 12
- 238000012544 monitoring process Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 8
- 238000013499 data model Methods 0.000 abstract description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/206—Drawing of charts or graphs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Complex Calculations (AREA)
Abstract
本发明属于统计报表领域,涉及图像识别、数据算法技术,用于解决现有的统计报表生成方法对于数据统计结果的准确性不够,且改进较为困难的问题,具体是一种基于图片数据提取技术生成统计报表的方法,包括以下步骤:通过图片数据提取技术对目标物进行识别并建立指标关联数据库以及统计用算法模型;根据用户需求调取对应的展示方式,将统计数据按照展示方式生成统计报表,将统计报表发送至显示屏进行显示,同时对统计数据的展示特征进行标记;本发明采用扫描、导入图片提取数据并计算的方法,通过财务凭证与统计用指标关联的建立,运用数据模型统计计算,快速准确形成统计用报表,提高统计报表的生成效率与准确性。
Description
技术领域
本发明属于统计报表领域,涉及图像识别、数据算法技术,具体是一种基于图片数据提取技术生成统计报表的方法。
背景技术
目前图片识别是指利用计算机对图片进行处理、分析和理解,以识别各种不同模式的目标和对像的技术,图片识别是人工智能的一个重要领域,一般在工业使用中,采用工业相机拍摄图片,再利用软件根据图片灰阶差做进一步识别处理,另外在地理学中指将遥感图像进行分类的技术。
图片识别用于数据统计方向较少,且对于数据统计结果的准确性不够,且改进较为困难,需要整体性系统升级;在统计报表的应用场景中,因财务指标口径与统计指标计算口径不一,财务台账、凭证资料的数量大、复杂度高,导致利用财务资料进行统计报表填报时候,存在较大的难度;另外,在统计报表生成之后,如何对报表数据进行科学合理化的存储,是本领域亟需解决的技术问题。
针对上述技术问题,本申请提出一种解决方案。
发明内容
本发明的目的在于提供一种基于图片数据提取技术生成统计报表的方法,用于解决现有的统计报表生成方法对于数据统计结果的准确性不够,且改进较为困难的问题;
本发明需要解决的技术问题为:如何提供一种根据图片数据提取技术生成统计报表并对其进行科学合理化存储的方法。
本发明的目的可以通过以下技术方案实现:
一种基于图片数据提取技术生成统计报表的方法,包括以下步骤:
步骤一:通过图片数据提取技术对目标物进行识别并建立指标关联数据库以及统计用算法模型;
步骤二:根据用户需求调取对应的展示方式,将统计数据按照展示方式生成统计报表,将统计报表发送至显示屏进行显示,同时对统计数据的展示特征进行标记;
步骤三:根据展示特征将统计数据发送至对应的数据存储节点进行存储并对数据存储节点的平衡性进行分析;
步骤四:对不同展示特征的数据调用价值以及数据存储合理行进行监测分析。
作为本发明的一种优选实施方式,在步骤一中,对目标物进行识别并建立指标关联数据库以及统计用算法模型的具体过程包括:
步骤S1:建立图片数据识别提取系统:根据使用需求建立图像识别系统,并对图像识别系统识别训练,使得图像识别系统满足对目标物的识别要求并将识别结果输出,根据识别结果进行分类统计,形成对应的分类统计表格;
步骤S2:建立财务指标与统计指标关联数据库,统计指标关联数据库由数据结构、数据操作、数据完整性规则三个部分组成,数据结构用于描述组成数据库的组成成分,数据操作用于描述对数据结构允许执行的操作集合,完整性规则用于描述对数据结构所具有的约束和储存规则;
步骤S3:建立统计用算法模型,通过统计用及财务指标的关联性建立统计用算法模型,通过指标模型对图片提取的数据进行计算,并通过统计用算法模型将财务口径转化为统一的统计口径形成统计用报表。
作为本发明的一种优选实施方式,在步骤二与步骤三中,用户需求包括数值比对、覆盖分析、趋势分析以及占比分析,展示方式包括柱状图展示、占比图展示、线型图展示以及环形图展示,对应的数据存储节点包括比对存储节点、覆盖存储节点、趋势存储节点以及占比存储节点;用户需求、展示方式以及数据存储节点一一对应。
作为本发明的一种优选实施方式,在步骤三中,对数据存储节点的平衡性进行分析的具体过程包括:获取数据存储节点的内存数据NC、类型数据LX以及报表数据BB;通过对内存数据NC、类型数据LX以及报表数据BB进行数值计算得到数据存储节点的存储系数CC;将数据存储节点的存储系数CC与预设的存储阈值CCmax进行比较并通过比较结果对数据存储节点的数据存储量是否满足要求进行判定。
作为本发明的一种优选实施方式,内存数据NC为数据存储节点内存储数据的内存值的和值;类型数据LX为数据存储节点内存储数据的数据类型数量;报表数据BB为数据存储节点内存储的统计报表数量值。
作为本发明的一种优选实施方式,将数据存储节点的存储系数CC与预设的存储阈值CCmax进行比较的具体过程包括:若数据存储节点的存储系数CC小于存储阈值CCmax,则判定数据存储节点的数据存储量满足要求;若数据存储节点的存储系数CC大于等于存储阈值CCmax,则判定数据存储节点的数据存储量不满足要求,将对应的数据存储节点标记为异常节点,将异常节点发送至管理人员的手机终端;
将异常节点从数据存储节点中进行剔除,然后由剔除后的所有数据存储节点的存储系数CC构成存储集合,对存储集合进行方差计算得到平衡系数,将平衡系数与预设的平衡阈值进行比较:若平衡系数小于平衡阈值,则判定数据存储节点的平衡性满足要求;若平衡系数大于等于平衡阈值,则判定数据存储节点的平衡性不满足要求,生成存储优化信号并将存储优化信号发送至管理人员的手机终端。
作为本发明的一种优选实施方式,在步骤四中,对不同展示特征的数据调用价值进行监测分析的具体过程包括:获取数据存储节点的近调数据JD、总调数据ZD以及重复数据CF,近调数据JD为最近L1个月内数据存储节点中存储数据被调用的次数,总调数据ZD为数据存储节点中存储数据被调用的总次数,重复数据CF的获取过程包括:将调用次数不小于二的存储数据标记为多次数据,将数据存储节点内多次数据的数量标记为重复数据CF,通过对近调数据JD、总调数据ZD以及重复数据CF进行数值计算得到数据存储节点的调用系数DY;将调用系数DY数值最大的数据存储节点对应的展示方式标记为优先方式。
作为本发明的一种优选实施方式,在步骤四中,对数据存储合理行进行监测分析的具体过程包括:将数据存储节点按照调用系数DY数值由大到小的顺序进行排列得到调用序列,将数据存储节点按照存储系数CC由小到大的顺序进行排列得到存储序列,将数据存储节点在调用序列中的编号与存储序列中的编号的差值的绝对值标记为数据存储节点的合理值,对所有数据存储节点的合理值进行求和取平均值得到合理系数,将合理系数与预设的合理阈值进行比较:若合理系数小于合理阈值,则判定数据存储合理性满足要求;若合理系数大于等于合理阈值,则判定数据存储合理行不满足要求,生成结构优化信号并将结构优化信号发送至管理人员的手机终端。
本发明具备下述有益效果:
1、基于图片数据识别及统计数据算法,采用扫描、导入图片提取数据并计算的方法,通过财务凭证与统计用指标关联的建立,运用数据模型统计计算,快速准确形成统计用报表,提高统计报表的生成效率与准确性;
2、根据用户需求对生成的统计报表数据进行分布式存储,将统计报表数据的存储空间筛选依据与用户需求和数据展示方式相结合,提高数据存储效率的同时为数据存储的平衡性分析提供数据支撑;
3、通过对数据存储节点的平衡性进行分析得到存储系数,通过存储系数对数据存储节点的数据存储量进行反馈,从而对负载过高的数据存储节点进行标记,同时对各个数据存储节点的数据存储量的偏差程度进行监控;
4、通过生成的存储序列与调用序列可以反映数据存储节点的调用状态与存储状态,从而根据数据存储节点在存储序列与调用序列中的编号差进行数值计算得到合理系数,通过合理系数对数据存储合理性进行反馈,在数据存储合理性不满足要求时及时对数据存储结构进行优化。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的方法流程图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,一种基于图片数据提取技术生成统计报表的方法,包括以下步骤:
步骤一:通过图片数据提取技术对目标物进行识别并建立指标关联数据库以及统计用算法模型,可采用ORC文字提取技术从图像中提取关键词与数字数据,然后根据识别训练丰富关键词库,对关键词库内的元素进行识别与抓取:
步骤S1:建立图片数据识别提取系统:根据使用需求建立图像识别系统,并对图像识别系统识别训练,使得图像识别系统满足对目标物的识别并能够将识别结果输出,并根据识别结果对其分类统计,形成相应分类统计表格;
步骤S2:建立财务指标与统计指标关联数据库,主要由数据结构、数据操作、数据完整性规则三个部分组成,数据结构描述了组成数据库的基本成分,数据操作描述了对数据结构允许执行的操作集合,完整性规则描述了对数据结构所具有的约束和储存规则;数据库的建立是财务指标及统计指标之间的关联设计,分别构建财务、统计指标二维表,通过两个二维表进行关联;
步骤S3:建立统计用算法模型,通过统计用及财务指标的关联性建立统计用算法模型,管理并分析各类数据指标标准化(将财务口径转换为统计口径,加快统计报表的生成效率),利用指标模型,实现分析计算自动对图片提取的数据进行计算,快速准确形成统计用报表。同时可实现不同维度、不同口径的对比分析模型,提高财务指标转化统计报表效率,减少因为指标口径不一造成的数据统计差异问题;基于图片数据识别及统计数据算法,采用扫描、导入图片提取数据并计算的方法,通过财务凭证与统计用指标关联的建立,运用数据模型统计计算,快速准确形成统计用报表,提高统计报表的生成效率与准确性。
示例性的;统计口径是指统计数据所采用的标准,即进行数据的统计的具体内涵(项目内容),如可支配收入,包括工资、财产收入、奖金等,但还要扣除税收和赠送支出(如赡养支出),统计口径包括a统计报表产成品、b营业利润、c利润总额、d应交增值税、e累计折旧时,建立指标模型对财务口径进行标准化的统计转换:
a统计报表产成品=财务报表“资产负债表”中“产成品”或“库存商品”项目期末余额填报;
b营业利润=营业收入-营业成本-税金及附加-销售费用-管理费用-研发费用-财务费用-资产减值损失-信用减值损失+其他收益+投资收益+净敞口套期收益+公允价值变动收益+资产处置收益;
c利润总额=营业利润+营业外收入-营业外支出;
d应交增值税(本期累计发生额)= 销项税额-(进项税额-进项税额转出)-出口抵减内销产品应纳税额-减免税款+出口退税+简易计税;
e累计折旧=会计“累计折旧”科目的期末贷方余额填报;
由此生成a统计报表产成品、b营业利润、c利润总额、d应交增值税、e累计折旧形成的统计口径,然后根据统计口径的计算结果快速生成统计报表;
在建立财务指标与统计指标关联数据库时,统计指标关联数据库的数据结构由a统计报表产成品、b营业利润、c利润总额、d应交增值税、e累计折旧组成;数据操作即为每一项统计口径设定的计算逻辑;完整性规则用于描述对数据结构所具有的约束和储存规则。
可以理解的,指标模型是根据统计需求生成的口径转换标准,当统计口径还包括f本年折旧、g固定资产净额或h制造成本时,将对应统计口径的转换规则加入到指标模型中即可。
步骤二:根据用户需求调取对应的展示方式,将统计数据按照展示方式生成统计报表,将统计报表发送至显示屏进行显示,同时对统计数据的展示特征进行标记,用户需求包括数值比对、覆盖分析、趋势分析以及占比分析等,展示方式包括柱状图展示、占比图展示、线型图展示以及环形图展示等;根据用户需求对生成的统计报表数据进行分布式存储,将统计报表数据的存储空间筛选依据与用户需求和数据展示方式相结合,提高数据存储效率的同时为数据存储的平衡性分析提供数据支撑。
步骤三:根据展示特征将统计数据发送至对应的数据存储节点进行存储并对数据存储节点的平衡性进行分析:获取数据存储节点的内存数据NC、类型数据LX以及报表数据BB,内存数据NC为数据存储节点内存储数据的内存值的和值;类型数据LX为数据存储节点内存储数据的数据类型数量;报表数据BB为数据存储节点内存储的统计报表数量值;通过公式CC=α1*NC+α2*LX+α3*BB得到数据存储节点的存储系数CC,其中α1、α2以及α3均为比例系数,且α1>α2>α3>1;将数据存储节点的存储系数CC与预设的存储阈值CCmax进行比较:若数据存储节点的存储系数CC小于存储阈值CCmax,则判定数据存储节点的数据存储量满足要求;若数据存储节点的存储系数CC大于等于存储阈值CCmax,则判定数据存储节点的数据存储量不满足要求,将对应的数据存储节点标记为异常节点,将异常节点发送至管理人员的手机终端;将异常节点从数据存储节点中进行剔除,然后由剔除后的所有数据存储节点的存储系数CC构成存储集合,对存储集合进行方差计算得到平衡系数,将平衡系数与预设的平衡阈值进行比较:若平衡系数小于平衡阈值,则判定数据存储节点的平衡性满足要求;若平衡系数大于等于平衡阈值,则判定数据存储节点的平衡性不满足要求,生成存储优化信号并将存储优化信号发送至管理人员的手机终端;数据存储节点包括比对存储节点、覆盖存储节点、趋势存储节点以及占比存储节点等;用户需求、展示方式以及数据存储节点一一对应;通过对数据存储节点的平衡性进行分析得到存储系数,通过存储系数对数据存储节点的数据存储量进行反馈,从而对负载过高的数据存储节点进行标记,同时对各个数据存储节点的数据存储量的偏差程度进行监控。
步骤四:对不同展示特征的数据调用价值以及数据存储合理行进行监测分析:
对不同展示特征的数据调用价值进行监测分析的具体过程包括:获取数据存储节点的近调数据JD、总调数据ZD以及重复数据CF,近调数据JD为最近L1个月内数据存储节点中存储数据被调用的次数,总调数据ZD为数据存储节点中存储数据被调用的总次数,重复数据CF的获取过程包括:将调用次数不小于二的存储数据标记为多次数据,将数据存储节点内多次数据的数量标记为重复数据CF,通过公式DY=β1*JD+β2*ZD+β3*CF得到数据存储节点的调用系数DY,其中β1、β2以及β3均为比例系数,且β1>β2>β3>1;将调用系数DY数值最大的数据存储节点对应的展示方式标记为优先方式;
对数据存储合理行进行监测分析的具体过程包括:将数据存储节点按照调用系数DY数值由大到小的顺序进行排列得到调用序列,将数据存储节点按照存储系数CC由小到大的顺序进行排列得到存储序列,将数据存储节点在调用序列中的编号与存储序列中的编号的差值的绝对值标记为数据存储节点的合理值,对所有数据存储节点的合理值进行求和取平均值得到合理系数,将合理系数与预设的合理阈值进行比较:若合理系数小于合理阈值,则判定数据存储合理性满足要求;若合理系数大于等于合理阈值,则判定数据存储合理行不满足要求,生成结构优化信号并将结构优化信号发送至管理人员的手机终端。通过生成的存储序列与调用序列可以反映数据存储节点的调用状态与存储状态,从而根据数据存储节点在存储序列与调用序列中的编号差进行数值计算得到合理系数,通过合理系数对数据存储合理性进行反馈,在数据存储合理性不满足要求时及时对数据存储结构进行优化
一种基于图片数据提取技术生成统计报表的方法,工作时,通过图片数据提取技术对目标物进行识别并建立指标关联数据库以及统计用算法模型;根据用户需求调取对应的展示方式,将统计数据按照展示方式生成统计报表,将统计报表发送至显示屏进行显示,同时对统计数据的展示特征进行标记;根据展示特征将统计数据发送至对应的数据存储节点进行存储并对数据存储节点的平衡性进行分析;对不同展示特征的数据调用价值以及数据存储合理行进行监测分析。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
上述公式均是采集大量数据进行软件模拟得出且选取与真实值接近的一个公式,公式中的系数是由本领域技术人员根据实际情况进行设置;如:公式CC=α1*NC+α2*LX+α3*BB;由本领域技术人员采集多组样本数据并对每一组样本数据设定对应的存储系数;将设定的存储系数和采集的样本数据代入公式,任意三个公式构成三元一次方程组,将计算得到的系数进行筛选并取均值,得到α1、α2以及α3的取值分别为5.48、3.25和2.17;
系数的大小是为了将各个参数进行量化得到的一个具体的数值,便于后续比较,关于系数的大小,取决于样本数据的多少及本领域技术人员对每一组样本数据初步设定对应的存储系数;只要不影响参数与量化后数值的比例关系即可,如存储系数与内存数据的数值成正比。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (8)
1.一种基于图片数据提取技术生成统计报表的方法,其特征在于,包括以下步骤:
步骤一:通过图片数据提取技术对目标物进行识别并建立指标关联数据库以及统计用算法模型;
步骤二:根据用户需求调取对应的展示方式,将统计数据按照展示方式生成统计报表,将统计报表发送至显示屏进行显示,同时对统计数据的展示特征进行标记;
步骤三:根据展示特征将统计数据发送至对应的数据存储节点进行存储并对数据存储节点的平衡性进行分析;
步骤四:对不同展示特征的数据调用价值以及数据存储合理行进行监测分析。
2.根据权利要求1所述的一种基于图片数据提取技术生成统计报表的方法,其特征在于,在步骤一中,对目标物进行识别并建立指标关联数据库以及统计用算法模型的具体过程包括:
步骤S1:建立图片数据识别提取系统:根据使用需求建立图像识别系统,并对图像识别系统识别训练,使得图像识别系统满足对目标物的识别要求并将识别结果输出,根据识别结果进行分类统计,形成对应的分类统计表格;
步骤S2:建立财务指标与统计指标关联数据库,统计指标关联数据库由数据结构、数据操作、数据完整性规则三个部分组成,数据结构用于描述组成数据库的组成成分,数据操作用于描述对数据结构允许执行的操作集合,完整性规则用于描述对数据结构所具有的约束和储存规则;
步骤S3:建立统计用算法模型,通过统计用及财务指标的关联性建立统计用算法模型,通过指标模型对图片提取的数据进行计算,并通过统计用算法模型将财务口径转化为统一的统计口径形成统计用报表。
3.根据权利要求2所述的一种基于图片数据提取技术生成统计报表的方法,其特征在于,在步骤二与步骤三中,用户需求包括数值比对、覆盖分析、趋势分析以及占比分析,展示方式包括柱状图展示、占比图展示、线型图展示以及环形图展示,对应的数据存储节点包括比对存储节点、覆盖存储节点、趋势存储节点以及占比存储节点;用户需求、展示方式以及数据存储节点一一对应。
4.根据权利要求3所述的一种基于图片数据提取技术生成统计报表的方法,其特征在于,在步骤三中,对数据存储节点的平衡性进行分析的具体过程包括:获取数据存储节点的内存数据NC、类型数据LX以及报表数据BB;通过对内存数据NC、类型数据LX以及报表数据BB进行数值计算得到数据存储节点的存储系数CC;将数据存储节点的存储系数CC与预设的存储阈值CCmax进行比较并通过比较结果对数据存储节点的数据存储量是否满足要求进行判定。
5.根据权利要求4所述的一种基于图片数据提取技术生成统计报表的方法,其特征在于,内存数据NC为数据存储节点内存储数据的内存值的和值;类型数据LX为数据存储节点内存储数据的数据类型数量;报表数据BB为数据存储节点内存储的统计报表数量值。
6.根据权利要求5所述的一种基于图片数据提取技术生成统计报表的方法,其特征在于,将数据存储节点的存储系数CC与预设的存储阈值CCmax进行比较的具体过程包括:若数据存储节点的存储系数CC小于存储阈值CCmax,则判定数据存储节点的数据存储量满足要求;若数据存储节点的存储系数CC大于等于存储阈值CCmax,则判定数据存储节点的数据存储量不满足要求,将对应的数据存储节点标记为异常节点,将异常节点发送至管理人员的手机终端;
将异常节点从数据存储节点中进行剔除,然后由剔除后的所有数据存储节点的存储系数CC构成存储集合,对存储集合进行方差计算得到平衡系数,将平衡系数与预设的平衡阈值进行比较:若平衡系数小于平衡阈值,则判定数据存储节点的平衡性满足要求;若平衡系数大于等于平衡阈值,则判定数据存储节点的平衡性不满足要求,生成存储优化信号并将存储优化信号发送至管理人员的手机终端。
7.根据权利要求6所述的一种基于图片数据提取技术生成统计报表的方法,其特征在于,在步骤四中,对不同展示特征的数据调用价值进行监测分析的具体过程包括:获取数据存储节点的近调数据JD、总调数据ZD以及重复数据CF,近调数据JD为最近L1个月内数据存储节点中存储数据被调用的次数,总调数据ZD为数据存储节点中存储数据被调用的总次数,重复数据CF的获取过程包括:将调用次数不小于二的存储数据标记为多次数据,将数据存储节点内多次数据的数量标记为重复数据CF,通过对近调数据JD、总调数据ZD以及重复数据CF进行数值计算得到数据存储节点的调用系数DY;将调用系数DY数值最大的数据存储节点对应的展示方式标记为优先方式。
8.根据权利要求7所述的一种基于图片数据提取技术生成统计报表的方法,其特征在于,在步骤四中,对数据存储合理行进行监测分析的具体过程包括:将数据存储节点按照调用系数DY数值由大到小的顺序进行排列得到调用序列,将数据存储节点按照存储系数CC由小到大的顺序进行排列得到存储序列,将数据存储节点在调用序列中的编号与存储序列中的编号的差值的绝对值标记为数据存储节点的合理值,对所有数据存储节点的合理值进行求和取平均值得到合理系数,将合理系数与预设的合理阈值进行比较:若合理系数小于合理阈值,则判定数据存储合理性满足要求;若合理系数大于等于合理阈值,则判定数据存储合理行不满足要求,生成结构优化信号并将结构优化信号发送至管理人员的手机终端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311264319.0A CN116993859B (zh) | 2023-09-28 | 2023-09-28 | 一种基于图片数据提取技术生成统计报表的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311264319.0A CN116993859B (zh) | 2023-09-28 | 2023-09-28 | 一种基于图片数据提取技术生成统计报表的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116993859A true CN116993859A (zh) | 2023-11-03 |
CN116993859B CN116993859B (zh) | 2024-01-02 |
Family
ID=88534277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311264319.0A Active CN116993859B (zh) | 2023-09-28 | 2023-09-28 | 一种基于图片数据提取技术生成统计报表的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116993859B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117950608A (zh) * | 2024-03-27 | 2024-04-30 | 深圳市维度数据科技股份有限公司 | 一种基于人工智能的报表打印管理系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107562531A (zh) * | 2016-06-30 | 2018-01-09 | 华为技术有限公司 | 一种数据均衡方法和装置 |
CN110222336A (zh) * | 2019-05-22 | 2019-09-10 | 深圳壹账通智能科技有限公司 | 财务报告分析方法、装置、计算机设备和存储介质 |
CN110348974A (zh) * | 2019-05-21 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 财务报表处理方法和装置 |
CN116303374A (zh) * | 2023-05-22 | 2023-06-23 | 深圳市维度数据科技股份有限公司 | 基于sql数据库的多维度报表数据优化压缩方法 |
CN116303677A (zh) * | 2023-03-14 | 2023-06-23 | 平安科技(深圳)有限公司 | 基于数据分布均衡度的衡量方法、装置、设备及存储介质 |
-
2023
- 2023-09-28 CN CN202311264319.0A patent/CN116993859B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107562531A (zh) * | 2016-06-30 | 2018-01-09 | 华为技术有限公司 | 一种数据均衡方法和装置 |
CN110348974A (zh) * | 2019-05-21 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 财务报表处理方法和装置 |
CN110222336A (zh) * | 2019-05-22 | 2019-09-10 | 深圳壹账通智能科技有限公司 | 财务报告分析方法、装置、计算机设备和存储介质 |
CN116303677A (zh) * | 2023-03-14 | 2023-06-23 | 平安科技(深圳)有限公司 | 基于数据分布均衡度的衡量方法、装置、设备及存储介质 |
CN116303374A (zh) * | 2023-05-22 | 2023-06-23 | 深圳市维度数据科技股份有限公司 | 基于sql数据库的多维度报表数据优化压缩方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117950608A (zh) * | 2024-03-27 | 2024-04-30 | 深圳市维度数据科技股份有限公司 | 一种基于人工智能的报表打印管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116993859B (zh) | 2024-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109461078B (zh) | 一种基于资金交易网络的异常交易识别方法及系统 | |
CN116993859B (zh) | 一种基于图片数据提取技术生成统计报表的方法 | |
Umayaparvathi et al. | Applications of data mining techniques in telecom churn prediction | |
CN110009502B (zh) | 理财数据分析方法、装置、计算机设备和存储介质 | |
CN110851667A (zh) | 一种多源头大量数据的整合分析方法及工具 | |
CN107766929A (zh) | 模型分析方法及装置 | |
CN114048436A (zh) | 一种预测企业财务数据模型构建方法及构建装置 | |
CN111047426A (zh) | 一种基于资金交易的可疑账户分析方法、系统及存储介质 | |
CN114140013A (zh) | 一种基于xgboost的评分卡生成方法、装置及设备 | |
CN116468536A (zh) | 一种自动化风险控制规则生成的方法 | |
CN111062602A (zh) | 企业信用风险评估的方法、装置及存储介质 | |
CN114493686A (zh) | 一种运营内容生成推送方法及装置 | |
CN114528395A (zh) | 一种文本字词特征双线注意力融合的风险预测方法 | |
CN113919761A (zh) | 一种诉讼案件管理方法、系统及装置 | |
CN111428927B (zh) | 一种基于定界算法的武器装备采购供应商选择方法及装置 | |
CN116151840B (zh) | 一种基于大数据的用户服务数据智能管理系统及方法 | |
CN117196808A (zh) | 一种同业业务的流动性风险预测方法及相关装置 | |
CN115879826B (zh) | 一种基于大数据的精细化工工艺质检方法、系统及介质 | |
CN115034742A (zh) | 一种考勤方法及系统 | |
CN114092265B (zh) | 提高保单新业务价值确定效率的方法、装置及存储介质 | |
CN115203240B (zh) | 一种基于通话数据检索的总线消息处理系统 | |
CN118172177A (zh) | 确定保险理赔信息的方法、装置、设备及存储介质 | |
CN117495487A (zh) | 一种政企客户信用评分卡生成方法、装置、设备及介质 | |
CN115809370A (zh) | 征信产品推荐方法、装置、存储介质及服务器 | |
CN116089836A (zh) | 一种电影衍生品价值预测方法、系统、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |