CN110222336A - 财务报告分析方法、装置、计算机设备和存储介质 - Google Patents

财务报告分析方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110222336A
CN110222336A CN201910428088.XA CN201910428088A CN110222336A CN 110222336 A CN110222336 A CN 110222336A CN 201910428088 A CN201910428088 A CN 201910428088A CN 110222336 A CN110222336 A CN 110222336A
Authority
CN
China
Prior art keywords
financial
target
analysis
index
indicator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910428088.XA
Other languages
English (en)
Inventor
曹向阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201910428088.XA priority Critical patent/CN110222336A/zh
Publication of CN110222336A publication Critical patent/CN110222336A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请涉及大数据领域,提供了一种财务报告分析方法、装置、计算机设备和存储介质。基于财务报告进行文本识别,得到原始财务业务数据,从原始财务业务数据中,识别和提炼出有用的信息进行数据处理,包括识别指标、匹配目标分析字段、计算目标分析值等一系列数据处理过程,得到用于对财务报告进行描述的信息文本作为分析结果,更加快速、准确有效地实现对财务报告的分析,从而提高了对财务报告的分析效率。

Description

财务报告分析方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种财务报告分析方法、装置、计算机设备和存储介质。
背景技术
财务报告是反映企业财务状况和经营成果的书面文件,因此对财务报告中的财务项目和财务指标进行统计分析,对了解一个企业非常有必要。
目前,对财务报告的分析,主要是一张张独立的表格展现财务报告中的财务项目、指标等。然而,由于表格之间没有明显的关联关系,财务项目与财务指标之间没有明显的关联,特别是对纸质的财务报告进行分析时,难以直接根据表格中各个财务项目汇总与指标汇总得出直观的分析结果,不得不通过人工的方式统计,并计算这些财务报告主表中财务项目汇总、财务指标汇总,针对汇总统计结果手动地完成对财务报告的分析。比如,根据纸质档的财务报告手动输入、计算各类的项目指标来对财务报告进行分析。也就是说,现有的财务报告分析方法不能对财务报告进行自动分析,导致统计和分析财务报告效率低。
发明内容
基于此,有必要针对如何提高财务报告的分析效率的技术问题,提供一种财务报告分析方法、装置、计算机设备和存储介质。
一种财务报告分析方法,所述方法包括:
获取财务报告,将所述财务报告输入文本识别模型中,得到财务业务数据;
将所述财务业务数据输入已训练的指标识别模型中,得到候选指标类型和候选指标类型对应的候选指标值;
获取预设财务项目和预设财务指标之间的关联关系,并根据所述关联关系从所述候选指标类型中确定目标指标类型,并获取所述目标指标类型对应的目标指标值;
根据所述目标指标类型从数据分析库中查询得到目标分析字段;其中,所述数据分析库中存储有所述目标指标类型和分析字段的对应关系,所述分析字段用于对所述目标指标类型进行描述;
根据所述目标指标类型、目标指标类型对应的目标指标值和所述关联关系计算得到所述目标分析字段对应的目标分析值;
将所述目标分析字段和对应的目标分析值组合形成所述财务报告的分析结果。
在一个实施例中,所述获取财务报告,将所述财务报告输入文本识别模型中,得到财务业务数据包括:
根据预设区域划分规则将所述财务报告划分成多个候选识别区域;
按照预设顺序从所述候选识别区域中依次选择得到目标识别区域;
对所述目标识别区域进行字符识别,得到所述财务业务数据。
在一个实施例中,所述指标识别模型的训练步骤包括:
获取训练样本,所述训练样本包括标记指标;
将所述训练样本输入初始指标识别模型中,得到训练指标;
将所述标记指标与所述训练指标进行比对计算,得到相似度,根据所述相似度对所述初始指标识别模型进行参数调整,直到所述初始指标识别模型满足收敛条件,得到所述指标识别模型。
在一个实施例中,所述方法还包括:所述获取预设财务项目和预设财务指标之间的关联关系的步骤之前,还包括:
建立关联关系表,所述关联关系表中存储预设财务项目和对应的多个预设财务指标之间的关联关系;
所述并根据所述关联关系从所述候选指标类型中确定目标指标类型,并获取所述目标指标类型对应的目标指标值的步骤,包括:
从预设财务项目中确定待分析财务项目;
通过查询所述关联关系表,查询所述待分析财务项目对应的目标预设财务指标集合,根据所述预设财务指标集合从所述候选指标中确定所述目标指标指标类型。
在一个实施例中,所述将所述目标分析字段和对应的目标分析值组合形成所述财务报告的分析结果的步骤,包括:
所述目标分析字段中包含待填充字段;
根据所述对应关系将所述目标分析值填充至对应的待填充字段中,形成所述财务报告的分析结果。
一种财务报告分析装置,所述装置包括:
识别模块,用于获取财务报告,将所述财务报告输入文本识别模型中,得到财务业务数据;还用于将所述财务业务数据输入已训练的指标识别模型中,得到候选指标类型和候选指标类型对应的候选指标值;
目标指标获取模块,用于获取预设财务项目和预设财务指标之间的关联关系,并根据所述关联关系从所述候选指标类型中确定目标指标类型,并获取所述目标指标类型对应的目标指标值;
目标分析字段查询模块,用于根据所述目标指标类型从数据分析库中查询得到目标分析字段;其中,所述数据分析库中存储所述目标指标类型和分析字段的对应关系,所述分析字段用于对所述目标指标类型进行描述;
目标分析值计算模块,用于根据所述目标指标类型、目标指标类型对应的目标指标值和所述关联关系计算得到所述目标分析字段对应的目标分析值;
分析结果确认模块,用于所述目标分析字段和对应的目标分析值组合形成所述财务报告的分析结果。
在一个实施例中,所述识别模块包括:
候选识别区域获取单元,用于根据预设区域划分规则将所述财务报告划分成多个候选识别区域;
目标识别区域选择单元,用于按照预设顺序从所述候选识别区域中依次选择得到目标识别区域;
财务业务数据获取单元,用于对所述目标识别区域进行字符识别,得到所述财务业务数据。
在一个实施例中,所述识别模块包括:
训练样本获取单元,用于获取训练样本,所述训练样本包括标记指标;
训练指标获取单元,用于将所述训练样本输入初始指标识别模型中,得到训练指标;
模型参数调整单元,用于将所述标记指标与所述训练指标进行比对计算,得到相似度,根据所述相似度对所述初始指标识别模型进行参数调整,直到所述初始指标识别模型满足收敛条件,得到所述指标识别模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述各个方法实施例中的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述各个方法实施例中的步骤。
上述财务报告分析方法、装置、计算机设备和存储介质,通过文本识别模型和指标识别模型对财务报告进行自动识别,能够准确识别得到候选指标类型和候选指标类型对应的候选指标值,用于后续对候选指标进行统计和计算。然后根据预设财务项目和预设财务指标之间的关联关系从候选指标类型中确定目标指标类型,并获取所述目标指标类型对应的目标指标值,从而过滤掉不参与统计和分析的部分候选指标,能够有针对性的对目标指标进行分析,然后根据目标指标类型查询数据分析库,得到目标分析字段,并计算目标分析字段对应的目标分析值,最后将目标分析字段和对应的目标分析值组合形成财务报告的分析结果。上述财务报告分析方法,基于财务报告进行文本识别,得到原始财务业务数据,从原始财务业务数据中,识别和提炼出有用的信息进行数据处理,包括识别指标、匹配目标分析字段、计算目标分析值等一系列数据处理过程,得到用于对财务报告进行描述的信息文本作为分析结果,更加快速、准确有效地实现对财务报告的分析,从而提高了对财务报告的分析效率。
附图说明
图1为一个实施例财务报告分析方法的应用场景图;
图2为一个实施例中财务报告分析方法的流程示意图;
图3为另一个实施例中财务报告分析方法的流程示意图;
图4为一个实施例中所述指标识别模型的训练步骤的流程示意图;
图5为一个实施例中财务报告分析装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的财务报告分析方法,可以应用于如图1所示的应用环境中。图1为一个实施例中财务报告分析方法运行的应用环境图。如图1所示,该应用环境包括终端110和服务器120,终端和服务器之间通过网络进行通信,通信网络可以是无线或者有线通信网络,例如IP网络、蜂窝移动通信网络等,其中终端和服务器的个数不限。
其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。通过终端获取财务报告,将财务报告输入文本识别模型中,得到财务业务数据;终端将财务业务数据输入已训练的指标识别模型中,得到候选指标类型和候选指标类型对应的候选指标值;终端获取预设财务项目和预设财务指标之间的关联关系,并根据关联关系从候选指标类型中确定目标指标类型,并获取目标指标类型对应的目标指标值;终端根据目标指标类型从数据分析库中查询得到目标分析字段;其中,数据分析库中存储目标指标类型和分析字段的对应关系,分析字段用于对目标指标类型和所述目标指标值进行描述;终端根据目标指标类型、目标指标类型对应的目标指标值和关联关系计算得到目标分析字段对应的目标分析值;终端将目标分析字段和对应的目标分析值组合形成财务报告的分析结果。需要说明的是,本案财务报告分析方法的全部步骤可以直接在服务器或者终端上实现。本案通过自动识别出财务报告中的候选指标,自动从候选指标中确认目标指标,最后根据目标指标有针对性的对财务报告进行自动化分析,得到分析结果,能够有效提高对财务报告的分析效率。
在一个实施例中,如图2所示,提供了一种财务报告分析方法,以该方法应用于图1的终端110为例进行说明,包括以下步骤:
步骤210,获取财务报告,将财务报告输入文本识别模型中,得到财务业务数据。
具体地,终端获取财务报告,并将财务报告输入文本识别模型,文本识别模型对财务报告进行文本识别得到财务业务数据。其中,财务报告用于描述一段时间内与商业项目关联的总结文件,财务业务数据用于描述商业项目过程中各个活动细节。活动细节是指在商业项目过程中企业的具体经营活动,比如,营业、销售等具体的经营活动。通过文本识别模型对财务报告进行文本识别,识别出所有用于描述各个活动细节的文本,作为财务业务数据。获取财务报告的方式可以是直接获取电子档的财务报告,也可以是通过对纸质档的财务报告进行扫描获取。例如,财务报告为用于描述一段时间内与商业项目关联的纸质版书面文件,通过终端对纸质的财务报告进行拍照后形成的图片,图片通过文本识别模型进行文本识别处理,识别出所有描述活动细节的文本。
步骤220,将财务业务数据输入已训练的指标识别模型中,得到候选指标类型和候选指标类型对应的候选指标值。
具体地,终端将财务业务数据输入已训练的指标识别模型中,得到候选指标。候选指标包括候选指标类型和候选指标类型对应的候选指标值。候选指标值为统计得到的各个活动细节涉及到的客观参数值。候选指标类型代表各个客观参数值对应的物理含义。比如,营业收入100万,其中营业收入是候选指标类型,营业收入对应的候选指标值为100万。
步骤230,获取预设财务项目和预设财务指标之间的关联关系,并根据关联关系和预设财务指标的指标类型从候选指标类型中确定目标指标类型,并获取目标指标类型对应的目标指标值。
其中,预设财务项目的指标类型用于描述对商业项目进行过程中各个活动细节涉及到的客观参数进行计算得到的评估参数。预设财务指标的指标类型用于描述计算评估参数涉及到各个活动细节对应的客观参数。关联关系用于描述预设财务项目与预设财务指标之间的关联。关联关系通常是一对多的关联,将预设财务项目理解为关联对象,被关联对象是至少两个预设财务指标。每一个预设财务项目与对应的多个预设财务指标之间存在有关联关系,关联关系表中存储预设财务项目和对应的多个预设财务指标之间的关联关系。
具体地,终端通过查询关联关系表获取预设财务项目和预设财务指标之间的关联关系。其中,获取关联关系是先根据预设顺序从预设财务项目中选择待分析财务项目,再通过查询关联关系表查询待分析财务项目对应的预设财务指标集合,以及查询待分析财务项目与对应的预设财务指标集合之间的运算关系。终端再根据预设财务指标集合从候选指标类型中选择与预设财务指标相同的指标类型作为目标指标类型,并获取目标指标类型对应的目标指标值。
其中,当待分析财务项目对应的预设财务指标集合中的任一预设财务指标的指标类型在候选指标类型中不存在时,筛选过滤掉这一关联关系,从预设财务项目中选择下一个待分析财务项目,也就是根据预设顺序确定下一个关联关系。通过筛选、过滤掉多余的预设财务项目对应的关联关系,筛选出后续用于数据处理的目标财务指标,以此保证在后续数据处理的准确性。
其中,根据预设顺序将预设财务项目全部选择为待分析财务项目之后,当候选指标类型中依然存在未匹配的指标类型,那么未匹配的指标类型将会被过滤掉,不会参与后续数据处理,从而能够减少数据冗余,加快后续数据处理的速率。
比如,预设财务项目包括“A、B、C、D”,候选财务指标包括“a、b、c、d、e、f、g、h”等。按照预设顺序从预设财务项目中首先确定A为待分析财务项目,再通过查询关联关系表查询到A对应的预设财务指标集合为{a、b、z},以及查询到A与{a、b、z}的运算关系为A=a-b-z。再通过A对应的预设财务指标集合{a、b、z}中预设财务指标的指标类型与候选指标类型进行匹配,由于在候选指标类型中未匹配到与z相同的指标类型,筛选过滤掉A对应的这一关联关系。接着按照预设顺序从预设财务项目中确定B为待分析财务项目,再通过查询关联关系表查询到B对应的预设财务指标集合为{a、b},以及查询到B与{a、b}的运算关系为A=a/b,再通过B对应的预设财务指标集合{a、b}中预设财务指标的指标类型与候选指标类型进行匹配,将匹配成功的候选指标类型a和b,作为目标指标类型,并获取对应的目标指标值,目标指标类型和目标指标值用于后续数据处理。当预设财务项目包括“A、B、C、D”按照预设顺序全部选择完毕后,候选指标类型中任然存在未匹配成功的{e、g、h},{e、g、h}将会被过滤掉,不参加后续的数据处理。
比如,预设财务项目包括“营业利润、净利润、资金比”。预设财务指标包括“营业收入、营业成本、税金、销售费用、管理费用、财务费用、应收款、总资产”等。通过查询关联关系表,获取关联关系包括:预设财务项目“营业利润”对应的关联关系为:“营业利润=营业收入-营业成本”,预设财务项目“净利润”对应的关联关系为:“净利润=营业收入-营业成本税金-销售费用-管理费用-财务费用”,预设财务项目“资金占比”对应的关联关系为:“资金占比=应收款/总资产”。
步骤240,根据目标指标类型从数据分析库中查询得到目标分析字段;其中,数据分析库中存储有目标指标类型和分析字段的对应关系,分析字段用于对所述目标指标类型进行描述。
具体地,终端访问数据分析库,数据分析库中存储了目标指标类型和分析字段的对应关系。也就是说,目标指标类型对应一个分析字段,分析字段用于对目标指标类型进行描述。比如,关联关系是“资金占比=应收款/总资产”,经过上述步骤确定目标指标类型是“应收款、总资产”后,查询数据分析库中“应收款、总资产”对应的分析字段为“总资产规模为xx万元,主要包括应收账款xx万元,占总资产的xx。”,终端根据目标指标类型和分析字段的对应关系,将目标指标值填入分析字段中,得到目标分析字段“总资产规模为1000万元,主要包括应收账款700万元,占总资产的xx”。其中,目标分析字段中的“xx”是根据关联关系、目标分析字段和目标指标值一一对应,然后计算得出唯一的计算结果。
步骤250,根据目标指标类型、目标指标类型对应的目标指标值和关联关系计算得到目标分析字段对应的目标分析值。
步骤260,将目标分析字段和对应的目标分析值组合形成财务报告的分析结果。
具体地,终端通过目标指标类型从数据分析库中查询到对应的目标分析字段。目标分析字段是指与目标指标类型存在对应关系的分析字段。通过目标指标类型、目标指标类型对应的目标指标值和关联关系计算得到目标分析字段中待填入的目标分析值。最后将目标分析值一一对应自动填入目标分析字段中,组合形成财务报告的分析结果。比如,关联关系为“资产占比=应收款/总资产”,“应收款、总资产”对应的目标指标值分别为“700、1000”,终端计算出目标分析值是“70%”,将目标分析字段和目标分析值组合形成的分析结果为“总资产规模为1000万元,主要包括应收账款700万元,占总资产的70%”。最终形成的分析结果,能够直观的描述财务报告中的财务报表的项目指标。
在本实施例中,终端能够准确地识别出财务报告中的候选指标类型和候选指标值,终端通过获取关联关系从候选指标类型中准确确定目标指标类型,并通过目标指标类型从数据分析库查询到对应的目标分析字段,通过目标指标类型对应的目标指标值和关联关系计算得到唯一确定的目标分析值,保证财务报告的分析准确性,最终根据目标分析字段和对应的目标分析值组合形成分析结果,也就是说,终端通过对财务报告的数据进行处理、匹配目标分析字段、计算得到唯一的目标分析值后生成唯一确定的分析结果等一系列数据处理过程,实现对财务报告自动化分析。相比较于传统的财务人员计算核对财务指标、手动录入分析结果的分析方案而言,本案通过终端对财务报告进行自动化数据处理,从用于描述一段时间内与商业项目关联的总结文件中,提炼出关于各个活动细节的有用信息进行数据处理,得到用于对财务报告进行描述的信息文本作为分析结果,能够更加快速、准确有效地实现对财务报告的分析,从而提高对财务报告的分析效率。
在一个实施例中,如图3所示,步骤210还包括:
步骤212,根据预设区域划分规则将财务报告划分成多个候选识别区域。
具体地,预设区域划分规则用于对财务报告进行区域划分,预设区域划分规则可以是根据段落结构自动划分,比如,将同一段落的文字内容或表格作为一个候选识别区域。再比如,将财务报告中的每一张财务报表的每个表格区域作为一个候选识别区域。候选识别区域也可通过预先设定区域范围确定。预先设定区域范围是指在财务报告的每张财务报表上设置相同位置相同区域的识别区域。
步骤214,按照预设顺序从候选识别区域中依次选择得到目标识别区域。
步骤216,对目标识别区域进行字符识别,得到财务业务数据。
具体地,当将财务报告划分成多个候选识别区域,按照预设顺序从候选识别区域中依次选择得到目标识别区域,然后对目标识别区域进行字符识别,字符识别是指运用OCR(字符识别算法)对的字符进行识别,字符识别算法是通过图像处理和模式识别技术对光学的字符进行识别,先通过检测暗、亮的模式确定形状,然后用字符识别方法将形状翻译成计算机文字的过程。
在本实施例中,通过将财务报告划分成多个候选识别区域,将每个候选识别区域按照预设顺序自动选择目标识别区域,针对目标识别区域进行字符识别,能够更加准确的识别财务报告中的文字部分,形成财务业务数据,后续步骤中实现准确地对财务报告进行分析。
在一个实施例中,如图4所示,为一个实施例中所述指标识别模型的训练步骤的流程示意图,包括以下步骤:
步骤310,获取训练样本,训练样本包括标记指标。
步骤320,将训练样本输入初始指标识别模型中,得到训练指标。
步骤330,将标记指标与训练指标进行比对计算,得到相似度,根据相似度对初始指标识别模型进行参数调整,直到初始指标识别模型满足收敛条件,得到指标识别模型。
其中,终端获取训练样本,训练样本包括标记指标。也就是说,对训练样本中指标的位置进行标记,被标记位置对应的指标就是标记指标。在对指标模型进行训练时,将训练样本输入初始指标识别模型中,目的是让初始指标模型对训练样本中的标记指标进行识别,识别得到训练指标。最后通过将训练指标与标记指标进行比对计算,得到训练指标与标记指标的相似度,根据相似度对初始指标识别模型的参数进行不断调整,直到满足收敛条件,得到指标识别模型。收敛条件包括对训练指标与标记指标的相似度设置阀值,当相似度达到阀值时,满足收敛条件。
在本实施例中,通过输入训练样本训练得到指标识别模型后,指标识别模型能够准确的识别出候选指标,候选指标包括候选指标类型和候选指标类型对应的候选指标值,通过对候选指标进行统计和分析,实现对财务报告的准确分析。
在一个实施例中,所述获取预设财务项目和预设财务指标之间的关联关系的步骤之前,还包括:建立关联关系表,关联关系表中存储预设财务项目和对应的多个预设财务指标之间的关联关系。所述并根据关联关系从候选指标类型中确定目标指标类型,并获取目标指标类型对应的目标指标值的步骤,包括:从预设财务项目中确定待分析财务项目;通过查询关联关系表,查询待分析财务项目对应的目标预设财务指标集合;根据预设财务指标集合从候选指标中确定目标指标指标类型。
具体地,终端建立关联关系表。关联关系表中映射存储预设财务项目和对应的多个财务指标之间的关联关系。也就是说,关联关系表中存储多个预设财务项目,每一个财务项目对应多个财务指标。通过从预设财务项目中确定待分析财务项目,在通过查询关联关系表时,能够快速准确地查询待分析财务项目对应的目标预设财务指标集合,因此可以根据目标预设财务指标集合从候选指标中确定目标指标指标类型,并获取目标指标类型对应的目标指标值。
在一个实施例中,所述将目标分析字段和对应的目标分析值组合形成财务报告的分析结果的步骤,包括:目标分析字段中包含待填充字段;根据对应关系将目标分析值填充至对应的待填充字段中,形成财务报告的分析结果。
具体地,目标分析字段是指在数据分析库中与目标指标类型存在对应关系的分析字段。目标分析字段中包括待填充字段,待填充字段用于填充目标分析值,填充后形成的文本就作为分析结果。在本实施例中,目标分析字段相当于对分析结果选择的模板,在模板中填入了对应的数据,整体上组合形成分析结果。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种财务报告分析装置,包括:识别模块510、目标指标获取模块520、目标分析字段查询模块530、目标分析值计算模块540、目标分析值计算模块550、分析结果确认模块560,其中:
识别模块510,用于获取财务报告,将财务报告输入文本识别模型中,得到财务业务数据;还用于将财务业务数据输入已训练的指标识别模型中,得到候选指标类型和候选指标类型对应的候选指标值。
目标指标获取模块520,用于获取预设财务项目和预设财务指标之间的关联关系,并根据关联关系从候选指标类型中确定目标指标类型,并获取目标指标类型对应的目标指标值。
目标分析字段查询模块540,用于根据目标指标类型从数据分析库中查询得到目标分析字段;其中,数据分析库中存储目标指标类型和分析字段的对应关系,分析字段用于对目标指标类型进行描述;
目标分析值计算模块550,用于根据目标指标类型、目标指标类型对应的目标指标值和关联关系计算得到目标分析字段对应的目标分析值。
分析结果确认模块560,用于将目标分析字段和对应的目标分析值组合形成财务报告的分析结果。
在一个实施例中,所述识别模块510还包括:
候选识别区域获取单元,用于根据预设区域划分规则将财务报告划分成多个候选识别区域。
目标识别区域选择单元,用于按照预设顺序从候选识别区域中依次选择得到目标识别区域。
财务业务数据获取单元,用于对目标识别区域进行字符识别,得到财务业务数据。
在一个实施例中,所述识别模块510还包括:
训练样本获取单元,用于获取训练样本,训练样本包括标记指标;
训练指标获取单元,用于将训练样本输入初始指标识别模型中,得到训练指标;
模型参数调整单元,用于将标记指标与训练指标进行比对计算,得到相似度,根据相似度对初始指标识别模型进行参数调整,直到初始指标识别模型满足收敛条件,得到指标识别模型。
关于财务报告分析装置的具体限定可以参见上文中对于财务报告分析方法的限定,在此不再赘述。上述财务报告分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种财务报告分析方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取财务报告,将财务报告输入文本识别模型中,得到财务业务数据;将财务业务数据输入已训练的指标识别模型中,得到候选指标类型和候选指标类型对应的候选指标值;获取预设财务项目和预设财务指标之间的关联关系,并根据关联关系从候选指标类型中确定目标指标类型,并获取目标指标类型对应的目标指标值;根据目标指标类型从数据分析库中查询得到目标分析字段;其中,数据分析库中存储目标指标类型和分析字段的对应关系,分析字段用于对目标指标类型进行描述;根据目标指标类型、目标指标类型对应的目标指标值和关联关系计算得到目标分析字段对应的目标分析值;将目标分析字段和对应的目标分析值组合形成财务报告的分析结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取财务报告,将财务报告输入文本识别模型中,得到财务业务数据;将财务业务数据输入已训练的指标识别模型中,得到候选指标类型和候选指标类型对应的候选指标值;获取预设财务项目和预设财务指标之间的关联关系,并根据关联关系从候选指标类型中确定目标指标类型,并获取目标指标类型对应的目标指标值;根据目标指标类型从数据分析库中查询得到目标分析字段;其中,数据分析库中存储目标指标类型和分析字段的对应关系,分析字段用于对目标指标类型进行描述;根据目标指标类型、目标指标类型对应的目标指标值和关联关系计算得到目标分析字段对应的目标分析值;将目标分析字段和对应的目标分析值组合形成财务报告的分析结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)、DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种财务报告分析方法,所述方法包括:
获取财务报告,将所述财务报告输入文本识别模型中,得到财务业务数据;
将所述财务业务数据输入已训练的指标识别模型中,得到候选指标类型和候选指标类型对应的候选指标值;
获取预设财务项目和预设财务指标之间的关联关系,并根据所述关联关系和所述预设财务指标的指标类型从所述候选指标类型中确定目标指标类型,并获取所述目标指标类型对应的目标指标值;
根据所述目标指标类型从数据分析库中查询得到目标分析字段;其中,所述数据分析库中存储有所述目标指标类型和分析字段的对应关系,所述分析字段用于对所述目标指标类型进行描述;
根据所述目标指标类型、目标指标类型对应的目标指标值和所述关联关系,计算得到所述目标分析字段对应的目标分析值;
将所述目标分析字段和对应的目标分析值组合形成所述财务报告的分析结果。
2.根据权利要求1所述的方法,其特征在于,所述获取财务报告,将所述财务报告输入文本识别模型中,得到财务业务数据包括:
根据预设区域划分规则将所述财务报告划分成多个候选识别区域;
按照预设顺序从所述候选识别区域中依次选择得到目标识别区域;
对所述目标识别区域进行字符识别,得到所述财务业务数据。
3.根据权利要求1所述的方法,其特征在于,所述指标识别模型的训练步骤包括:
获取训练样本,所述训练样本包括标记指标;
将所述训练样本输入初始指标识别模型中,得到训练指标;
将所述标记指标与所述训练指标进行比对计算,得到相似度,根据所述相似度对所述初始指标识别模型进行参数调整,直到所述初始指标识别模型满足收敛条件,得到所述指标识别模型。
4.根据权利要求1所述的方法,其特征在于,所述获取预设财务项目和预设财务指标之间的关联关系的步骤之前,还包括:
建立关联关系表,所述关联关系表中存储预设财务项目和对应的多个预设财务指标之间的关联关系;
所述并根据所述关联关系从所述候选指标类型中确定目标指标类型,并获取所述目标指标类型对应的目标指标值的步骤,包括:
从预设财务项目中确定待分析财务项目;
通过查询所述关联关系表,查询所述待分析财务项目对应的目标预设财务指标集合,根据所述预设财务指标集合从所述候选指标中确定所述目标指标指标类型。
5.根据权利要求1所述的方法,其特征在于,所述将所述目标分析字段和对应的目标分析值组合形成所述财务报告的分析结果的步骤,包括:
所述目标分析字段中包含待填充字段;
根据所述对应关系将所述目标分析值填充至对应的待填充字段中,形成所述财务报告的分析结果。
6.一种财务报告分析装置,其特征在于,所述装置包括:
识别模块,用于获取财务报告,将所述财务报告输入文本识别模型中,得到财务业务数据;还用于将所述财务业务数据输入已训练的指标识别模型中,得到候选指标类型和候选指标类型对应的候选指标值;
目标指标获取模块,用于获取预设财务项目和预设财务指标之间的关联关系,并根据所述关联关系从所述候选指标类型中确定目标指标类型,并获取所述目标指标类型对应的目标指标值;
目标分析字段查询模块,用于根据所述目标指标类型从数据分析库中查询得到目标分析字段;其中,所述数据分析库中存储有所述目标指标类型和分析字段的对应关系,所述分析字段用于对所述目标指标类型进行描述;
目标分析值计算模块,用于根据所述目标指标类型、目标指标类型对应的目标指标值和所述关联关系计算得到所述目标分析字段对应的目标分析值;
分析结果确认模块,用于将所述目标分析字段和对应的目标分析值组合形成所述财务报告的分析结果。
7.根据权利要求6所述的装置,其特征在于,所述识别模块包括:
候选识别区域获取单元,用于根据预设区域划分规则将所述财务报告划分成多个候选识别区域;
目标识别区域选择单元,用于按照预设顺序从所述候选识别区域中依次选择得到目标识别区域;
财务业务数据获取单元,用于对所述目标识别区域进行字符识别,得到所述财务业务数据。
8.根据权利要求6所述的装置,其特征在于,所述识别模块包括:
训练样本获取单元,用于获取训练样本,所述训练样本包括标记指标;
训练指标获取单元,用于将所述训练样本输入初始指标识别模型中,得到训练指标;
模型参数调整单元,用于将所述标记指标与所述训练指标进行比对计算,得到相似度,根据所述相似度对所述初始指标识别模型进行参数调整,直到所述初始指标识别模型满足收敛条件,得到所述指标识别模型。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述方法的步骤。
CN201910428088.XA 2019-05-22 2019-05-22 财务报告分析方法、装置、计算机设备和存储介质 Pending CN110222336A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910428088.XA CN110222336A (zh) 2019-05-22 2019-05-22 财务报告分析方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910428088.XA CN110222336A (zh) 2019-05-22 2019-05-22 财务报告分析方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN110222336A true CN110222336A (zh) 2019-09-10

Family

ID=67821738

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910428088.XA Pending CN110222336A (zh) 2019-05-22 2019-05-22 财务报告分析方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110222336A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159353A (zh) * 2019-12-30 2020-05-15 智慧神州(北京)科技有限公司 基于多维数据构建智能报告机器人的系统及方法
CN111241845A (zh) * 2019-12-31 2020-06-05 上海犀语科技有限公司 一种基于语义匹配方法的财务科目自动识别方法及装置
CN111626586A (zh) * 2020-05-21 2020-09-04 广西电网有限责任公司 数据质量检测方法、装置、计算机设备和存储介质
CN111639117A (zh) * 2020-05-26 2020-09-08 李绍兵 基于数据加工的业务处理方法及装置
WO2021189826A1 (zh) * 2020-09-02 2021-09-30 平安科技(深圳)有限公司 报文生成方法、装置、电子设备及计算机可读存储介质
CN116976547A (zh) * 2023-06-19 2023-10-31 珠海盈米基金销售有限公司 一种财务报告分析处理方法、系统、装置及介质
CN116993859A (zh) * 2023-09-28 2023-11-03 深圳市维度数据科技股份有限公司 一种基于图片数据提取技术生成统计报表的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070055596A1 (en) * 2005-08-26 2007-03-08 Movaris, Inc System for preparing financial disclosures by unifying financial close and financial control steps
US20070288336A1 (en) * 2006-05-05 2007-12-13 Fineye Corporation Method and System For Advanced Financial Analysis
US8204809B1 (en) * 2008-08-27 2012-06-19 Accenture Global Services Limited Finance function high performance capability assessment
US20140006233A1 (en) * 2012-06-28 2014-01-02 Kathrin Hamburger Consistent Interface for Financial Accounting View of Cost Object Expense List and Financials View of Contract
CN108563783A (zh) * 2018-04-25 2018-09-21 张艳 一种基于大数据的财务分析管理系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070055596A1 (en) * 2005-08-26 2007-03-08 Movaris, Inc System for preparing financial disclosures by unifying financial close and financial control steps
US20070288336A1 (en) * 2006-05-05 2007-12-13 Fineye Corporation Method and System For Advanced Financial Analysis
US8204809B1 (en) * 2008-08-27 2012-06-19 Accenture Global Services Limited Finance function high performance capability assessment
US20140006233A1 (en) * 2012-06-28 2014-01-02 Kathrin Hamburger Consistent Interface for Financial Accounting View of Cost Object Expense List and Financials View of Contract
CN108563783A (zh) * 2018-04-25 2018-09-21 张艳 一种基于大数据的财务分析管理系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李思泓: "企业财务报告分析体系的研究", 科技与管理, no. 03 *
黄毅;: "企业财务分析指标体系的缺陷及完善研究", 企业技术开发, no. 05 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159353A (zh) * 2019-12-30 2020-05-15 智慧神州(北京)科技有限公司 基于多维数据构建智能报告机器人的系统及方法
CN111159353B (zh) * 2019-12-30 2023-08-22 北京因特睿软件有限公司 基于多维数据构建智能报告机器人的系统及方法
CN111241845A (zh) * 2019-12-31 2020-06-05 上海犀语科技有限公司 一种基于语义匹配方法的财务科目自动识别方法及装置
CN111241845B (zh) * 2019-12-31 2024-01-16 上海犀语科技有限公司 一种基于语义匹配方法的财务科目自动识别方法及装置
CN111626586A (zh) * 2020-05-21 2020-09-04 广西电网有限责任公司 数据质量检测方法、装置、计算机设备和存储介质
CN111626586B (zh) * 2020-05-21 2023-10-31 广西电网有限责任公司 数据质量检测方法、装置、计算机设备和存储介质
CN111639117A (zh) * 2020-05-26 2020-09-08 李绍兵 基于数据加工的业务处理方法及装置
CN111639117B (zh) * 2020-05-26 2023-12-01 四川三江数智科技有限公司 基于数据加工的业务处理方法及装置
WO2021189826A1 (zh) * 2020-09-02 2021-09-30 平安科技(深圳)有限公司 报文生成方法、装置、电子设备及计算机可读存储介质
CN116976547A (zh) * 2023-06-19 2023-10-31 珠海盈米基金销售有限公司 一种财务报告分析处理方法、系统、装置及介质
CN116993859A (zh) * 2023-09-28 2023-11-03 深圳市维度数据科技股份有限公司 一种基于图片数据提取技术生成统计报表的方法
CN116993859B (zh) * 2023-09-28 2024-01-02 深圳市维度数据科技股份有限公司 一种基于图片数据提取技术生成统计报表的方法

Similar Documents

Publication Publication Date Title
CN110222336A (zh) 财务报告分析方法、装置、计算机设备和存储介质
CN110348441B (zh) 增值税发票识别方法、装置、计算机设备及存储介质
WO2019218699A1 (zh) 欺诈交易判断方法、装置、计算机设备和存储介质
CN111428599B (zh) 票据识别方法、装置和设备
CN109784381A (zh) 标注信息处理方法、装置及电子设备
CN104461863A (zh) 一种业务系统测试方法、设备及系统
US20210366055A1 (en) Systems and methods for generating accurate transaction data and manipulation
CN113255614A (zh) 一种基于视频分析的rpa流程自动生成方法与系统
CN106852177B (zh) 基于一致性测量值的用于数据对象的基于模式识别的监测和受控处理的系统和方法
CN109299094A (zh) 数据表处理方法、装置、计算机设备和存储介质
CN111783645A (zh) 文字识别的方法、装置、电子设备及计算机可读存储介质
WO2022037299A1 (zh) 异常行为检测方法、装置、电子设备及计算机可读存储介质
CN111914729A (zh) 凭证关联方法、装置、计算机设备及存储介质
CN111858977A (zh) 票据信息采集方法、装置、计算机设备和存储介质
CN106066881B (zh) 数据处理方法及装置
CN113901768A (zh) 一种标准文件生成方法、装置、设备及存储介质
CN111242779B (zh) 金融数据特征选择和预测方法、装置、设备及存储介质
CN113158988A (zh) 财务报表处理方法、装置以及计算机可读存储介质
JP2023543639A (ja) 酒製品位置決め方法、酒製品情報管理方法及びその装置、デバイス及び記憶媒体
CN109542947B (zh) 数据统计方法、装置、计算机设备和存储介质
CN109324963B (zh) 自动测试收益结果的方法及终端设备
CN113627892B (zh) 一种bom数据的识别方法及其电子设备
CN112766245B (zh) 基于pdf格式文件的可视化仪器采集方法及系统
CN114971926A (zh) 保费计算模型测试方法、系统、设备及存储介质
CN110599338A (zh) 交易数据处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
AD01 Patent right deemed abandoned

Effective date of abandoning: 20240621