CN109376191A - 财报数据处理方法、装置、计算机设备和存储介质 - Google Patents

财报数据处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109376191A
CN109376191A CN201811089157.0A CN201811089157A CN109376191A CN 109376191 A CN109376191 A CN 109376191A CN 201811089157 A CN201811089157 A CN 201811089157A CN 109376191 A CN109376191 A CN 109376191A
Authority
CN
China
Prior art keywords
financial report
data
report data
financial
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811089157.0A
Other languages
English (en)
Inventor
李晨光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201811089157.0A priority Critical patent/CN109376191A/zh
Publication of CN109376191A publication Critical patent/CN109376191A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请涉及一种财报数据处理方法、装置、计算机设备和存储介质。所述方法涉及非结构化数据处理,包括:获取待处理财报数据和财报处理需求;查询预设的财报词汇库,财报词汇库包括各类型财报数据对应的财报数据名称集;将待处理财报数据与财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据对应的财报基准名称;根据待处理财报数据对应的财报基准名称对待处理财报数据进行处理,得到财报基准数据;根据财报处理需求,对财报基准数据进行结构化处理,得到结构化财报数据。采用本方法应用于对财报数据的处理时,有效提高了财报数据的处理效率。

Description

财报数据处理方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种财报数据处理方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,越来越多上市公司会通过互联网公开其财务报表,以便公众能够综合地分析和评价该公司的财务状况和经营成果。对于股市的投资者来说,财报数据分析属于基本分析范畴,它是对企业历史资料的动态分析,是在研究过去的基础上预测未来,以便做出正确的投资决定。
在目前的财报数据处理过程中,通常是通过编写解析代码对各公司公开的财报数据进行解析处理,但各种财报涉及的数据项目较多,编写各对应代码的过程繁琐,导致财报数据处理的效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高财报数据处理效率的财报数据处理方法、装置、计算机设备和存储介质。
一种财报数据处理方法,所述方法包括:
获取待处理财报数据和财报处理需求;
查询预设的财报词汇库,财报词汇库包括各类型财报数据对应的财报数据名称集;
将待处理财报数据与财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据对应的财报基准名称;
根据待处理财报数据对应的财报基准名称对待处理财报数据进行处理,得到财报基准数据;
根据财报处理需求,对财报基准数据进行结构化处理,得到结构化财报数据。
在其中一个实施例中,在查询预设的财报词汇库的步骤之前,还包括:
获取财报数据;
从财报数据中提取对应的财报数据名称;
按照财报数据的数据类型,将财报数据对应的财报数据名称进行名称分类,得到各财报数据名称集;
为各财报数据名称集分别设置财报基准名称,根据财报基准名称和财报数据名称集得到财报词汇库。
在其中一个实施例中,在获取财报数据的步骤之后,还包括:
查询预设的财报存储分类条件和与财报存储分类条件对应的财报数据存储器;
根据财报存储分类条件,将财报数据导入财报数据存储器中;
通过与财报数据存储器对应预设的数据读取线程,从财报数据存储器中获得财报数据。
在其中一个实施例中,将待处理财报数据与财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据对应的财报基准名称的步骤包括:
从待处理财报数据中提取对应的财报数据名称;
将待处理财报数据对应的财报数据名称与财报数据名称集进行名称匹配;
当匹配结果一致时,从财报数据名称集中获得待处理财报数据对应的财报基准名称。
在其中一个实施例中,根据待处理财报数据对应的财报基准名称对待处理财报数据进行处理,得到财报基准数据的步骤包括:
将财报基准名称替换待处理财报数据对应的财报数据名称,得到包括财报基准名称的财报基准数据。
在其中一个实施例中,财报处理需求包括财报结构需求和处理对象需求;根据财报处理需求,对财报基准数据进行结构化处理,得到结构化财报数据的步骤包括:
查询满足处理对象需求的财报基准数据,得到待处理基准数据;
按照财报结构需求对待处理基准数据进行数据结构设置,得到结构化财报数据。
在其中一个实施例中,在得到结构化财报数据的步骤之后,还包括:
确定待处理财报数据对应的业务系统;
查询与业务系统对应预设的财报分析标准;
通过预设的财报分析标准对结构化财报数据进行财报分析,得到财报分析结果。
一种财报数据处理装置,所述装置包括:
待处理数据获取模块,用于获取待处理财报数据和财报处理需求;
财报词汇库查询模块,用于查询预设的财报词汇库,财报词汇库包括各类型财报数据对应的财报数据名称集;
基准名称匹配模块,用于将待处理财报数据与财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据对应的财报基准名称;
财报基准数据获取模块,用于根据待处理财报数据对应的财报基准名称对待处理财报数据进行处理,得到财报基准数据;
结构化处理模块,用于根据财报处理需求,对财报基准数据进行结构化处理,得到结构化财报数据。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待处理财报数据和财报处理需求;
查询预设的财报词汇库,财报词汇库包括各类型财报数据对应的财报数据名称集;
将待处理财报数据与财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据对应的财报基准名称;
根据待处理财报数据对应的财报基准名称对待处理财报数据进行处理,得到财报基准数据;
根据财报处理需求,对财报基准数据进行结构化处理,得到结构化财报数据。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待处理财报数据和财报处理需求;
查询预设的财报词汇库,财报词汇库包括各类型财报数据对应的财报数据名称集;
将待处理财报数据与财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据对应的财报基准名称;
根据待处理财报数据对应的财报基准名称对待处理财报数据进行处理,得到财报基准数据;
根据财报处理需求,对财报基准数据进行结构化处理,得到结构化财报数据。
上述财报数据处理方法、装置、计算机设备和存储介质,将待处理财报数据与预设的财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据的财报基准名称,并进一步根据确定的财报基准名称对待处理财报数据进行处理,得到财报基准数据,最后根据获取的财报处理需求对该财报基准数据进行结构化处理,得到满足财报处理需求的结构化财报数据。在对财报数据处理过程中,为待处理财报数据添加对应预设的财报基准名称,使待处理财报数据的名称统一,避免了针对各种数据项目编写对应的解析代码,最后通过得到的财报基准数据结合财报处理需求进行结构化处理,有效提高了财报数据的处理效率。
附图说明
图1为一个实施例中财报数据处理方法的应用场景图;
图2为一个实施例中财报数据处理方法的流程示意图;
图3为一个实施例中财报基准名称确定的步骤的流程示意图;
图4为另一个实施例中财报数据处理方法的流程示意图;
图5为一个实施例中财报数据处理装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的财报数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104接收到终端102发送的财报数据处理请求消息后,获取待处理财报数据和财报处理需求,并将待处理财报数据与预设的财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据的财报基准名称,再进一步根据确定的财报基准名称对待处理财报数据进行处理,得到财报基准数据,最后根据获取的财报处理需求对该财报基准数据进行结构化处理,得到满足财报处理需求的结构化财报数据。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种财报数据处理方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤S201:获取待处理财报数据和财报处理需求。
其中,待处理财报数据为当前需要进行处理的财报数据,具体可以为终端102发送的公司财务报表,也可以由服务器104从对应业务系统的数据库中查询得到;财报处理需求可以为终端102发送的对于待处理财报数据的处理逻辑,如处理的数据范围、数据聚合逻辑、财报结构化设置逻辑等,财报处理需求可以根据实际需求进行配置。在具体应用中,可以由终端102向服务器104发送待处理财报数据的标识信息及对应的财报处理需求,服务器104根据标识信息从对应业务系统的数据库中获取得到待处理财报数据,以对其进行后续数据处理操作。
步骤S203:查询预设的财报词汇库,财报词汇库包括各类型财报数据对应的财报数据名称集。
对于不同公司的财报数据,对各种财报数据名称的命名方式不同,导致各个公司的财报数据中会有不同的数据名称表达方式,不利于财报数据的统一分析处理,基于此,可以对各财报数据进行数据名称统一化处理。具体地,在对财报数据进行处理时,查询预设的财报词汇库,财报词汇库记录有各类型财报数据对应的财报数据名称集,其中,财报数据名称集可以为各个类型财报数据对应财报数据名称的集合,可以为各集合设置一财报基准名称,并通过该财报基准名称对各财报数据名称进行统一,有利于对不同来源的财报数据进行统一分析处理。在具体应用中,财报数据名称集除定义的财报基准名称外,还可以记录有各种来源的财报数据对应的财报数据名称,通过对财报数据对应的财报数据名称进行匹配,可以确定各财报数据对应的财报数据名称集,并确定财报数据对应的财报基准名称。
步骤S205:将待处理财报数据与财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据对应的财报基准名称。
其中,财报基准名称指针对各财报数据名称集定义的标准名称,可以包括中文名称、英文名称、英文缩写和数据编码等,具体应用时可以根据实际需求进行定义,通过该财报基准名称可以将来源不同、命名名称不同的各种待处理财报数据进行数据名称归一化处理。具体地,在查询财报词汇库后,将待处理财报处理与财报词汇库中财报数据名称集进行匹配,从而确定该待处理财报数据对应的财报基准名称。
步骤S207:根据待处理财报数据对应的财报基准名称对待处理财报数据进行处理,得到财报基准数据。
确定待处理数据对应的财报基准名称后,根据该财报基准名称对待处理财报数据进行处理,具体可以直接将该财报基准名称替换待处理财报数据的财报数据名称,从而得到包括财报基准名称的财报基准数据。
步骤S209:根据财报处理需求,对财报基准数据进行结构化处理,得到结构化财报数据。
得到财报基准数据后,按照终端102发送的财报处理需求,例如财报结构需求和处理对象需求,对财报基准数据进行结构化处理,最终得到结构化财报数据。具体地,可以对财报基准数据进行数据内容筛选,获取满足处理对象需求的财报基准数据,再对其进行数据结构设置,得到满足财报处理需求的结构化财报数据。例如,需要分析与资产负债相关的财报数据,则财报处理需求可以包括资产负债,从而对财报基准数据中的其他类型财报数据进行过滤,从而实现了对结构化财报数据的个性化定制。
上述财报数据处理方法中,将待处理财报数据与预设的财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据的财报基准名称,并进一步根据确定的财报基准名称对待处理财报数据进行处理,得到财报基准数据,最后根据获取的财报处理需求对该财报基准数据进行结构化处理,得到满足财报处理需求的结构化财报数据。在对财报数据处理过程中,为待处理财报数据添加对应预设的财报基准名称,使待处理财报数据的名称统一,避免了针对各种数据项目编写对应的解析代码,最后通过得到的财报基准数据结合财报处理需求进行结构化处理,有效提高了财报数据的处理效率。
在一个实施例中,在查询预设的财报词汇库的步骤之前,还包括:获取财报数据;从财报数据中提取对应的财报数据名称;按照财报数据的数据类型,将财报数据对应的财报数据名称进行名称分类,得到各财报数据名称集;为各财报数据名称集分别设置财报基准名称,根据财报基准名称和财报数据名称集得到财报词汇库。
财报词汇库为基于各公司、业务系统的财报分析结果构建得到,具体可以根据已公开的财报报表数据分析构建。具体地,获取财报数据,该财报数据可以为互联网上各企业公司已公开的财报数据,在实现时可以基于爬虫技术,如Python爬虫从各企业、公司的网站网页中爬取获得。
得到财报数据后,从中提取对应的财报数据名称,并按照财报数据的数据类型,将财报数据对应的财报数据名称进行名称分类,从而得到各财报数据名称集。本实施例中,按照财报数据的类型,建立对应的财报数据名称集,该财报数据名称集用于存储该类型财报数据对应各种财报数据名称。对于各种类型的财报数据,从网络爬取得到的相同类型的财报数据可能会对应于不同的财报数据名称,将各种财报数据名称加以汇总,从而构建得到财报数据名称集。
得到各类型财报数据对应的财报数据名称集后,为各财报数据名称集定义财报基准名称,进一步得到财报词汇库。其中,财报数据名称集存储有该类型财务数据对应的各种财报数据名称,反映了不同来源中对该类型财报数据的词汇表达形式,进一步为财报数据名称集定义财报基准名称,以对各种财报数据名称进行归一化管理,形成各种财报数据名称与财报基准名称多对一的映射关系。在具体实现时,财报基准名称可以根据实际需求进行定义,如可以包括中文基准名称、英文基准名称、英文缩写等。
本实施例中,通过根据得到的已公开的财报数据构建对应的财报数据名称集,并定义对应的财报基准名称,得到财报词汇库,实现了对各财报数据的财报数据名称的统一化管理,有利于提高后续对财报数据的处理效率。
在一个实施例中,在获取财报数据的步骤之后,还包括:查询预设的财报存储分类条件和与财报存储分类条件对应的财报数据存储器;根据财报数据存储分类条件,将财报数据导入财报数据存储器中;通过与财报数据存储器对应预设的数据读取线程,从财报数据存储器中获得财报数据。
对于获取的财报数据,其涉及的数据量庞大,为提高对财报数据的处理效率并加快构建财报词汇库进程,可以通过分布式系统对获取的财报数据进行财报词汇库构建处理。具体地,查询预设的财报存储分类条件和与财报存储分类条件对应的财报数据存储器,其中,财报存储分类条件可以为财报数据种类、财报数据时间、财报数据来源等。例如,可以按照财报数据时间分类,可以分为月份、季度、半年期和年度财报;按照类型分为资产负债表、利润表和现金流量表;按照重要程度分为主表和附表等。对应于财报存储分类条件可以分别设置对应的财报数据存储器,从而将财报数据按照财报存储分类条件分别导入对应的财报数据存储器中。例如,可以将获取的财报数据导入HDFS(Hadoop Distributed FileSystem,分布式文件系统)集群中,在后续处理时,通过MapReduce模型从对应的HDFS集群中获取财报数据。具体地,可以针对各财报数据存储器分别设置对应的数据读取线程,通过该数据读取线程从财报数据存储器中获取对应类型的财报数据。
在具体应用时,从互联网上爬取获得企业、公司财报大多是PDF格式(PortableDocument Format,便携式文档格式)文档,为不可直接编辑文件。读取其中的财报数据时,需要通过PDF编辑工具对PDF格式财报进行分割及文本识别,从而提取得到财报数据,并将该财报数据导入至对应的财报数据存储器中进行保存。
在一个实施例中,如图3所示,财报基准名称确定的步骤,即将待处理财报数据与财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据对应的财报基准名称的步骤包括:
步骤S301:从待处理财报数据中提取对应的财报数据名称。
在查询到预设的财报词汇库,获得财报数据名称集后,通过将待处理财报数据与财报数据名称集进行匹配,可以确定待处理财报数据对应的财报数据名称集,从而确定待处理财报数据对应的财报基准名称。具体地,提取对应的财报数据名称,财报数据名称为待处理财报数据在处理前配有其来源处原定义的名称,该财报数据名称在来源不同的企业、公司时会有不同的表达形式。
步骤S303:将待处理财报数据对应的财报数据名称与财报数据名称集进行名称匹配。
财报数据名称集中包括该类型财报数据对应的各种表达形式的财报数据名称,在得到待处理财报数据的财报数据名称后,将该财报数据名称与财报词汇库中的各财报数据名称集进行名称匹配,可以根据匹配程度来确定对应的财报数据名称集。具体地,名称匹配可以为财报数据名称的字段匹配;也可以为对应的财报数据的计算公式匹配,对于计算公式一致,即表明该财报数据的定义一致,为实质相同、命名不同的财报数据。
步骤S305:当匹配结果一致时,从财报数据名称集中获得待处理财报数据对应的财报基准名称。
在名称匹配过程中,当匹配结果一致时,如财报数据名称的字段匹配一致或财报数据计算公式一致,即反映了待处理财报数据与财报数据名称集对应的各财报数据为同一类型财报数据,则可以从对应的财报数据名称集中获得待处理财报数据对应的财报基准名称,从而确定了待处理财报数据对应的财报基准名称。
在一个实施例中,根据待处理财报数据对应的财报基准名称对待处理财报数据进行处理,得到财报基准数据的步骤包括:将财报基准名称替换待处理财报数据对应的财报数据名称,得到包括财报基准名称的财报基准数据。
在确定待处理财报数据对应的财报基准名称后,根据该财报基准名称对待处理财报数据进行名称定义处理,得到财报基准数据。本实施例中,直接将财报基准名称替换待处理财报数据对应的财报数据名称,以快速得到包括财报基准名称的财报基准数据。在得到的财报基准数据中,各项财报数据原定义的数据名称均替换为对应的财报基准名称,从而实现了各项财报数据的名称归一化处理,有利于提稿后续的财报数据的分析处理效率。
在一个实施例中,财报处理需求包括财报结构需求和处理对象需求;根据财报处理需求,对财报基准数据进行结构化处理,得到结构化财报数据的步骤包括:查询满足处理对象需求的财报基准数据,得到待处理基准数据;按照财报结构需求对待处理基准数据进行数据结构设置,得到结构化财报数据。
财报处理需求为对于待处理财报数据的处理逻辑,如处理的数据范围、数据聚合逻辑、财报结构化设置逻辑等,其由实际需求进行配置。本实施例中,财报处理需求包括财报结构需求和处理对象需求。其中,财报结构需求为对财报数据处理的结构化设置逻辑,例如财报数据之间的聚合逻辑等;处理对象需求为所需处理财报数据的范围,仅对财报处理需求中指定的数据对象进行处理,能够有效地利用处理资源。
具体地,从获得的财报基准数据中,按照处理对象需求进行筛选,得到满足处理对象需求的待处理基准数据,再根据财报结构需求对待处理基准数据进行数据结构设置,例如,通过语法结构简单且层次结构清洗的JSON(JavaScript Object Notation,JavaScript对象简谱)技术来对待处理基准数据进行数据进行结构设置,得到符合财报处理需求的结构化财报数据,该结构化财报数据更便于进行网络传输、机器阅读或大数据分析使用,如可以为JSON化财报数据。
在一个实施例中,在得到结构化财报数据的步骤之后,还包括:确定待处理财报数据对应的业务系统;查询与业务系统对应预设的财报分析标准;通过预设的财报分析标准对结构化财报数据进行财报分析,得到财报分析结果。
在得到结构化财报数据后,可以进一步对结构化财报数据进行财报分析,以得到财报分析结果。本实施例中,确定待处理财报数据对应的业务系统,各业务系统对应于不同的待处理财报数据,其对各待处理财报数据的分析需求和标准也不同,可以查询与业务系统对应预设的财报分析标准,并通过该财报分析标准对结构化财报数据进行财报分析,最终得到财报分析结果。其中,财报分析标准可以根据业务系统实际的应用需求进行设置,例如,对于关注财报数据中利润表的数据就可以只输出利润表数据,并按照财报分析标准中的利润分析标准进行财报分析,输出利润分析结果,以实现结构化财报的多样化定制,对应于不同的用户需求。
在一个实施例中,如图4所示,提供了一种财报数据处理方法,包括以下步骤:
步骤S401:获取待处理财报数据和财报处理需求;
步骤S402:查询预设的财报词汇库,财报词汇库包括各类型财报数据对应的财报数据名称集;
步骤S403:从待处理财报数据中提取对应的财报数据名称;
步骤S404:将待处理财报数据对应的财报数据名称与财报数据名称集进行名称匹配;
步骤S405:当匹配结果一致时,从财报数据名称集中获得待处理财报数据对应的财报基准名称;
步骤S406:将财报基准名称替换待处理财报数据对应的财报数据名称,得到包括财报基准名称的财报基准数据。
本实施例中,获取待处理财报数据和财报处理需求,财报处理需求为对于待处理财报数据的处理逻辑,包括财报结构需求和处理对象需求。查询预设的财报词汇库,获得各类型财报数据对应的财报数据名称集,再将待处理财报数据中的财报数据名称与财报数据名称集进行数据名称的字段匹配,当匹配结果一致时,从财报数据名称集中获得待处理财报数据对应的财报基准名称,并将财报基准名称替换待处理财报数据对应的财报数据名称,得到包括财报基准名称的财报基准数据。对于待处理财报数据,按照预设的财报基准名称对其进行统一化管理,有利于提高后续对财报数据的处理效率。
步骤S407:查询满足处理对象需求的财报基准数据,得到待处理基准数据;
步骤S408:按照财报结构需求对待处理基准数据进行数据结构设置,得到结构化财报数据。
得到财报基准数据后,按照处理对象需求进行筛选,得到满足处理对象需求的待处理基准数据,再通过JSON技术根据财报结构需求对待处理基准数据进行数据结构设置,得到JSON化的结构化财报数据,该结构化财报数据更便于进行网络传输、机器阅读或大数据分析使用。
步骤S409:对结构化财报数据进行财报分析,得到财报分析结果。
本实施例中,在得到结构化财报数据后,进一步对结构化财报数据进行财报分析,以得到财报分析结果。具体地,对结构化财报数据进行财报分析的步骤包括:确定待处理财报数据对应的业务系统;查询与业务系统对应预设的财报分析标准;通过预设的财报分析标准对结构化财报数据进行财报分析,得到财报分析结果。其中,财报分析标准可以根据业务系统实际的应用需求进行设置,以实现结构化财报的多样化定制,对应于不同的用户需求。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种财报数据处理装置,包括:待处理数据获取模块501、财报词汇库查询模块503、基准名称匹配模块505、财报基准数据获取模块507和结构化处理模块509,其中:
待处理数据获取模块501,用于获取待处理财报数据和财报处理需求;
财报词汇库查询模块503,用于查询预设的财报词汇库,财报词汇库包括各类型财报数据对应的财报数据名称集;
基准名称匹配模块505,用于将待处理财报数据与财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据对应的财报基准名称;
财报基准数据获取模块507,用于根据待处理财报数据对应的财报基准名称对待处理财报数据进行处理,得到财报基准数据;
结构化处理模块509,用于根据财报处理需求,对财报基准数据进行结构化处理,得到结构化财报数据。
上述财报数据处理装置,通过基准名称匹配模块将待处理财报数据与预设的财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据的财报基准名称,并进一步由财报基准数据获取模块根据确定的财报基准名称对待处理财报数据进行处理,得到财报基准数据,最后通过结构化处理模块根据获取的财报处理需求对该财报基准数据进行结构化处理,得到满足财报处理需求的结构化财报数据。在对财报数据处理过程中,为待处理财报数据添加对应预设的财报基准名称,使待处理财报数据的名称统一,避免了针对各种数据项目编写对应的解析代码,最后通过得到的财报基准数据结合财报处理需求进行结构化处理,有效提高了财报数据的处理效率。
在一个实施例中,还包括财报数据获取模块、数据名称提取模块、数据名称集构建模块和财报词汇库构建模块,其中:财报数据获取模块,用于获取财报数据;数据名称提取模块,用于从财报数据中提取对应的财报数据名称;数据名称集构建模块,用于按照财报数据的数据类型,将财报数据对应的财报数据名称进行名称分类,得到各财报数据名称集;财报词汇库构建模块,用于为各财报数据名称集分别设置财报基准名称,根据财报基准名称和财报数据名称集得到财报词汇库。
在一个实施例中,还包括财报分类查询模块、财报数据导入模块和财报数据读取模块,其中:财报分类查询模块,用于查询预设的财报存储分类条件和与财报存储分类条件对应的财报数据存储器;财报数据导入模块,用于根据财报存储分类条件,将财报数据导入财报数据存储器中;财报数据读取模块,用于通过与财报数据存储器对应预设的数据读取线程,从财报数据存储器中获得财报数据。
在一个实施例中,基准名称匹配模块505包括数据名称确定单元、名称匹配单元和基准名称确定单元,其中:数据名称确定单元,用于从待处理财报数据中提取对应的财报数据名称;名称匹配单元,用于将待处理财报数据对应的财报数据名称与财报数据名称集进行名称匹配;基准名称确定单元,用于当匹配结果一致时,从财报数据名称集中获得待处理财报数据对应的财报基准名称。
在一个实施例中,财报基准数据获取模块507包括基准数据获取单元,用于将财报基准名称替换待处理财报数据对应的财报数据名称,得到包括财报基准名称的财报基准数据。
在一个实施例中,财报处理需求包括财报结构需求和处理对象需求;结构化处理模块509包括待处理基准数据单元和结构化处理单元,其中:待处理基准数据单元,用于查询满足处理对象需求的财报基准数据,得到待处理基准数据;结构化处理单元,用于按照财报结构需求对待处理基准数据进行数据结构设置,得到结构化财报数据。
在一个实施例中,还包括业务系统确定模块、分析标准查询模块和财报分析模块,其中:业务系统确定模块,用于确定待处理财报数据对应的业务系统;分析标准查询模块,用于查询与业务系统对应预设的财报分析标准;财报分析模块,用于通过预设的财报分析标准对结构化财报数据进行财报分析,得到财报分析结果。
关于财报数据处理装置的具体限定可以参见上文中对于财报数据处理方法的限定,在此不再赘述。上述财报数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种财报数据处理方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待处理财报数据和财报处理需求;
查询预设的财报词汇库,财报词汇库包括各类型财报数据对应的财报数据名称集;
将待处理财报数据与财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据对应的财报基准名称;
根据待处理财报数据对应的财报基准名称对待处理财报数据进行处理,得到财报基准数据;
根据财报处理需求,对财报基准数据进行结构化处理,得到结构化财报数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取财报数据;从财报数据中提取对应的财报数据名称;按照财报数据的数据类型,将财报数据对应的财报数据名称进行名称分类,得到各财报数据名称集;为各财报数据名称集分别设置财报基准名称,根据财报基准名称和财报数据名称集得到财报词汇库。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:查询预设的财报存储分类条件和与财报存储分类条件对应的财报数据存储器;根据财报存储分类条件,将财报数据导入财报数据存储器中;通过与财报数据存储器对应预设的数据读取线程,从财报数据存储器中获得财报数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从待处理财报数据中提取对应的财报数据名称;将待处理财报数据对应的财报数据名称与财报数据名称集进行名称匹配;当匹配结果一致时,从财报数据名称集中获得待处理财报数据对应的财报基准名称。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将财报基准名称替换待处理财报数据对应的财报数据名称,得到包括财报基准名称的财报基准数据。
在一个实施例中,财报处理需求包括财报结构需求和处理对象需求;处理器执行计算机程序时还实现以下步骤:查询满足处理对象需求的财报基准数据,得到待处理基准数据;按照财报结构需求对待处理基准数据进行数据结构设置,得到结构化财报数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:确定待处理财报数据对应的业务系统;查询与业务系统对应预设的财报分析标准;通过预设的财报分析标准对结构化财报数据进行财报分析,得到财报分析结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待处理财报数据和财报处理需求;
查询预设的财报词汇库,财报词汇库包括各类型财报数据对应的财报数据名称集;
将待处理财报数据与财报词汇库中的财报数据名称集进行匹配,确定待处理财报数据对应的财报基准名称;
根据待处理财报数据对应的财报基准名称对待处理财报数据进行处理,得到财报基准数据;
根据财报处理需求,对财报基准数据进行结构化处理,得到结构化财报数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取财报数据;从财报数据中提取对应的财报数据名称;按照财报数据的数据类型,将财报数据对应的财报数据名称进行名称分类,得到各财报数据名称集;为各财报数据名称集分别设置财报基准名称,根据财报基准名称和财报数据名称集得到财报词汇库。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:查询预设的财报存储分类条件和与财报存储分类条件对应的财报数据存储器;根据财报存储分类条件,将财报数据导入财报数据存储器中;通过与财报数据存储器对应预设的数据读取线程,从财报数据存储器中获得财报数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从待处理财报数据中提取对应的财报数据名称;将待处理财报数据对应的财报数据名称与财报数据名称集进行名称匹配;当匹配结果一致时,从财报数据名称集中获得待处理财报数据对应的财报基准名称。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将财报基准名称替换待处理财报数据对应的财报数据名称,得到包括财报基准名称的财报基准数据。
在一个实施例中,财报处理需求包括财报结构需求和处理对象需求;计算机程序被处理器执行时还实现以下步骤:查询满足处理对象需求的财报基准数据,得到待处理基准数据;按照财报结构需求对待处理基准数据进行数据结构设置,得到结构化财报数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:确定待处理财报数据对应的业务系统;查询与业务系统对应预设的财报分析标准;通过预设的财报分析标准对结构化财报数据进行财报分析,得到财报分析结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种财报数据处理方法,所述方法包括:
获取待处理财报数据和财报处理需求;
查询预设的财报词汇库,所述财报词汇库包括各类型财报数据对应的财报数据名称集;
将所述待处理财报数据与所述财报词汇库中的财报数据名称集进行匹配,确定所述待处理财报数据对应的财报基准名称;
根据所述待处理财报数据对应的财报基准名称对所述待处理财报数据进行处理,得到财报基准数据;
根据所述财报处理需求,对所述财报基准数据进行结构化处理,得到结构化财报数据。
2.根据权利要求1所述的方法,其特征在于,在所述查询预设的财报词汇库的步骤之前,还包括:
获取财报数据;
从所述财报数据中提取对应的财报数据名称;
按照所述财报数据的数据类型,将所述财报数据对应的所述财报数据名称进行名称分类,得到各所述财报数据名称集;
为各所述财报数据名称集分别设置财报基准名称,根据所述财报基准名称和所述财报数据名称集得到所述财报词汇库。
3.根据权利要求2所述的方法,其特征在于,在所述获取财报数据的步骤之后,还包括:
查询预设的财报存储分类条件和与所述财报存储分类条件对应的财报数据存储器;
根据所述财报存储分类条件,将所述财报数据导入所述财报数据存储器中;
通过与所述财报数据存储器对应预设的数据读取线程,从所述财报数据存储器中获得所述财报数据。
4.根据权利要求2所述的方法,其特征在于,所述将所述待处理财报数据与所述财报词汇库中的财报数据名称集进行匹配,确定所述待处理财报数据对应的财报基准名称的步骤包括:
从所述待处理财报数据中提取对应的财报数据名称;
将所述待处理财报数据对应的财报数据名称与所述财报数据名称集进行名称匹配;
当匹配结果一致时,从所述财报数据名称集中获得所述待处理财报数据对应的所述财报基准名称。
5.根据权利要求1所述的方法,其特征在于,所述根据所述待处理财报数据对应的财报基准名称对所述待处理财报数据进行处理,得到财报基准数据的步骤包括:
将所述财报基准名称替换所述待处理财报数据对应的财报数据名称,得到包括所述财报基准名称的财报基准数据。
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述财报处理需求包括财报结构需求和处理对象需求;所述根据所述财报处理需求,对所述财报基准数据进行结构化处理,得到结构化财报数据的步骤包括:
查询满足所述处理对象需求的所述财报基准数据,得到待处理基准数据;
按照所述财报结构需求对所述待处理基准数据进行数据结构设置,得到结构化财报数据。
7.根据权利要求6所述的方法,其特征在于,在所述得到结构化财报数据的步骤之后,还包括:
确定所述待处理财报数据对应的业务系统;
查询与所述业务系统对应预设的财报分析标准;
通过所述预设的财报分析标准对所述结构化财报数据进行财报分析,得到财报分析结果。
8.一种财报数据处理装置,其特征在于,所述装置包括:
待处理数据获取模块,用于获取待处理财报数据和财报处理需求;
财报词汇库查询模块,用于查询预设的财报词汇库,所述财报词汇库包括各类型财报数据对应的财报数据名称集;
基准名称匹配模块,用于将所述待处理财报数据与所述财报词汇库中的财报数据名称集进行匹配,确定所述待处理财报数据对应的财报基准名称;
财报基准数据获取模块,用于根据所述待处理财报数据对应的财报基准名称对所述待处理财报数据进行处理,得到财报基准数据;
结构化处理模块,用于根据所述财报处理需求,对所述财报基准数据进行结构化处理,得到结构化财报数据。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201811089157.0A 2018-09-18 2018-09-18 财报数据处理方法、装置、计算机设备和存储介质 Pending CN109376191A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811089157.0A CN109376191A (zh) 2018-09-18 2018-09-18 财报数据处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811089157.0A CN109376191A (zh) 2018-09-18 2018-09-18 财报数据处理方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN109376191A true CN109376191A (zh) 2019-02-22

Family

ID=65405655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811089157.0A Pending CN109376191A (zh) 2018-09-18 2018-09-18 财报数据处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN109376191A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348974A (zh) * 2019-05-21 2019-10-18 深圳壹账通智能科技有限公司 财务报表处理方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101146152A (zh) * 2006-09-14 2008-03-19 中国电信股份有限公司 用于电信信息台的信息采集和搜索系统
CN101652774A (zh) * 2007-04-03 2010-02-17 微软公司 用于财务文档转换的系统
JP2011076557A (ja) * 2009-10-02 2011-04-14 Pronexus Inc 企業財務情報データベースおよび企業財務情報提供システム
CN104731941A (zh) * 2015-03-31 2015-06-24 浪潮集团有限公司 一种基于xbrl技术从非结构化财务报告抓取数据的方法
CN106844320A (zh) * 2016-12-27 2017-06-13 税友软件集团股份有限公司 一种财务报表整合方法和设备
CN107679819A (zh) * 2017-06-12 2018-02-09 平安科技(深圳)有限公司 财务数据处理方法、装置、计算机设备和存储介质
CN107729461A (zh) * 2017-10-11 2018-02-23 江苏税软软件科技有限公司 一种税务数据采集方法
CN108241603A (zh) * 2016-12-26 2018-07-03 航天信息股份有限公司 一种财务报表生成方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101146152A (zh) * 2006-09-14 2008-03-19 中国电信股份有限公司 用于电信信息台的信息采集和搜索系统
CN101652774A (zh) * 2007-04-03 2010-02-17 微软公司 用于财务文档转换的系统
JP2011076557A (ja) * 2009-10-02 2011-04-14 Pronexus Inc 企業財務情報データベースおよび企業財務情報提供システム
CN104731941A (zh) * 2015-03-31 2015-06-24 浪潮集团有限公司 一种基于xbrl技术从非结构化财务报告抓取数据的方法
CN108241603A (zh) * 2016-12-26 2018-07-03 航天信息股份有限公司 一种财务报表生成方法及系统
CN106844320A (zh) * 2016-12-27 2017-06-13 税友软件集团股份有限公司 一种财务报表整合方法和设备
CN107679819A (zh) * 2017-06-12 2018-02-09 平安科技(深圳)有限公司 财务数据处理方法、装置、计算机设备和存储介质
CN107729461A (zh) * 2017-10-11 2018-02-23 江苏税软软件科技有限公司 一种税务数据采集方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348974A (zh) * 2019-05-21 2019-10-18 深圳壹账通智能科技有限公司 财务报表处理方法和装置

Similar Documents

Publication Publication Date Title
US9772890B2 (en) Sophisticated run-time system for graph processing
CN109558440A (zh) 数据批量处理方法、装置、计算机设备及存储介质
US20060235771A1 (en) System and method for managing item interchange and identification in an extended enterprise
CN104133772A (zh) 一种自动生成测试数据的方法
CN106293891B (zh) 多维投资指标监督方法
CN111639480A (zh) 基于人工智能的文本标签化方法、电子装置及存储介质
WO2021253641A1 (zh) 着色语言翻译方法
US10671631B2 (en) Method, apparatus, and computer-readable medium for non-structured data profiling
CN111984659B (zh) 数据更新方法、装置、计算机设备和存储介质
CN114328682A (zh) 一种基于规则引擎的数据处理方法、装置、设备及介质
US20220245125A1 (en) Dataset multiplexer for data processing system
CN110275703B (zh) 键值对数据的赋值方法、装置、计算机设备和存储介质
US20180329873A1 (en) Automated data extraction system based on historical or related data
US11025575B2 (en) Message recognition system and method configurable to define new message formats
CN114297204A (zh) 一种异构数据源的数据存储、检索方法及装置
CN104933096A (zh) 数据库的异常键识别方法、装置与数据系统
CN109376191A (zh) 财报数据处理方法、装置、计算机设备和存储介质
US20230274097A1 (en) System and method for implementing an open digital rights language (odrl) visualizer
CN107430633A (zh) 与数据存储系统相关联的经相关优化的代表性内容
US7085759B2 (en) System and method for communicating data to a process
CN111798309B (zh) 风控变量加工系统、方法及可读介质
CN109410069A (zh) 结算数据处理方法、装置、计算机设备和存储介质
CN114625372A (zh) 组件自动编译方法、装置、计算机设备及存储介质
CN112395291A (zh) 一种根据数据资产动态生成宽表的方法及系统
US9471569B1 (en) Integrating information sources to create context-specific documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190222