CN116244362A - 金融大数据管理平台系统及方法 - Google Patents

金融大数据管理平台系统及方法 Download PDF

Info

Publication number
CN116244362A
CN116244362A CN202211697741.0A CN202211697741A CN116244362A CN 116244362 A CN116244362 A CN 116244362A CN 202211697741 A CN202211697741 A CN 202211697741A CN 116244362 A CN116244362 A CN 116244362A
Authority
CN
China
Prior art keywords
financial
data
original
financial data
form template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211697741.0A
Other languages
English (en)
Inventor
林涛
肖维
林大鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Datacom Corp ltd
Original Assignee
China Datacom Corp ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Datacom Corp ltd filed Critical China Datacom Corp ltd
Priority to CN202211697741.0A priority Critical patent/CN116244362A/zh
Publication of CN116244362A publication Critical patent/CN116244362A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明适用于数据管理技术领域,提供了金融大数据管理平台系统及方法,所述方法包括以下步骤:扫描纸质金融表单得到金融数据原始表单;将金融数据原始表单输入至表单模板库中,输出表单模板,所述表单模板被划分成多个区间,每个区间对应有数据属性;将金融数据原始表单与表单模板进行对比,确定金融数据原始表单中的每个区间,识别出每个区间中的数据;根据每个区间对应的数据属性将所述数据导入至金融汇总表的相应位置,对金融汇总表进行更新,所述数据属性用来表明数据类型以及在金融汇总表中的位置。如此,本发明能够快速对纸质金融表单进行汇总管理,且实现了自动化的金融数据管理,避免了人工手动上传出现错误的情况。

Description

金融大数据管理平台系统及方法
技术领域
本发明涉及数据管理技术领域,具体是涉及一种金融大数据管理平台系统及方法。
背景技术
随着自动化办公深入各类企业,金融数据的管理也实现的软件化和系统化,企业员工尽可能使用电子账单进行各种金融交易,这样也便于将电子账单直接导入金融管理系统中,金融数据的管理更加方便,但是在实际的有关金融业务交易的过程中,使用各种纸质金融表单是难以避免,纸质金融表单中的金融数据需要人工手动上传至金融管理系统中,以实现各种金融数据的汇总,但是人工手动上传难免会出现错误,会增加金融数据复核的工作量。因此,需要提供一种金融大数据管理平台系统及方法,旨在解决上述问题。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种金融大数据管理平台系统及方法,以解决上述背景技术中存在的问题。
本发明是这样实现的,一种金融大数据管理方法,所述方法包括以下步骤:
扫描纸质金融表单得到金融数据原始表单;
将金融数据原始表单输入至表单模板库中,输出表单模板,所述表单模板被划分成多个区间,每个区间对应有数据属性;
将金融数据原始表单与表单模板进行对比,确定金融数据原始表单中的每个区间,识别出每个区间中的数据;
根据每个区间对应的数据属性将所述数据导入至金融汇总表的相应位置,对金融汇总表进行更新,所述数据属性用来表明数据类型以及在金融汇总表中的位置。
作为本发明进一步的方案:所述将金融数据原始表单输入至表单模板库中,输出表单模板的步骤,具体包括:
将金融数据原始表单输入至表单模板库中,所述表单模板库中包含各种表单模板;
将金融数据原始表单与表单模板库中的所有表单模板依次进行相似度匹配,输出相似度最高的表单模板。
作为本发明进一步的方案:金融数据原始表单与表单模板进行相似度匹配的步骤,具体包括:
用基于DCT的hash方法分别计算金融数据原始表单与表单模板的hash值,得到h_1和h_2;
计算h_1和h_2之间的汉明距离dis_h;
根据汉明距离dis_h计算得到金融数据原始表单与表单模板之间的相似度。
作为本发明进一步的方案:所述方法还包括调取出员工个人的所有金融数据原始表单,具体步骤为:
根据表单模板识别出金融数据原始表单所对应的员工姓名,所述表单模板中还包括姓名区间;
根据识别出的员工姓名对所有采集的金融数据原始表单进行分类并存储;
生成员工个人汇总表;
将每一类的金融数据原始表单和员工个人汇总表发送至对应的员工个人账号中。
作为本发明进一步的方案:所述根据识别出的员工姓名对所有采集的金融数据原始表单进行分类并存储的步骤还包括:
对每一类中的金融数据原始表单进行唯一性查验;
当判定某一类中存在两个完全相同的金融数据原始表单时,任意删除其中一个金融数据原始表单。
本发明的另一目的在于提供一种金融大数据管理平台系统,所述系统包括:
原始表单采集模块,用于扫描纸质金融表单得到金融数据原始表单;
表单模板确定模块,用于将金融数据原始表单输入至表单模板库中,输出表单模板,所述表单模板被划分成多个区间,每个区间对应有数据属性;
金融数据识别模块,用于将金融数据原始表单与表单模板进行对比,确定金融数据原始表单中的每个区间,识别出每个区间中的数据;
金融汇总表更新模块,用于根据每个区间对应的数据属性将所述数据导入至金融汇总表的相应位置,对金融汇总表进行更新,所述数据属性用来表明数据类型以及在金融汇总表中的位置。
作为本发明进一步的方案:所述表单模板确定模块包括:
原始表单输入单元,用于将金融数据原始表单输入至表单模板库中,所述表单模板库中包含各种表单模板;
相似度匹配单元,用于将金融数据原始表单与表单模板库中的所有表单模板依次进行相似度匹配,输出相似度最高的表单模板。
作为本发明进一步的方案:所述相似度匹配单元包括:
hash值计算子单元,用基于DCT的hash方法分别计算金融数据原始表单与表单模板的hash值,得到h_1和h_2;
汉明距离计算子单元,用于计算h_1和h_2之间的汉明距离dis_h;
相似度确定子单元,用于根据汉明距离dis_h计算得到金融数据原始表单与表单模板之间的相似度。
作为本发明进一步的方案:所述系统还包括个人汇总表生成模块,个人汇总表生成模块具体包括:
员工姓名识别单元,用于根据表单模板识别出金融数据原始表单所对应的员工姓名,所述表单模板中还包括姓名区间;
原始表单分类单元,用于根据识别出的员工姓名对所有采集的金融数据原始表单进行分类并存储;
个人汇总表生成单元,用于生成员工个人汇总表;
个人信息发送单元,用于将每一类的金融数据原始表单和员工个人汇总表发送至对应的员工个人账号中。
作为本发明进一步的方案:所述原始表单分类单元包括:
唯一性查验子单元,用于对每一类中的金融数据原始表单进行唯一性查验;
重复表单删除子单元,当判定某一类中存在两个完全相同的金融数据原始表单时,任意删除其中一个金融数据原始表单。
与现有技术相比,本发明的有益效果是:
本发明通过扫描纸质金融表单得到金融数据原始表单;将金融数据原始表单输入至表单模板库中,输出表单模板,所述表单模板被划分成多个区间,每个区间对应有数据属性;并将金融数据原始表单与表单模板进行对比,确定金融数据原始表单中的每个区间,识别出每个区间中的数据;最后根据每个区间对应的数据属性将所述数据导入至金融汇总表的相应位置。所述数据属性用来表明数据类型以及在金融汇总表中的位置,这样识别出的数据就能够被自动导入金融汇总表中的正确位置。如此,本发明能够快速对纸质金融表单进行汇总管理,且实现了自动化的金融数据管理,避免了人工手动上传出现错误的情况。
附图说明
图1为一种金融大数据管理方法的流程图。
图2为一种金融大数据管理方法中将金融数据原始表单输入至表单模板库中,输出表单模板的流程图。
图3为一种金融大数据管理方法中金融数据原始表单与表单模板进行相似度匹配的流程图。
图4为一种金融大数据管理方法中调取出员工个人的所有金融数据原始表单的流程图。
图5为一种金融大数据管理方法中对每一类中的金融数据原始表单进行唯一性查验的流程图。
图6为一种金融大数据管理平台系统的结构示意图。
图7为一种金融大数据管理平台系统中表单模板确定模块的结构示意图。
图8为一种金融大数据管理平台系统中相似度匹配单元的结构示意图。
图9为一种金融大数据管理平台系统中个人汇总表生成模块的结构示意图。
图10为一种金融大数据管理平台系统中原始表单分类单元的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清晰,以下结合附图及具体实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述。
如图1所示,本发明实施例提供了一种金融大数据管理方法,所述方法包括以下步骤:
S100,扫描纸质金融表单得到金融数据原始表单;
S200,将金融数据原始表单输入至表单模板库中,输出表单模板,所述表单模板被划分成多个区间,每个区间对应有数据属性;
S300,将金融数据原始表单与表单模板进行对比,确定金融数据原始表单中的每个区间,识别出每个区间中的数据;
S400,根据每个区间对应的数据属性将所述数据导入至金融汇总表的相应位置,对金融汇总表进行更新,所述数据属性用来表明数据类型以及在金融汇总表中的位置。
本发明实施例中,首先需要工作人员将所有的纸质金融表单进行汇总,然后依次对每个纸质金融表单进行扫描,可得到金融数据原始表单,接着本发明实施例会将金融数据原始表单输入至表单模板库中,输出表单模板,输出的表单模板与金融数据原始表单未填写金融数据时一样,所述表单模板被划分成多个区间,每个区间对应有数据属性,需要说明的是,表单模板库需要提前建立,表单模板库中包含了各种金融交易过程中需要使用的表单模板,容易理解,表单模板库需要不断进行更新和完善;接着将金融数据原始表单与表单模板进行对比,确定金融数据原始表单中的每个区间,容易理解,金融数据原始表单中的区间与表单模板中的区间一一对应,然后识别出每个区间中的数据;然后根据每个区间对应的数据属性将所述数据导入至金融汇总表的相应位置,对金融汇总表进行更新,所述数据属性用来表明数据类型以及在金融汇总表中的位置,这样识别出的数据就能够被自动导入金融汇总表中的正确位置。如此,本发明实施例能够快速对纸质金融表单进行汇总管理,且实现了自动化的金融数据管理,避免了人工手动上传出现错误的情况。
如图2所示,作为本发明一个优选的实施例,所述将金融数据原始表单输入至表单模板库中,输出表单模板的步骤,具体包括:
S201,将金融数据原始表单输入至表单模板库中,所述表单模板库中包含各种表单模板;
S202,将金融数据原始表单与表单模板库中的所有表单模板依次进行相似度匹配,输出相似度最高的表单模板。
本发明实施例中,为了找到每个金融数据原始表单对应的表单模板,需要将金融数据原始表单输入至表单模板库中,接着将金融数据原始表单与表单模板库中的所有表单模板依次进行相似度匹配,得到多个具体的相似度数值,最后输出相似度最高的表单模板。
如图3所示,作为本发明一个优选的实施例,金融数据原始表单与表单模板进行相似度匹配的步骤,具体包括:
S2021,用基于DCT的hash方法分别计算金融数据原始表单与表单模板的hash值,得到h_1和h_2;
S2022,计算h_1和h_2之间的汉明距离dis_h;
S2023,根据汉明距离dis_h计算得到金融数据原始表单与表单模板之间的相似度。
本发明实施例中,基于DCT的hash方法对图像进行识别为现有技术中的一种AI图像识别方法,所述基于DCT的hash方法使用离散余弦变换提取图像的低频成分,先将图像转换成标准大小的灰度图,然后对灰度图做DCT变换,再从系数矩阵中提取出64位的hash值作为指纹,这种计算两张图像之间相似度的方法为现有技术,其中根据汉明距离dis_h计算得到金融数据原始表单与表单模板之间的相似度的步骤,具体包括:对dis_h的值进行判定;当dis_h≤10时,相似度P=1-dis_h/100;当dis_h≥25时,相似度P=4*(64-dis_h)/195;当10<dis_h<25时,相似度P=[(25-dis_h)/150+0.8]*0.5+pcc*0.5,所述pcc为皮尔逊相关系数。本发明实施例中相似度计算方法为现有的公开技术,这里不再赘述。
如图4所示,作为本发明一个优选的实施例,所述方法还包括调取出员工个人的所有金融数据原始表单,具体步骤为:
S501,根据表单模板识别出金融数据原始表单所对应的员工姓名,所述表单模板中还包括姓名区间;
S502,根据识别出的员工姓名对所有采集的金融数据原始表单进行分类并存储;
S503,生成员工个人汇总表;
S504,将每一类的金融数据原始表单和员工个人汇总表发送至对应的员工个人账号中。
本发明实施例中,容易理解,之前得到的金融汇总表是对整个部门或者整个公司的纸质金融表单的统一管理,不能够体现出员工个人的金融数据,为了能够体现出员工个人的金融数据,本发明实施例会根据表单模板识别出金融数据原始表单所对应的员工姓名,所述表单模板中还包括姓名区间;直接文字识别姓名区间中的文字,即可得到员工姓名,然后根据识别出的员工姓名对所有采集的金融数据原始表单进行分类并存储;得到员工个人汇总表;最后将每一类的金融数据原始表单和员工个人汇总表发送至对应的员工个人账号中,这样方便员工查验员工个人汇总表是否准确。
如图5所示,作为本发明一个优选的实施例,所述根据识别出的员工姓名对所有采集的金融数据原始表单进行分类并存储的步骤还包括:
S5021,对每一类中的金融数据原始表单进行唯一性查验;
S5022,当判定某一类中存在两个完全相同的金融数据原始表单时,任意删除其中一个金融数据原始表单。
本发明实施例中,容易理解,金融数据原始表单可能会出现重复的情况,为了避免重复统计,保证金融数据的准确性,本发明会对每一类中的金融数据原始表单进行唯一性查验;当检测出某一类中存在两个完全相同的金融数据原始表单时,任意删除其中一个金融数据原始表单,只保留其中一个金融数据原始表单进行统计。
如图6所示,本发明实施例还提供了一种金融大数据管理平台系统,所述系统包括:
原始表单采集模块100,用于扫描纸质金融表单得到金融数据原始表单;
表单模板确定模块200,用于将金融数据原始表单输入至表单模板库中,输出表单模板,所述表单模板被划分成多个区间,每个区间对应有数据属性;
金融数据识别模块300,用于将金融数据原始表单与表单模板进行对比,确定金融数据原始表单中的每个区间,识别出每个区间中的数据;
金融汇总表更新模块400,用于根据每个区间对应的数据属性将所述数据导入至金融汇总表的相应位置,对金融汇总表进行更新,所述数据属性用来表明数据类型以及在金融汇总表中的位置。
本发明实施例中,首先需要工作人员将所有的纸质金融表单进行汇总,然后依次对每个纸质金融表单进行扫描,可得到金融数据原始表单,接着本发明实施例会将金融数据原始表单输入至表单模板库中,输出表单模板,输出的表单模板与金融数据原始表单未填写金融数据时一样,所述表单模板被划分成多个区间,每个区间对应有数据属性,需要说明的是,表单模板库需要提前建立,表单模板库中包含了各种金融交易过程中需要使用的表单模板,容易理解,表单模板库需要不断进行更新和完善;接着将金融数据原始表单与表单模板进行对比,确定金融数据原始表单中的每个区间,容易理解,金融数据原始表单中的区间与表单模板中的区间一一对应,然后识别出每个区间中的数据;然后根据每个区间对应的数据属性将所述数据导入至金融汇总表的相应位置,对金融汇总表进行更新,所述数据属性用来表明数据类型以及在金融汇总表中的位置,这样识别出的数据就能够被自动导入金融汇总表中的正确位置。如此,本发明实施例能够快速对纸质金融表单进行汇总管理,且实现了自动化的金融数据管理,避免了人工手动上传出现错误的情况。
如图7所示,作为本发明一个优选的实施例,所述表单模板确定模块200包括:
原始表单输入单元201,用于将金融数据原始表单输入至表单模板库中,所述表单模板库中包含各种表单模板;
相似度匹配单元202,用于将金融数据原始表单与表单模板库中的所有表单模板依次进行相似度匹配,输出相似度最高的表单模板。
如图8所示,作为本发明一个优选的实施例,所述相似度匹配单元202包括:
hash值计算子单元2021,用基于DCT的hash方法分别计算金融数据原始表单与表单模板的hash值,得到h_1和h_2;
汉明距离计算子单元2022,用于计算h_1和h_2之间的汉明距离dis_h;
相似度确定子单元2023,用于根据汉明距离dis_h计算得到金融数据原始表单与表单模板之间的相似度。
如图9所示,作为本发明一个优选的实施例,所述系统还包括个人汇总表生成模块500,个人汇总表生成模块500具体包括:
员工姓名识别单元501,用于根据表单模板识别出金融数据原始表单所对应的员工姓名,所述表单模板中还包括姓名区间;
原始表单分类单元502,用于根据识别出的员工姓名对所有采集的金融数据原始表单进行分类并存储;
个人汇总表生成单元503,用于生成员工个人汇总表;
个人信息发送单元504,用于将每一类的金融数据原始表单和员工个人汇总表发送至对应的员工个人账号中。
如图10所示,作为本发明一个优选的实施例,所述原始表单分类单元502包括:
唯一性查验子单元5021,用于对每一类中的金融数据原始表单进行唯一性查验;
重复表单删除子单元5022,当判定某一类中存在两个完全相同的金融数据原始表单时,任意删除其中一个金融数据原始表单。
以上仅对本发明的较佳实施例进行了详细叙述,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来命令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实施例处的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

Claims (10)

1.金融大数据管理方法,其特征在于,所述方法包括以下步骤:
扫描纸质金融表单得到金融数据原始表单;
将金融数据原始表单输入至表单模板库中,输出表单模板,所述表单模板被划分成多个区间,每个区间对应有数据属性;
将金融数据原始表单与表单模板进行对比,确定金融数据原始表单中的每个区间,识别出每个区间中的数据;
根据每个区间对应的数据属性将所述数据导入至金融汇总表的相应位置,对金融汇总表进行更新,所述数据属性用来表明数据类型以及在金融汇总表中的位置。
2.根据权利要求1所述的金融大数据管理方法,其特征在于,所述将金融数据原始表单输入至表单模板库中,输出表单模板的步骤,具体包括:
将金融数据原始表单输入至表单模板库中,所述表单模板库中包含各种表单模板;
将金融数据原始表单与表单模板库中的所有表单模板依次进行相似度匹配,输出相似度最高的表单模板。
3.根据权利要求2所述的金融大数据管理方法,其特征在于,金融数据原始表单与表单模板进行相似度匹配的步骤,具体包括:
用基于DCT的hash方法分别计算金融数据原始表单与表单模板的hash值,得到h_1和h_2;
计算h_1和h_2之间的汉明距离dis_h;
根据汉明距离dis_h计算得到金融数据原始表单与表单模板之间的相似度。
4.根据权利要求1所述的金融大数据管理方法,其特征在于,所述方法还包括调取出员工个人的所有金融数据原始表单,具体步骤为:
根据表单模板识别出金融数据原始表单所对应的员工姓名,所述表单模板中还包括姓名区间;
根据识别出的员工姓名对所有采集的金融数据原始表单进行分类并存储;
生成员工个人汇总表;
将每一类的金融数据原始表单和员工个人汇总表发送至对应的员工个人账号中。
5.根据权利要求4所述的金融大数据管理方法,其特征在于,所述根据识别出的员工姓名对所有采集的金融数据原始表单进行分类并存储的步骤还包括:
对每一类中的金融数据原始表单进行唯一性查验;
当判定某一类中存在两个完全相同的金融数据原始表单时,任意删除其中一个金融数据原始表单。
6.金融大数据管理平台系统,其特征在于,所述系统包括:
原始表单采集模块,用于扫描纸质金融表单得到金融数据原始表单;
表单模板确定模块,用于将金融数据原始表单输入至表单模板库中,输出表单模板,所述表单模板被划分成多个区间,每个区间对应有数据属性;
金融数据识别模块,用于将金融数据原始表单与表单模板进行对比,确定金融数据原始表单中的每个区间,识别出每个区间中的数据;
金融汇总表更新模块,用于根据每个区间对应的数据属性将所述数据导入至金融汇总表的相应位置,对金融汇总表进行更新,所述数据属性用来表明数据类型以及在金融汇总表中的位置。
7.根据权利要求6所述的金融大数据管理平台系统,其特征在于,所述表单模板确定模块包括:
原始表单输入单元,用于将金融数据原始表单输入至表单模板库中,所述表单模板库中包含各种表单模板;
相似度匹配单元,用于将金融数据原始表单与表单模板库中的所有表单模板依次进行相似度匹配,输出相似度最高的表单模板。
8.根据权利要求7所述的金融大数据管理平台系统,其特征在于,所述相似度匹配单元包括:
hash值计算子单元,用基于DCT的hash方法分别计算金融数据原始表单与表单模板的hash值,得到h_1和h_2;
汉明距离计算子单元,用于计算h_1和h_2之间的汉明距离dis_h;
相似度确定子单元,用于根据汉明距离dis_h计算得到金融数据原始表单与表单模板之间的相似度。
9.根据权利要求6所述的金融大数据管理平台系统,其特征在于,所述系统还包括个人汇总表生成模块,个人汇总表生成模块具体包括:
员工姓名识别单元,用于根据表单模板识别出金融数据原始表单所对应的员工姓名,所述表单模板中还包括姓名区间;
原始表单分类单元,用于根据识别出的员工姓名对所有采集的金融数据原始表单进行分类并存储;
个人汇总表生成单元,用于生成员工个人汇总表;
个人信息发送单元,用于将每一类的金融数据原始表单和员工个人汇总表发送至对应的员工个人账号中。
10.根据权利要求9所述的金融大数据管理平台系统,其特征在于,所述原始表单分类单元包括:
唯一性查验子单元,用于对每一类中的金融数据原始表单进行唯一性查验;
重复表单删除子单元,当判定某一类中存在两个完全相同的金融数据原始表单时,任意删除其中一个金融数据原始表单。
CN202211697741.0A 2022-12-28 2022-12-28 金融大数据管理平台系统及方法 Pending CN116244362A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211697741.0A CN116244362A (zh) 2022-12-28 2022-12-28 金融大数据管理平台系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211697741.0A CN116244362A (zh) 2022-12-28 2022-12-28 金融大数据管理平台系统及方法

Publications (1)

Publication Number Publication Date
CN116244362A true CN116244362A (zh) 2023-06-09

Family

ID=86630503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211697741.0A Pending CN116244362A (zh) 2022-12-28 2022-12-28 金融大数据管理平台系统及方法

Country Status (1)

Country Link
CN (1) CN116244362A (zh)

Similar Documents

Publication Publication Date Title
WO2019218475A1 (zh) 异常行为对象的识别方法、装置、终端设备及介质
CN110377631B (zh) 案件信息处理方法、装置、计算机设备和存储介质
CN115017272B (zh) 基于登记数据的智能核验方法及装置
CN113065940B (zh) 基于人工智能的发票报销的方法、装置、设备及存储介质
CN110689325A (zh) 信息处理方法、装置及计算机可读存储介质
CN110363222B (zh) 用于模型训练的图片标注方法、装置、计算机设备及存储介质
CN109767346B (zh) 车辆业务处理方法、装置、计算机设备和存储介质
CN113590823A (zh) 一种合同审批方法、装置、存储介质及电子设备
CN114625721B (zh) 个性化云数据库的建立方法、装置、设备及存储介质
CN113255496A (zh) 基于区块链技术的财务费用报销管理方法
CN111104542B (zh) 零件识别管理方法及装置
CN110457332B (zh) 一种信息处理方法及相关设备
CN111813946A (zh) 医疗信息反馈方法、装置、设备及可读存储介质
CN115455266B (zh) 一种电子档案自动采集归档方法及系统
CN116244362A (zh) 金融大数据管理平台系统及方法
CN112507672A (zh) 一种工资表数据采集方法、装置、系统及存储介质
CN114708445B (zh) 一种商标相似度识别方法、装置、电子设备及存储介质
CN115587098A (zh) 一种智能识别图表数据的方法及系统
CN115293871A (zh) 一种多终端的财务数据管理方法及系统
CN114445834A (zh) 结合rpa和ai的医疗单据处理方法及装置
CN113837170A (zh) 车辆保险理赔申请的自动审核处理方法、装置及设备
CN114202530A (zh) 分析损伤程度的方法、装置、设备及存储介质
CN116719783B (zh) 提取进馆ofd档案文件元数据规范填入档案著录项的方法
CN116664066B (zh) 一种管理企业计划收入与实际收入的方法及系统
CN115640952B (zh) 一种数据导入上传的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication