发明内容
本申请提供了一种基于大数据的集团员工挂账审计方法及装置,以解决审计速度较慢的问题。
第一方面,本申请提供了一种基于大数据的集团员工挂账审计方法,该方法包括:按照预置周期,将待审计数据库中的财务数据备份至对应的子服务器;根据总服务器和子服务器的分布式关系,将子服务器中的财务数据备份至总服务器;总服务器选取所述财务数据中的有意义字段;总服务器按照所述有意义字段的语义,逻辑排列组合所述有意义字段,生成字段集合;总服务器将所述字段集合,确定为待审计数据结构;总服务器获取所述财务数据中所述待审计数据结构对应的待审计数据;总服务器判断预置特定字段的待审计数据是否为风险财务数据;如果所述预置特定字段的待审计数据为风险财务数据,总服务器向所述预置特定字段的待审计数据对应的子服务器发送告警信息。采用本实现方式,按照预置周期将待审计数据库中的财务数据备份至子服务器,然后子服务器将财务数据备份至总服务器,财务数据自动备份至总服务器,可以在审计时直接获取数据不需要等待从待审计数据库中获取,提高数据的获取速度。根据有意义字段的排列组合形成待审计数据结构,然后从财务数据中选取待审计数据,减少数据量以提高数据处理速度。通过预置特定字段直接判断待审计数据是否为风险财务数据,即从待审计数据中选取部分待审计数据判断待审计数据是否为财务数据,再次减少数据量,以提高风险财务数据的判断速度。
结合第一方面,在第一方面第一种可能的实现方式中,所述选取所述财务数据中的有意义字段,包括:获取字段名称;在所述财务数据中,查找所述字段名称对应的摘要数据;判断所述摘要数据中是否包含预置筛选关键字;如果判断结果为是,则确定所述字段名称是有意义字段。采用本实现方式,由于摘要信息是对字段对应的财务数据的具体描述,能准确的反映字段的含义,避免因字段名称不同而未获取到全部有意义字段。
结合第一方面,在第一方面的第二种可能的实现方式中,所述预置特定字段包括员工编号、借方金额、贷方金额、会计年度和会计期间;所述风险财务数据包括经济责任财务数据、套取资金财务数据和坏账财务数据;所述总服务器判断预置特定字段的待审计数据是否为风险财务数据,包括:获取所述待审计数据的所述借方金额对应的借方金额数据,贷方金额对应的贷方金额数据;如果所述借方金额数据大于第一阈值,则确定所述借方金额数据对应的待审计数据为经济责任财务数据;如果贷方金额数据大于第二阈值,则确定所述贷方金额数据对应的待审计数据为所述经济责任财务数据;计算所述待审计数据中借贷差额;如果所述借贷差额大于第三阈值,则确定所述借贷差额对应的待审计数据为套取资金财务数据;如果所述借贷差额大于零,并且小于或等于所述第三阈值,则获取所述借贷差额的初始记录时间;计算所述初始记录时间与当前时间的时间差;如果所述时间差大于第四阈值,则确定所述时间差对应的待审计数据为坏账财务数据。采用本实现方式,通过预置特定字段,按照一定的判断规则能够判别出待审计数据属于哪种风险财务数据类型,不需要对待审计数据进行二次判断,提高审计速度。
结合第一方面,在第一方面的第三种可能的实现方式中,所述如果所述借方金额数据大于第一阈值,则确定所述借方金额数据对应的待审计数据为经济责任财务数据,包括:获取所述待审计的借方金额数据;按照预置排序算法,将所述借方金额数据从大到小排序;根据预置查找算法,查找所述借方金额数据大于所述第一阈值的风险员工编号数据;确定所述风险员工编号数据对应的待审计数据为所述经济责任财务数据。采用本实现方式,以借方金额数据作为判断经济责任财务数据的依据,通过预置排序算法将借方金额数据进行排序,然后从中选取大于第一阈值的借方金额数据所对应的风险员工编号对应的待审计数据为经济责任财务数据,将风险员工编号对应的待审计数据都作为经济责任数据,能准确并快速地确定风险财务数据。
结合第一方面,在第一方面的第四种可能的实现方式中,所述如果贷方金额数据大于第二阈值,则确定所述贷方金额数据对应的待审计数据为所述经济责任财务数据,包括:获取所述待审计的贷方金额数据;按照预置排序算法,将所述贷方金额数据从大到小排序;根据预置查找算法,查找所述贷方金额数据大于所述第二阈值的风险员工编号数据;确定所述风险员工编号数据对应的待审计数据为所述经济责任财务数据。采用本实现方法,以贷方金额数据作为判断经济责任财务数据的依据,通过预置排序算法将贷方金额数据进行排序,然后从中选取大于第二阈值的贷方金额数据所对应的风险员工编号对应的待审计数据为经济责任财务数据,将风险员工编号对应的待审计数据都作为经济责任数据,能准确并快速地确定风险财务数据。
结合第一方面,在第一方面的第五种可能的实现方式中,所述如果所述借贷差额大于第三阈值,则确定所述借贷差额对应的待审计数据为套取资金财务数据,包括:获取所述待审计的借贷差额;按照预置排序算法,将所述借贷差额从大到小排序;根据预置查找算法,查找所述借贷差额大于所述第三阈值的风险员工编号数据;确定所述风险员工编号数据对应的待审计数据为所述套取资金财务数据。采用本实现方法,以借贷差额作为判断经济责任财务数据的依据,通过预置排序算法将借贷差额进行排序,然后从中选取大于第三阈值的借贷差额所对应的风险员工编号对应的待审计数据为经济责任财务数据,将风险员工编号对应的待审计数据都作为经济责任数据,能准确并快速地确定风险财务数据。
结合第一方面,在第一方面的第六种可能的实现方式中,所述获取所述借贷差额的初始记录时间,包括:查找所述借贷差额对应的会计年度数据和会计期间数据;将所述会计年度数据和所述会计期间数据,组合为所述借贷差额对应的录入时间;确定所述录入时间为所述初始记录时间。采用本实现方法,通过记录在该条财务数据录入的会计年度数据和会计期间数据,能够提高确定初始录入时间的速度。
结合第一方面,在第一方面的第七种可能的实现方式中,所述如果所述时间差大于第四阈值,则确定所述时间差对应的待审计数据为坏账财务数据,包括:获取所述时间差;按照预置排序算法,将所述时间差从大到小排序;根据预置查找算法,查找所述时间间隔大于所述第四阈值的风险员工编号数据;确定所述风险员工编号数据对应的待审计数据为所述坏账财务数据。采用本实现方法,以时间差作为判断经济责任财务数据的依据,通过预置排序算法将时间差进行排序,然后从中选取大于第四阈值的时间差所对应的风险员工编号对应的待审计数据为经济责任财务数据,将风险员工编号对应的待审计数据都作为经济责任数据,能准确并快速地确定风险财务数据。
第二方面,本申请还提供了一种基于大数据的集团员工挂账审计装置,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器;其中,存储器存储有可被所述至少一个处理器执行的指令,以使所述至少一个处理器能够执行如第一方面所述的基于大数据的集团员工挂账审计方法。
第三方面,本申请还提供了一种存储介质,该计算机存储介质可存储有程序,该程序执行时可实现包括本申请提供的基于大数据的集团员工挂账审计方法各实施例中的部分或全部步骤。
具体实施方式
参见图1,为本申请提供的集团服务器架构示意图。如图1所示,服务器1为总服务器,服务器11、服务器12、服务器13为子服务器。图1中的集团服务器架构是一种简单的服务器结构,而现有的集团总服务器与其旗下的子集团或子公司的子服务器之间的结构更为复杂,包括分布式、父子、多级等。分布式服务器就是指数据和程序可以不位于一个服务器上,而是分散到多个服务器,是一种理论计算模型服务器形式。分布式有利于任务在整个计算机系统上进行分配与优化,克服了传统集中式系统会导致中心主机资源紧张与响应瓶颈的缺陷。
参见图2,为本申请提供的一种基于大数据的集团员工挂账审计方法流程图,该方法包括如下步骤:
步骤201,按照预置周期,将待审计数据库中的财务数据备份至对应的子服务器。
财务数据,是由财务人员在各个子集团或者子公司的终端人工录入的。在录入过程中可以应用现有的财务软件,在本申请实施例中对应用的财务软件的种类不做限定。录入的所有财务数据都保存在待审计数据库中。预置周期的单位,可以是周、月、季度、或者年,在本申请实施例中对预置周期的单位不做限定。将待审计数据库中的财务数据备份至子服务器,备份的财务数据被其所属的子公司或者子集团的名称。
步骤202,根据总服务器和子服务器的分布式关系,将子服务器中的财务数据备份至总服务器。
分布式服务器就是指数据和程序可以不位于一个服务器上,而是分散到多个服务器,是一种理论计算模型服务器形式。根据总服务器和子服务器的分布式关系,获取与子服务器对应的财务数据,并将所有子服务器中的财务数据都备份是总服务器。
步骤203,总服务器选取财务数据中的有意义字段。
财务数据,关于财务科目的命名都是同一的,无论使用什么种类的财务软件,其命名的名称都是一样的。但是在财务数据中除了金钱的留下,还有其他的物品记录,所以需要总服务器选取财务数据中的有意义字段,以便后续根据有意义字段进行风险财务数据的判断。有意义字段,是指员工挂账相关的,具有明确金钱流向的财务科目。
步骤204,总服务器按照有意义字段的语义,逻辑排列组合有意义字段,生成字段集合。
获取有意义字段的语义,逻辑排列组合有意义字段,根据对审计对象的要求,生成字段集合。字段集合中包括部分有意义字段,并且有意义字段按照固定的排列顺序。比如审计对象是所有员工,那么员工的唯一标识是员工编号,那么将员工编号排列在字段集合中第一位,然后获取与该员工编号相关的有意义字段,计算各个有意义字段与员工编号的关联程度,根据关联程度的不同排列有意义字段。按照关联程度从大到小排列,选取关联程度值大于零的有意义字段,组合生成字段集合。
步骤205,总服务器将字段集合,确定为待审计数据结构。
步骤206,总服务器获取财务数据中待审计数据结构对应的待审计数据。
根据待审计数据结构,从总服务器中备份的财务数据中获取待审计数据。待审计数据,是财务数据中的部分数据,减少最终审计的数据量以提高审计速度。
步骤207,总服务器判断预置特定字段的待审计数据是否为风险财务数据。
预置特定字段,是部分有意义字段,判断风险财务数据的依据。预置特定字段包括的字段不同,能够判断出的风险财务数据也不相同。
步骤208,如果预置特定字段的待审计数据为风险财务数据,总服务器向预置特定字段的待审计数据对应的子服务器发送告警信息。
将告警信息反馈至子服务器,以便子服务器将告警信息反馈至对应的子公司或者子集团,为后续的经营提供依据。
从上述实施例可以看出,按照预置周期将待审计数据库中的财务数据备份至子服务器,然后子服务器将财务数据备份至总服务器,财务数据自动备份至总服务器,可以在审计时直接获取数据不需要等待从待审计数据库中获取,提高数据的获取速度。根据有意义字段的排列组合形成待审计数据结构,然后从财务数据中选取待审计数据,减少数据量以提高数据处理速度。通过预置特定字段直接判断待审计数据是否为风险财务数据,即从待审计数据中选取部分待审计数据判断待审计数据是否为财务数据,再次减少数据量,也能够提高风险财务数据的判断速度。
参见图3,为本申请提供的一种选取财务中的有意义字段的方法流程图,也即图2所示步骤203,可以进一步包括如下步骤:
步骤301,获取字段名称。
获取字段名称,也就是财务数据中的科目名称。
步骤302,在财务数据中,查找字段名称对应的摘要数据。
每个科目在记录时都应该记录摘要数据,对该条数据进行解释说明。
步骤303,判断摘要数据中是否包含预置筛选关键字。
本申请的目的是为了判断风险财务数据,所以预置筛选关键字与风险财务数据相关。如果摘要数据包含预置筛选关键字,那么说明该摘要数据对应的字段与判断风险财务数据相关。
步骤304,如果判断结果为是,则确定字段名称是有意义字段。
从上述实施例可以看出,由于摘要信息是对字段对应的财务数据的具体描述,能准确的反映字段的含义,避免因字段名称不同而未获取到全部有意义字段。
参见图4,为本申请提供的一种总服务器判断预置特定字段的待审计数据是否为风险财务数据的方法流程图,也即图2所示步骤207,可以进一步包括:
在总服务器判断预置特定字段的待审计数据是否为风险财务数据之前,还需要限定预置特定字段包括员工编号、借方金额、贷方金额、会计年度和会计期间;风险财务数据包括经济责任财务数据、套取资金财务数据和坏账财务数据;
步骤401,获取待审计数据的借方金额对应的借方金额数据,贷方金额对应的贷方金额数据。
借方金额和贷方金额,是财务数据录入时的字段名称,属于预置特定字段。借方金额数据是借方金额字段对应的数据内容,相似的贷方金额数据是贷方金额字段对应的数据内容。
步骤402,如果借方金额数据大于第一阈值,则确定借方金额数据对应的待审计数据为经济责任财务数据。
由于公司与员工是雇佣关系,员工个人与公司之间能够发生的金钱关系的数额有限,所以如果借方金额数据大于第一阈值,那么确定借方金额数据对应的待审计数据为经济责任财务数据。
步骤403,如果贷方金额数据大于第二阈值,则确定贷方金额数据对应的待审计数据为经济责任财务数据。
与借方金额数据类似,判断贷方金额数据对应的待审计数据是否为经济责任数据。
步骤404,计算待审计数据中借贷差额。
借贷差额,也就是借方金额数据与贷方金额数据的差值,在本申请实施例中不做详细阐述。
步骤405,如果借贷差额大于第三阈值,则确定借贷差额对应的待审计数据为套取资金财务数据。
如果借贷差额过大,则说明公司的资金流入个人手中。所以如果借贷差额大于第三阈值,则确定借贷差额对应的待审计数据为套取资金财务数据。
步骤406,如果借贷差额大于零,并且小于或等于第三阈值,则获取借贷差额的初始记录时间。
如果存在借贷差额,但是借贷差额小于或等于第三阈值,也可能是风险财务数据,需要通过时间继续判断。获取借贷差额的初始记录时间,由于计算借贷差额的借方金额数据和贷方金额数据是一一对应的,所以获取没有被抵消或完全抵消的借贷差额对应的初始记录时间。如果员工从公司借款,但是在还款时没有还清,那么以还款时间作为初始记录时间。
步骤407,计算初始记录时间与当前时间的时间差。
按照时间单位,一一对应计算初始记录时间与当前时间的时间差。
步骤408,如果时间差大于第四阈值,则确定时间差对应的待审计数据为坏账财务数据。
如果时间差大于第四阈值,那么说明该账目长时间处于搁置状态,是不正常的,所以确定为时间差对应的待审计数据为坏账数据。
从上述实施例可以看出,通过预置特定字段,按照一定的判断规则能够判别出待审计数据属于哪种风险财务数据类型,不需要对待审计数据进行二次判断,提高审计速度。
参见图5,为本申请提供的一种确定借方金额数据对应的待审计数据为经济责任财务数据的方法流程图,也即图4所示的步骤402,进一步包括:
步骤501,获取待审计的借方金额数据。
步骤502,按照预置排序算法,将借方金额数据从大到小排序。
步骤503,根据预置查找算法,查找借方金额数据大于第一阈值的风险员工编号数据。
步骤504,确定风险员工编号数据对应的待审计数据为经济责任财务数据。
从上述实施例可以看出,以借方金额数据作为判断经济责任财务数据的依据,通过预置排序算法将借方金额数据进行排序,然后从中选取大于第一阈值的借方金额数据所对应的风险员工编号对应的待审计数据为经济责任财务数据,将风险员工编号对应的待审计数据都作为经济责任数据,能准确并快速地确定风险财务数据。
参见图6,为本申请提供的一种确定贷方金额数据对应的待审计数据为经济责任财务数据的方法流程图,也即图4所示的步骤403,进一步包括:
步骤601,获取待审计的贷方金额数据。
步骤602,按照预置排序算法,将贷方金额数据从大到小排序。
步骤603,根据预置查找算法,查找贷方金额数据大于第二阈值的风险员工编号数据。
步骤604,确定风险员工编号数据对应的待审计数据为经济责任财务数据。
从上述实施例可以看出,以贷方金额数据作为判断经济责任财务数据的依据,通过预置排序算法将贷方金额数据进行排序,然后从中选取大于第二阈值的贷方金额数据所对应的风险员工编号对应的待审计数据为经济责任财务数据,将风险员工编号对应的待审计数据都作为经济责任数据,能选出快速地确定风险财务数据。
参见图7,为本申请提供的一种确定借贷差额对应的待审计数据为套取资金财务数据的方法流程图,也即图4所示的步骤405,进一步包括:
步骤701,获取待审计的借贷差额。
步骤702,按照预置排序算法,将借贷差额从大到小排序。
步骤703,根据预置查找算法,查找借贷差额大于第三阈值的风险员工编号数据。
步骤704,确定风险员工编号数据对应的待审计数据为套取资金财务数据。
从上述实施例可以看出,以借贷差额作为判断经济责任财务数据的依据,通过预置排序算法将借贷差额进行排序,然后从中选取大于第三阈值的借贷差额所对应的风险员工编号对应的待审计数据为经济责任财务数据,将风险员工编号对应的待审计数据都作为经济责任数据,能准确并快速地确定风险财务数据。
参见图8,为本申请提供的一种确定借贷差额对应的初始记录时间的方法流程图,也即图4所示的步骤406,进一步包括:
步骤801,查找借贷差额对应的会计年度数据和会计期间数据。
步骤802,将会计年度数据和会计期间数据,组合为借贷差额对应的录入时间。
步骤803,确定录入时间为初始记录时间。
从上述实施例中可以看出,通过记录在该条财务数据录入的会计年度数据和会计期间数据,能够提高确定初始录入时间的速度。
参见图9,为本申请提供的一种确定时间差对应的待审计数据为坏账财务数据的方法流程图,也即图4所示的步骤408,进一步包括:
步骤901,获取时间差。
步骤902,按照预置排序算法,将时间差从大到小排序。
步骤903,根据预置查找算法,查找时间间隔大于第四阈值的风险员工编号数据。
步骤904,确定风险员工编号数据对应的待审计数据为坏账财务数据。
从上述实施例中可以看出,以时间差作为判断经济责任财务数据的依据,通过预置排序算法将时间差进行排序,然后从中选取大于第四阈值的时间差所对应的风险员工编号对应的待审计数据为经济责任财务数据,将风险员工编号对应的待审计数据都作为经济责任数据,能准确并快速地确定风险财务数据。
参见图10,为本申请提供的一种基于大数据的集团员工挂账审计装置结构示意图。该装置用于执行图2至图9所对应的基于大数据的集团员工挂账审计方法。
如图10所示,该装置包括:
至少一个处理器101;以及,
与至少一个处理器通信连接的存储器102;其中,
存储器存储有可被至少一个处理器执行的指令,以使至少一个处理器能够执行如图2-9任一项所述的基于大数据的集团员工挂账审计方法。
从上述实施例可以看出,按照预置周期将待审计数据库中的财务数据备份至子服务器,然后子服务器将财务数据备份至总服务器,财务数据自动备份至总服务器,可以在审计时直接获取数据不需要等待从待审计数据库中获取,提高数据的获取速度。根据有意义字段的排列组合形成待审计数据结构,然后从财务数据中选取待审计数据,减少数据量以提高数据处理速度。通过预置特定字段直接判断待审计数据是否为风险财务数据,即从待审计数据中选取部分待审计数据判断待审计数据是否为财务数据,再次减少数据量,以提高风险财务数据的判断速度。
具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的呼叫方法的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。本发明实施例中的技术方案本质上或者对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于基于大数据的集团员工挂账审计装置的实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。以上所述的本发明实施方式并不构成对本发明保护范围的限定。