CN112258151A - 一种基于pandas的对账方法、装置、计算机设备和存储介质 - Google Patents

一种基于pandas的对账方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112258151A
CN112258151A CN202011110710.1A CN202011110710A CN112258151A CN 112258151 A CN112258151 A CN 112258151A CN 202011110710 A CN202011110710 A CN 202011110710A CN 112258151 A CN112258151 A CN 112258151A
Authority
CN
China
Prior art keywords
data
logistics
reconciliation
pandas
financial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011110710.1A
Other languages
English (en)
Other versions
CN112258151B (zh
Inventor
李巧媚
黄立秋
孙晓斌
沈燕
周德
黄彩云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202011110710.1A priority Critical patent/CN112258151B/zh
Publication of CN112258151A publication Critical patent/CN112258151A/zh
Application granted granted Critical
Publication of CN112258151B publication Critical patent/CN112258151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明实施例公开了一种基于pandas的对账方法、装置、计算机设备和存储介质。该方法包括:接收对账指令,利用数据分析库pandas获取与对账指令对应的物流数据和财务数据;存储物流数据和财务数据至pandas的内存二维表的不同列中;利用pandas匹配内存二维表中的预设标识列对应的数据记录,根据匹配结果确定物流数据和财务数据之间的索引关系,其中,索引关系用于确定物流数据和财务数据的对应关系;根据物流数据中的预设第一关键列数据和对应的财务数据中的预设第二关键列数据进行对账,生成对账结果。本发明实施例通过精准匹配物流数据和财务数据,对具有索引关系的关键列数据进行对账,生成对账结果,提高了对账效率,缩短了对账的核对时间,增强了对账的时效性。

Description

一种基于pandas的对账方法、装置、计算机设备和存储介质
技术领域
本发明实施例涉及计算机技术,尤其涉及一种基于pandas的对账方法、装置、计算机设备和存储介质。
背景技术
电力物资仓储管理具有品类项目多、数量大、出入库调拨业务频繁的特点,平均每月业务处理数据达两万条,物资管理系统与财务账务处理的相对独立造成每月账账核对存在巨大的困难。为了配合对账工作,物资管理部门每月底需提前两个工作日截止当月物资仓储业务,以便预留足够的时间进行账账核对,以保证会计信息的真实性。
财务部门完成物资业务账务处理后需要花费一整个工作日,通过微软工作表(Excel)中多个表之间反复运用纵向查找函数(VLOOKUP)的函数公式和取值比较公式进行匹配,把财务系统里未能匹配上的每条差异明细记录找出来,逐一分析原因。
然而,在Excel中基于金额运用VLOOKUP函数公式缺乏完整性和唯一性的保证,处理过程除对账员本人外,核对过程很难被他人理解和重复验证,可视化不足,不便于复查。并且,系统数据量大,工作效率低,时效性差,很难实现当天对账当天调整,同时也影响生产物资的正常供应。因此,如何解决人工对账效率低且时效性差成为亟待解决的问题。
发明内容
本发明实施例提供一种基于pandas的对账方法、装置、计算机设备和存储介质,可以实现精准对账以及提高对账效率。
第一方面,本发明实施例提供了一种基于pandas的对账方法,包括:
接收对账指令,利用数据分析库pandas获取与所述对账指令对应的物流数据和财务数据;
存储所述物流数据和财务数据至所述pandas的内存二维表的不同列中;
利用所述pandas匹配所述内存二维表中的预设标识列对应的数据记录,根据匹配结果确定物流数据和财务数据之间的索引关系,其中,所述索引关系用于确定所述物流数据和财务数据的对应关系;
根据所述物流数据中的预设第一关键列数据和对应的所述财务数据中的预设第二关键列数据进行对账,生成对账结果。
第二方面,本发明实施例还提供了一种基于pandas的对账装置,包括:
数据获取模块,用于接收对账指令,利用数据分析库pandas获取与所述对账指令对应的物流数据和财务数据;
数据存储模块,用于存储所述物流数据和财务数据至所述pandas的内存二维表的不同列中;
数据确定模块,用于利用所述pandas匹配所述内存二维表中的预设标识列对应的数据记录,根据匹配结果确定物流数据和财务数据之间的索引关系,其中,所述索引关系用于确定所述物流数据和财务数据的对应关系;
数据对账模块,用于根据所述物流数据中的预设第一关键列数据和对应的所述财务数据中的预设第二关键列数据进行对账,生成对账结果。
第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例提供的基于pandas的对账方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明任意实施例提供的基于pandas的对账方法。
本发明实施例通过接收对账指令,利用pandas获取对应的物流数据和财务数据,将物流数据和财务数据存储至pandas的内存二维表的不同列中,利用pandas确定内存二维表中的物流数据和财务数据之间的索引关系,根据物流数据中的预设第一关键列数据和对应的财务数据中的预设第二关键列数据进行对账,生成对账结果。本发明实施例通过物流数据和财务数据的精准匹配,对具有索引关系的物流数据和财务数据的关键列数据进行对账,生成对账结果,解决了现有技术中人工对账效率低且时效性差的问题,提高了对账效率,缩短了对账的核对时间,增强了对账的时效性。
附图说明
图1是本发明实施例一提供的一种基于pandas的对账方法的流程图;
图2是本发明实施例二提供的另一种基于pandas的对账方法的流程图;
图3是本发明实施例二提供的一种基于pandas的对账方法的工作流程图;
图4是本发明实施例三提供的一种基于pandas的对账装置的结构示意图;
图5是本发明实施例四提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的一种基于pandas的对账方法的流程图,本实施例可适用于物流报表与财务报表对账的情况,该方法可以由基于pandas的对账装置来执行,该装置可以采用软件和/或硬件的方式实现。该装置可配置于计算机设备中。如图1所示,该方法包括:
步骤S110、接收对账指令,利用pandas获取与对账指令对应的物流数据和财务数据。
对账指令可以由用户点击预设按钮或其他预设操作生成,用于指示待对账数据的数据区间或范围。当检测到对账指令时,计算机设备调取pandas并利用pandas获取与对账指令对应的数据。例如,对账指令可以是对8月和9月的物流数据表与财务数据表进行对账。
pandas是计算机程序设计语言蟒蛇(Python)中的数据分析库,用于处理数据,例如,pandas可以处理Excel等。
物流数据可以是对仓库各项业务交易的静态和动态的反映数据,用于记录物品出入库情况。例如,物流数据可以包括单据编号、项目类型、项目名称和/或总金额等。财务数据可以是与仓库各项业务交易相关的财务数据,用于记录物品出入库时现金流动情况。例如,财务数据可以包括账期、凭证类型、摘要和/或贷方发生金额等。
具体地,接收对账指令,利用pandas全盘导入对账指令对应的物流数据和财务数据的数据记录。例如,当接收到对8月和9月的物流数据表与财务数据表进行对账的对账指令时,利用pandas获取8月和9月这段时间内的物流数据与财务数据的数据记录。物流数据至少包括单据编号和总金额,财务数据至少包括摘要和贷方发生金额。物流数据和财务数据可以预先存储于Excel中,当接收到对账指令时,利用pandas从Excel中获取与对账指令对应的物流数据和财务数据。现有技术中数据库获取数据主要是针对磁盘中的数据,且每次读取数据都需要经过I/O传输,读取数据的速度很慢,并且数据库的数据分析能力很低。本发明实施例利用pandas获取数据,解决了现有技术中读取数据慢且数据分析能力低的问题,提高了数据读取速度,且优化了物流数据和财务数据的分析性能。
步骤S120、存储物流数据和财务数据至pandas的内存二维表的不同列中。
pandas的内存二维表可以是pandas中用于临时存储数据和处理数据的二维表。pandas的内存二维表的各行可以用于存储各个数据的数据记录,pandas的内存二维表的各列可以用于存储字段名,并且位于同一列的数据记录具有相同的字段名。例如,字段名包括单据编号、总金额、摘要以及贷方发生金额等。
具体地,将与对账指令对应的所有物流数据存储至pandas的内存二维表的各行中,将与对账指令对应的所有财务数据存储至pandas的内存二维表的各行中,物流数据和财务数据位于pandas的同一内存二维表的不同列。例如,若物流数据具有5个字段名,则可以将物流数据存储至pandas的内存二维表中的前5列,内存二维表的每列对应一个字段名。若财务数据具有3个字段名,则可以将财务数据存储至内存二维表中第6列及其他与物流数据所在列不重复的列。通过存储物流数据和财务数据至pandas的内存二维表的不同列中,将Excel中的物流数据和财务数据导入至pandas的内存二维表中,相比现有技术中利用关系型数据库管理系统(Structured Query Language Server,SQL Server)处理数据而言,本发明实施例提供的技术方案将数据读入内存进行处理,无需搭建数据移植环境便可实现数据分析处理,提高了数据处理的速度。
步骤S130、利用pandas匹配内存二维表中的预设标识列对应的数据记录,根据匹配结果确定物流数据和财务数据之间的索引关系。
其中,索引关系用于确定物流数据和财务数据的对应关系。例如,物流数据可以至少包括单据编号,财务数据可以至少包括摘要,摘要中可以至少包括单据编号,物流数据与财务数据之间具有索引关系可以理解为财务数据的摘要中包括物流数据的单据编号,根据单据编号可以确定物流数据与财务数据之间的对应关系。需要注意的是,本发明实施例在确定索引关系时并不仅限于单据编号,还可以基于其他列信息,本发明对此不作具体限定。
预设标识列用于标识物流数据和财务数据,可以包括物流数据的第一预设列和财务数据的第二预设列。例如,物流数据的第一预设列可以是单据编号,财务数据的第二预设列可以是摘要,摘要中包含可以标识财务数据的信息。
具体地,利用pandas匹配物流数据中的第一预设列对应的数据记录和财务数据中的第二预设列对应的数据记录,若匹配成功,则该物流数据和财务数据之间具有索引关系,若匹配失败,则该物流数据和财务数据之间不具有索引关系。其中,第一预设列对应的数据记录用于唯一标识物流数据,第二预设列对应的数据记录用于唯一标识财务数据。若物流数据中的第一预设列对应的数据记录和财务数据中的第二预设列对应的数据记录相同或具有预设的对应关系,则该物流数据和财务数据匹配成功。例如,预设的对应关系可以是包含关系、映射关系或其他预设关系等。若物流数据中的第一预设列信息和财务数据中的第二预设列信息不同且不具有预设的对应关系,则该物流数据和财务数据匹配失败。
步骤S140、根据物流数据中的预设第一关键列数据和对应的财务数据中的预设第二关键列数据进行对账,生成对账结果。
第一关键列数据可以是物流数据中用于对账的列数据,例如,第一关键列数据可以是物流数据中的总金额。第二关键列数据可以是财务数据中用于对账的列数据,例如,第二关键列数据可以是财务数据中的贷方发生金额。
具体地,将具有索引关系的物流数据中的预设第一关键列数据和对应的财务数据中的预设第二关键列数据进行对账,判断第一关键列数据和第二关键列数据是否一致,根据判断结果生成对账结果。例如,将物流数据中的总金额和对应的财务数据中的贷方发生金额进行对账,判断总金额与贷方发生金额是否相同,根据判断结果生成对账结果。
本发明实施例通过接收对账指令,利用pandas获取对应的物流数据和财务数据,将物流数据和财务数据存储至pandas的内存二维表的不同列中,利用pandas确定内存二维表中的物流数据和财务数据之间的索引关系,根据物流数据中的预设第一关键列数据和对应的财务数据中的预设第二关键列数据进行对账,生成对账结果。本发明实施例通过物流数据和财务数据的精准匹配,对具有索引关系的物流数据和财务数据的关键列数据进行对账,生成对账结果,解决了现有技术中人工对账效率低且时效性差的问题,提高了对账效率,缩短了对账的核对时间,增强了对账的时效性。
实施例二
图2是本发明实施例二提供的另一种基于pandas的对账方法的流程图,本实施例在上述实施例的基础上进行优化,如图2所示,该方法包括:
步骤S210、接收对账指令,利用pandas获取与对账指令对应的预设周期内的物流数据表和财务数据表,从物流数据表中获取物流数据,从财务数据表中获取财务数据。
预设周期可以是用户预设的对账周期,例如,预设周期可以是三个月对账周期。
物流数据表可以是存储物流数据的报表,例如,物流数据表可以是存储物流数据的Excel工作表。财务数据表可以是存储财务数据的报表,例如,财务数据表可以是存储财务数据的Excel工作表。
示例性地,每三个月的月底对账,接收用户的对账指令,获取这三个月的物流数据表和财务数据表,从物流数据表和财务数据表中分别获取这三个月的物流数据和财务数据。
图3是本发明实施例二提供的一种基于pandas的对账方法的工作流程图。如图3所示,在程序启动时,可以获取用户在程序主界面定义的与对账相关的Excel文件名和工作表名等初始信息,利用pandas进行数据处理,通过pandas读取Excel文件中与对账指令相关的工作表,工作表可以包括物流数据表和财务数据表,从物流数据表中获取物流数据,从财务数据表中获取财务数据。
步骤S220、分别将物流数据和财务数据导入至pandas的内存二维表的不同列中,并以结构化数据实体DataFrame形式存储物流数据和财务数据。
其中,DataFrame可以是二维表结构的数据实体,可以包括数据字段和数据值。以DataFrame为对象的内存二维表可以根据结构化的数据文件、数据仓库分析(hive)表、外部数据库或者已经存在的弹性分布式数据集(Resilient Distributed Dataset,RDD)构造,能够拓宽物流数据和财务数据所属报表的文件格式要求,进一步提高对账的应用范围。
步骤S230、遍历内存二维表中的物流数据,获取预设标识列对应的各个物流数据的第一数据编号。
其中,第一数据编号用于标识物流数据,例如,第一数据编号可以是物流数据中的单据编号,各个单据编号唯一标识相应物流数据的数据记录。
示例性地,以内存二维表中的物流数据为主进行遍历,查询物流数据对应的字段名中的单据编号,获取字段名中的单据编号的列对应的数据记录,该数据记录即为各条物流数据的单据编号,将各个单据编号作为相应的物流数据的第一数据编号。
步骤S240、利用pandas匹配第一数据编号与财务数据的摘要信息中包含的第二数据编号,将第一数据编号与第二数据编号之间的对应关系作为物流数据和财务数据之间的索引关系。
其中,第二数据编号用于标识财务数据,例如,第二数据编号可以是财务数据中的摘要信息包含的单据编号,各个摘要信息中包含的单据编号唯一标识相应财务数据的数据记录。
财务数据的摘要信息用于描述财务数据的相关信息,例如,可以包括第二数据编号和/或其他与财务数据相关的备注信息。
第一数据编号与第二数据编号之间的对应关系可以理解为第一数据编号与第二数据编号相同,或者可以理解为第一数据编号与第二数据编号之间具有预设的包含或映射关系。若第一数据编号与第二数据编号相同或者第一数据编号与第二数据编号之间满足预设的包含或映射关系,可以将第一数据编号与第二数据编号理解为具有索引关系。若第一数据编号与第二数据编号不同且第一数据编号与第二数据编号之间不满足预设的包含或映射关系,可以将第一数据编号与第二数据编号理解为不具有索引关系。
示例性地,某个物流数据的第一数据编号为0313w20191224,利用pandas在各个财务数据的摘要信息中进行查找匹配,查找到某个财务数据的摘要信息中包括第二数据编号0313w20191224,确定物流数据的第一数据编号与财务数据的第二数据编号相同,则匹配成功。若在各个财务数据的摘要信息中没有查找到相同的数据编号,但是查找到某个财务数据的摘要信息中包括数据编号0313c20191224,由于数据编号0313w20191224和0313c20191224具有预设的映射关系,则匹配成功。若在各个财务数据的摘要信息中查找到某个财务数据的摘要信息中包括数据编号031320191224,按照预设的数据编号包含关系可以理解为数据编号031320191224包含0313w20191224,则匹配成功。若在各个财务数据的摘要信息中没有查找到相同的数据编号且没有查找到与0313w20191224具有预设的包含或映射关系的数据编号,则匹配失败。
步骤S250、根据物流数据中的预设第一关键列数据和对应的财务数据中的预设第二关键列数据进行对账,生成对账结果。
具体地,利用pandas匹配各个物流数据中的预设第一关键列数据和对应的财务数据中的预设第二关键列数据的一致性,每个物流数据对应一个匹配结果,所有的匹配结果组成对账结果。如图3所示,利用pandas对内存二维表中的账目数据进行匹配核对,得到对账结果。对账结果可以包括账务对平和账务未对平。其中,在对账结果为账务未对平时,可以在对账结果中添加未对平的明细记录。生成的对账结果为所有的匹配结果,且既包括账务对平也包括账务未对平,便于对账人员了解每个数据的对账情况,并针对账务未对平的数据进行及时调整。
可选地,根据物流数据中的预设第一关键列数据和对应的财务数据中的预设第二关键列数据进行对账,包括:
核对各个物流数据中的预设第一关键列数据和对应的财务数据中的预设第二关键列数据;
若第一关键列数据和第二关键列数据一致,则对账结果为账务对平;
若第一关键列数据和第二关键列数据不一致,则对账结果为账务未对平。
其中,在实际对账过程中,物流数据和财务数据可能有一方在用户录入数据或者在信息传输过程中发生缺失,只有物流数据或财务数据一方存在,针对这种情况,可以根据缺失的物流数据或财务数据生成补单消息。例如,若某一物流数据对应的财务数据缺失,则可以根据物流数据的单据编号生成补单财务数据消息;若某一财务数据对应的物流数据缺失,则可以根据财务数据的摘要生成补单物流数据消息。在实际对账过程中,还会出现物流数据和财务数据账务未对平的情况,针对这种情况,可以根据第一关键列数据和第二关键列数据之间的差异生成差异消息。
进一步地,在生成对账结果之后,还包括:
按照物流数据和/或财务数据包含的项目类型信息对账务未对平的对账结果进行分类,输出分类结果。
其中,项目类型信息可以表示物流数据和/或财务数据所属的项目类型。例如,项目类型可以包括主网、配网或技改物资调入修理或其他项目,还可以包括修理或其他项目调入主网、配网或技改等。由于每个项目类型下可以包括多个物流数据表和财务数据表,在生成对账结果之后,按照项目类型对未对平的对账结果进行分类,便于对账人员根据对账结果快速找出差异部分,辅助对账人员根据分类结果快速定位对账错误的原因,进一步便于对账人员及时调整账务,提升对账效率。
可选地,在对账过程中,还可以包括:生成对账监控消息。其中,对账监控消息可以包括对账时间、对账状态和/或对账耗时等。其中,对账状态可以包括开始对账、对账中、回溯中或对账结束等。其中,在生成对账监控消息之后,可以将该对账监控消息发送至显示屏并在显示屏上进行显示,实现对账任务的实时监控。
步骤S260、存储对账结果至内存二维表的结果列。
其中,结果列可以是内存二维表中不同于物流数据和财务数据所在列的其他列,用于存储对账结果。例如,结果列可以至少包括账务对平和/或账务未对平。
步骤S270、关联导出结果列以及第一数据编号或第二数据编号至新建工作表,并在显示屏上进行显示。
具体地,将以DataFrame形式存储的结果列以及相应的第一数据编号或第二数据编号重新关联导出至新建工作表中,并将新建工作表的内容在显示屏上进行显示。其中,新建工作表可以是Excel或其他工作表格式。如图3所示,利用pandas将匹配结果写入新建Excel文件中,并将匹配结果反馈至程序主界面。其中,程序主界面还可以接收pandas数据处理过程中的反馈信息。
本发明实施例通过接收对账指令,利用pandas从与对账指令对应的预设周期内的物流数据表和财务数据表中分别获取物流数据和财务数据,以DataFrame形式存储物流数据和财务数据至pandas的内存二维表的不同列中,遍历各个物流数据中的第一数据编号,基于物流数据的第一数据编号与财务数据的摘要信息中包含的第二数据编号之间的索引关系,对物流数据和财务数据进行匹配,并根据相应的关键列数据进行对账,生成对账结果,便于对账人员精准匹配物资系统入库、领料和调拨单据明细金额。本发明实施例通过将对账结果存储至内存二维表的结果列,关联导出结果列以及第一数据编号或第二数据编号至新建工作表,并在显示屏上进行显示,实现账务对账智能替代,进一步提升财务经营工作效率。
实施例三
图4是本发明实施例三提供的一种基于pandas的对账装置的结构示意图。该装置可由软件和/或硬件实现,一般可集成在计算机设备中,可以通过执行基于pandas的对账方法实现精准对账以及提高对账效率。如图4所示,该装置包括:
数据获取模块310,用于接收对账指令,利用数据分析库pandas获取与所述对账指令对应的物流数据和财务数据;
数据存储模块320,用于存储所述物流数据和财务数据至所述pandas的内存二维表的不同列中;
数据确定模块330,用于利用所述pandas匹配所述内存二维表中的预设标识列对应的数据记录,根据匹配结果确定物流数据和财务数据之间的索引关系,其中,所述索引关系用于确定所述物流数据和财务数据的对应关系;
数据对账模块340,用于根据所述物流数据中的预设第一关键列数据和对应的所述财务数据中的预设第二关键列数据进行对账,生成对账结果。
可选地,所述数据获取模块310,具体用于:
接收对账指令,利用pandas获取与所述对账指令对应的预设周期内的物流数据表和财务数据表,从所述物流数据表中获取物流数据,从所述财务数据表中获取财务数据。
可选地,所述数据存储模块320,具体用于:
分别将所述物流数据和财务数据导入至所述pandas的内存二维表的不同列中,并以结构化数据实体DataFrame形式存储所述物流数据和财务数据,其中,所述DataFrame是二维表结构的数据实体。
可选地,所述数据确定模块330,具体用于:
遍历所述内存二维表中的物流数据,获取预设标识列对应的各个所述物流数据的第一数据编号,其中,所述第一数据编号用于标识所述物流数据;
利用所述pandas匹配所述第一数据编号与所述财务数据的摘要信息中包含的第二数据编号,将所述第一数据编号与第二数据编号之间的对应关系作为所述物流数据和财务数据之间的索引关系,其中,所述第二数据编号用于标识所述财务数据。
可选地,所述装置还包括:
结果存储模块,用于在生成对账结果之后,存储所述对账结果至所述内存二维表的结果列;
结果显示模块,用于关联导出所述结果列以及第一数据编号或第二数据编号至新建工作表,并在显示屏上进行显示。
可选地,所述数据对账模块340,具体用于:
核对各个所述物流数据中的预设第一关键列数据和对应的所述财务数据中的预设第二关键列数据;
若所述第一关键列数据和第二关键列数据一致,则对账结果为账务对平;
若所述第一关键列数据和第二关键列数据不一致,则所述对账结果为账务未对平。
可选地,所述装置还包括:
结果分类模块,用于在生成对账结果之后,按照所述物流数据和/或财务数据包含的项目类型信息对账务未对平的对账结果进行分类,输出分类结果。
本发明实施例所提供的基于pandas的对账装置可执行本发明任意实施例所提供的基于pandas的对账方法,具备执行方法相应的功能模块和有益效果。
实施例四
图5是本发明实施例四提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括处理器400、存储器410、输入装置420和输出装置430;计算机设备中处理器400的数量可以是一个或多个,图5中以一个处理器400为例;计算机设备中的处理器400、存储器410、输入装置420和输出装置430可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器410作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的基于pandas的对账方法对应的程序指令和/或模块(例如,基于pandas的对账装置中的数据获取模块310、数据存储模块320、数据确定模块330和数据对账模块340)。处理器400通过运行存储在存储器410中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的基于pandas的对账方法。
存储器410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器410可进一步包括相对于处理器400远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置420可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置430可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种基于pandas的对账方法,该方法包括:
接收对账指令,利用数据分析库pandas获取与所述对账指令对应的物流数据和财务数据;
存储所述物流数据和财务数据至所述pandas的内存二维表的不同列中;
利用所述pandas匹配所述内存二维表中的预设标识列对应的数据记录,根据匹配结果确定物流数据和财务数据之间的索引关系,其中,所述索引关系用于确定所述物流数据和财务数据的对应关系;
根据所述物流数据中的预设第一关键列数据和对应的所述财务数据中的预设第二关键列数据进行对账,生成对账结果。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的基于pandas的对账方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述基于pandas的对账装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种基于pandas的对账方法,其特征在于,包括:
接收对账指令,利用数据分析库pandas获取与所述对账指令对应的物流数据和财务数据;
存储所述物流数据和财务数据至所述pandas的内存二维表的不同列中;
利用所述pandas匹配所述内存二维表中的预设标识列对应的数据记录,根据匹配结果确定物流数据和财务数据之间的索引关系,其中,所述索引关系用于确定所述物流数据和财务数据的对应关系;
根据所述物流数据中的预设第一关键列数据和对应的所述财务数据中的预设第二关键列数据进行对账,生成对账结果。
2.根据权利要求1所述的方法,其特征在于,所述接收对账指令,利用pandas获取与所述对账指令对应的物流数据和财务数据,包括:
接收对账指令,利用pandas获取与所述对账指令对应的预设周期内的物流数据表和财务数据表,从所述物流数据表中获取物流数据,从所述财务数据表中获取财务数据。
3.根据权利要求1所述的方法,其特征在于,所述存储所述物流数据和财务数据至所述pandas的内存二维表的不同列中,包括:
分别将所述物流数据和财务数据导入至所述pandas的内存二维表的不同列中,并以结构化数据实体DataFrame形式存储所述物流数据和财务数据,其中,所述DataFrame是二维表结构的数据实体。
4.根据权利要求1所述的方法,其特征在于,所述利用所述pandas匹配所述内存二维表中的预设标识列对应的数据记录,根据匹配结果确定物流数据和财务数据之间的索引关系,包括:
遍历所述内存二维表中的物流数据,获取预设标识列对应的各个所述物流数据的第一数据编号,其中,所述第一数据编号用于标识所述物流数据;
利用所述pandas匹配所述第一数据编号与所述财务数据的摘要信息中包含的第二数据编号,将所述第一数据编号与第二数据编号之间的对应关系作为所述物流数据和财务数据之间的索引关系,其中,所述第二数据编号用于标识所述财务数据。
5.根据权利要求4所述的方法,其特征在于,在生成对账结果之后,还包括:
存储所述对账结果至所述内存二维表的结果列;
关联导出所述结果列以及第一数据编号或第二数据编号至新建工作表,并在显示屏上进行显示。
6.根据权利要求1所述的方法,其特征在于,所述根据所述物流数据中的预设第一关键列数据和对应的所述财务数据中的预设第二关键列数据进行对账,包括:
核对各个所述物流数据中的预设第一关键列数据和对应的所述财务数据中的预设第二关键列数据;
若所述第一关键列数据和第二关键列数据一致,则对账结果为账务对平;
若所述第一关键列数据和第二关键列数据不一致,则所述对账结果为账务未对平。
7.根据权利要求6所述的方法,其特征在于,在生成对账结果之后,还包括:
按照所述物流数据和/或财务数据包含的项目类型信息对账务未对平的对账结果进行分类,输出分类结果。
8.一种基于pandas的对账装置,其特征在于,包括:
数据获取模块,用于接收对账指令,利用数据分析库pandas获取与所述对账指令对应的物流数据和财务数据;
数据存储模块,用于存储所述物流数据和财务数据至所述pandas的内存二维表的不同列中;
数据确定模块,用于利用所述pandas匹配所述内存二维表中的预设标识列对应的数据记录,根据匹配结果确定物流数据和财务数据之间的索引关系,其中,所述索引关系用于确定所述物流数据和财务数据的对应关系;
数据对账模块,用于根据所述物流数据中的预设第一关键列数据和对应的所述财务数据中的预设第二关键列数据进行对账,生成对账结果。
9.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的基于pandas的对账方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的基于pandas的对账方法。
CN202011110710.1A 2020-10-16 2020-10-16 一种基于pandas的对账方法、装置、计算机设备和存储介质 Active CN112258151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011110710.1A CN112258151B (zh) 2020-10-16 2020-10-16 一种基于pandas的对账方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011110710.1A CN112258151B (zh) 2020-10-16 2020-10-16 一种基于pandas的对账方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112258151A true CN112258151A (zh) 2021-01-22
CN112258151B CN112258151B (zh) 2023-10-24

Family

ID=74244554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011110710.1A Active CN112258151B (zh) 2020-10-16 2020-10-16 一种基于pandas的对账方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112258151B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113419994A (zh) * 2021-07-21 2021-09-21 北京优奥创思科技发展有限公司 一种多身份字段大数据的自动化快速对比系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103325054A (zh) * 2012-03-23 2013-09-25 洪宇 一种电子交易系统
FR3066299A1 (fr) * 2017-05-11 2018-11-16 Amadeus S.A.S Un systeme et un procede pour le traitement et le rapprochement comptable d'un fichier de donnees de facture
CN109461066A (zh) * 2018-11-01 2019-03-12 广东电网有限责任公司 电力企业对账系统及其方法
CN109859025A (zh) * 2019-01-24 2019-06-07 上海蔚来汽车有限公司 一种自动对账方法及电子设备
CN110457308A (zh) * 2019-06-18 2019-11-15 云南电网有限责任公司楚雄供电局 一种账务数据处理分析方法及系统
CN111311277A (zh) * 2020-02-10 2020-06-19 腾讯科技(深圳)有限公司 一种基于区块链网络的票据处理方法、装置和相关设备
CN111680092A (zh) * 2020-06-05 2020-09-18 深圳市卡数科技有限公司 数据导入hive表的方法、系统、服务器和存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103325054A (zh) * 2012-03-23 2013-09-25 洪宇 一种电子交易系统
FR3066299A1 (fr) * 2017-05-11 2018-11-16 Amadeus S.A.S Un systeme et un procede pour le traitement et le rapprochement comptable d'un fichier de donnees de facture
CN109461066A (zh) * 2018-11-01 2019-03-12 广东电网有限责任公司 电力企业对账系统及其方法
CN109859025A (zh) * 2019-01-24 2019-06-07 上海蔚来汽车有限公司 一种自动对账方法及电子设备
CN110457308A (zh) * 2019-06-18 2019-11-15 云南电网有限责任公司楚雄供电局 一种账务数据处理分析方法及系统
CN111311277A (zh) * 2020-02-10 2020-06-19 腾讯科技(深圳)有限公司 一种基于区块链网络的票据处理方法、装置和相关设备
CN111680092A (zh) * 2020-06-05 2020-09-18 深圳市卡数科技有限公司 数据导入hive表的方法、系统、服务器和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
魏晨希: "基于Python的作业统计程序设计与实现", 《电脑编程技巧与维护》 *
魏晨希: "基于Python的作业统计程序设计与实现", 《电脑编程技巧与维护》, 31 July 2020 (2020-07-31), pages 3 - 5 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113419994A (zh) * 2021-07-21 2021-09-21 北京优奥创思科技发展有限公司 一种多身份字段大数据的自动化快速对比系统及方法

Also Published As

Publication number Publication date
CN112258151B (zh) 2023-10-24

Similar Documents

Publication Publication Date Title
US20200057757A1 (en) Data quality analysis
US8626702B2 (en) Method and system for validation of data extraction
US10504047B2 (en) Metadata-driven audit reporting system with dynamically created display names
US20090006455A1 (en) Automated time metadata deduction
CN110659282B (zh) 数据路由的构建方法、装置、计算机设备和存储介质
US9235608B2 (en) Database performance analysis
CN111506559A (zh) 数据存储方法、装置、电子设备及存储介质
CN108647357B (zh) 数据查询的方法及装置
KR20050061597A (ko) 버저닝된 데이터베이스에 대한 리포트를 생성하기 위한시스템 및 방법
CN112667612A (zh) 一种数据质量检核方法、装置、电子设备及存储介质
CN113220728A (zh) 数据查询方法、装置、设备和存储介质
CN114648397A (zh) 通用对账系统、方法、计算机设备和存储介质
CN112258151B (zh) 一种基于pandas的对账方法、装置、计算机设备和存储介质
CN110781235A (zh) 基于大数据的采购数据处理方法、装置、终端及存储介质
CN111913962A (zh) 一种多维度年度明细资金计划编制系统及方法
CN110597899B (zh) 项目经费管理方法及系统
CN112861140A (zh) 一种业务数据的处理方法及装置、可读存储介质
CN115423595B (zh) 文件信息处理方法、装置、计算机设备和存储介质
CN112507002B (zh) 一种数据图表生成系统、方法、计算机装置和存储介质
CN113779947A (zh) 自动生成会计凭证的方法、装置、设备及存储介质
CN117827876A (zh) 指标管理系统及指标查询方法
CN114265856A (zh) 提供数据服务的方法、装置及电子设备
CN114238720A (zh) 一种基于数据联动的视图分析展现方法和系统
CN114418520A (zh) 一种基于rpa的财务数据优化方法和系统
CN114817270A (zh) 一种基于知识图谱的表字段血缘关系可视化方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant