CN114723543B - 一种跨境电商的财务档案大数据管理系统及方法 - Google Patents
一种跨境电商的财务档案大数据管理系统及方法 Download PDFInfo
- Publication number
- CN114723543B CN114723543B CN202210431107.6A CN202210431107A CN114723543B CN 114723543 B CN114723543 B CN 114723543B CN 202210431107 A CN202210431107 A CN 202210431107A CN 114723543 B CN114723543 B CN 114723543B
- Authority
- CN
- China
- Prior art keywords
- file
- files
- financial
- sub
- called
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013523 data management Methods 0.000 title claims abstract description 17
- 238000012795 verification Methods 0.000 claims abstract description 52
- 238000012544 monitoring process Methods 0.000 claims description 25
- 238000001514 detection method Methods 0.000 claims description 21
- 238000013528 artificial neural network Methods 0.000 claims description 16
- 238000013439 planning Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 6
- 238000007726 management method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000005611 electricity Effects 0.000 claims 1
- 230000009471 action Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种跨境电商的财务档案大数据管理系统及方法,包括档案整理模块、档案验证核算模块和财务档案存储调整模块;档案整理模块用于建立虚拟库并保存所需调取的临时档案,并匹配与所需调取的临时档案的子档案;档案验证核算模块用于对所调取的临时档案进行验证核算,若核实到验证核算结果与标准的核算结果不相同,则处理档案并将档案与临时档案在虚拟库中合并;财务档案存储调整模块用于获取历史数据中调取的财务档案数量,并根据历史财务档案数量推测此次调取所有相关联档案数量的时间,根据预测的时间值调整财务档案的数量;本发明通过建立临时档案与子档案之间的联系,能够确保所需使用的档案能够被及时、完整的调取。
Description
技术领域
本发明涉及大数据的档案管理技术领域,具体为一种跨境电商的财务档案大数据管理系统及方法。
背景技术
跨境电子商务是指在不同关境的交易主体,通过电子商务平台达成交易或者进行电子支付结算,并通过跨境物流送达商品,完成交易的一种国际商业活动;在进行跨境交易时,会有较多的交易数据产生,财务部门为了核对交易内容的准确性,通过将交易数据制作为不同的财务档案凭证,而后调取财务档案进行进一步的核算,保证交易数据的准确性;但是往往在调取档案进行验证核算时,同期所有的子档案无法全部被调取,需要在所有的财务档案中进行寻找,此举浪费了寻找的时间,降低工作人员的工作效率;因此,需要合理的应用大数据对财务档案进行管理并整理。
发明内容
本发明的目的在于提供一种跨境电商的财务档案大数据管理系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种跨境电商的财务档案大数据管理系统,所述财务档案大数据管理系统包括档案整理模块、档案验证核算模块和财务档案存储调整模块;
所述档案整理模块用于建立虚拟库并保存所需调取的临时档案,并匹配与所需调取的临时档案的子档案,从而能够将档案一次性完整调取,防止因为反复调取降低工作效率;
所述档案验证核算模块用于对所调取的临时档案进行验证核算,若核实到验证核算结果与标准的核算结果不相同,则处理档案并将档案与临时档案在虚拟库中合并,保证所有与临时档案相关联的子档案都能够被完整调取,确保档案的核算结果能够与标准的核算结果相同;
所述财务档案存储调整模块用于获取历史数据中调取的财务档案数量,并根据历史财务档案数量推测调取所有相关联档案数量的时间,根据预测的时间值对数据库中的档案进行处理,从而能够加快财务档案从数据库中调取的时间;
所述档案整理模块与档案验证核算模块相连接;所述档案整理模块与财务档案存储调整模块相连接。
进一步的,所述档案整理模块包括档案调取单元、档案关联单元、虚拟库建立单元和档案年限识别单元;
所述档案调取单元用于从数据库中调取跨境电商中的财务档案信息,并将档案信息输送至档案分类单元;
所述档案关联单元用于获取所需调取的财务档案,调取与财务档案相关的子档案;
所述虚拟库建立单元用于建立虚拟库,并在虚拟库中保存临时调取的财务档案;
所述档案年限识别单元用于识别档案年份,从而能够将超出设定年份的档案进行鉴别并毁灭,由于财务档案的保存年限都在30年或者永久,因此核对档案的年限,能够将超过年限的档案及时清理,同时将需要清理的档案汇报至鉴定人员,从而能够对档案合理整理;
进一步的,所述档案验证核算模块包括集群验证单元、权限检测单元、分离式存储验证单元、档案内容合并监测单元和路径检测单元;
所述集群验证单元用于调取保存在虚拟库中的财务档案,并对财务档案中的内容进行验证核算;若财务档案验证核算后,核实到档案中的财务核算与标准的财务档案的核算不相同,则监测从虚拟库中调取的财务档案;
所述权限检测单元用于核实数据库中档案的调取是否需要权限验证,若核实到需要权限验证时,则在经过验证后将部分财务档案与已调取档案合并;若核实到不需要权限验证,则直接将部分财务档案与已调取档案合并;
所述分离式存储验证单元用于核实到经过验证后的部分档案为分离式存储时,则跳转至档案内容合并监测单元中;由于部分档案设置有权限,且是通过分离式存储的方式保存档案,因此在调取档案时,需要核对合并后的档案内容是否完整,防止因缺少部分内容而导致最后的核算结果不正确;
所述档案内容合并监测单元用于监测分离式存储档案内容的合并过程,直至得到完整的财务档案;所指的合并过程为档案内容按照顺序进行合并;
所述路径检测单元用于检测分离式存储档案合并后并传输至虚拟库中的路径;
所述集群验证单元的输出端与权限检测单元的输入端相连接,所述权限检测单元的输出端与分离式存储单元、档案内容合并监测单元的输入端相连接;所述档案内容合并监测单元的输出端与路径检测单元的输入端相连接。
进一步的,所述财务档案存储调整模块包括档案数量预测单元和档案整理规划单元;
所述档案数量预测单元用于获取历史数据中调取的档案数量,并以此来推测此次调取所有档案数量的时间;
所述档案整理规划单元用于对档案进行整理规划,以便于操作人员便利调取档案;
对档案进行整理规划是指根据数据库内档案被调取的频率次数,将频率次数与预设标准次数相互比较,若频率次数小于预设标准次数,则设置新的数据库,将方案移动至新的数据库中,确保剩余的档案能够被工作人员快速调取,同时实时更新档案被调取的次数,确保档案能够及时被调取;
所述档案数量预测单元的输出端与档案整理规划单元的输入端相连接。
进一步的,一种跨境电商的财务档案大数据管理方法,所述管理方法执行如下步骤:
Z01:获取所需调取的临时档案,根据临时档案与子档案的关联性进行聚类验证,得到与临时档案相关联的所有子档案;
Z02:对调取后的档案进行核算验证,若核实到财务档案与历史的财务档案核算结果不相同,则预先分析数据库中是否具备有权限的档案,若具备有权限的档案,则分析具备权限的档案与临时档案的关联关系;若具备权限的档案与临时档案存在关联关系,则将具备权限的档案与临时档案进行合并并保存至虚拟库中,并根据具备权限的档案的存储模式,监控档案合并过程;若具备权限的档案与临时档案不存在关联关系,则核实其他具备权限的档案;若不具备有权限的档案,则表示档案中的数据内容被修改;
Z03:获取历史时间段中调取的档案数量以及所调取档案数量对应时间,推测此次调取档案数量所对应的时间值;如若推测的时间值大于预设标准时间,则整理数据库中保存的档案数量;如若推测的时间值小于标准时间,则直接调取档案至虚拟库中。
在步骤Z01中,对与临时档案相关联的所有子档案进行聚类分为两种方式:
如若还未有子档案与临时档案建立相关联的联系,则在数据库中随机选择一批样本档案进行聚类,进而得到与临时档案相关联的子档案;
如若有部分子档案与临时档案已建立相关联的联系,则将已确定的子档案特征和其他子档案特征作为输入变量,初始化神经网络,得到已确定的子档案和其他子档案为临时档案的子档案集的概率。
如若还未有子档案与临时档案建立相关联的联系,则将临时档案相关联的所有子档案进行聚类,且聚类方法如下:
Z011:随机选择一批数量为G的样本档案,并将G个样本档案作为簇中心,将所调取的临时档案作为簇;
Z012:计算剩余样本与簇中心之间的距离集合,根据距离的长度,将样本赋值给最近的簇;
Z013:根据步骤Z012中的聚类结果,更新步骤Z011中簇中心的位置;
Z014:循环步骤Z011-Z013,并重新聚类,直至簇中心的位置不再发生明显变化为止。
如若有部分子档案与临时档案已建立相关联的联系,则将已确定的子档案特征和其他子档案特征作为输入变量,并始化神经网络,初始化神经网络的步骤如下:
Z0111:创建神经网络,并对神经网络初始化;
Z0112:提取部分子档案的特征点和其他子档案的特征点作为输入向量,将部分子档案的特征点和其他子档案特征点作为临时档案中子档案的概率;其中输入向量具体为财务档案上交易时间的类别、财务档案中的交易对象和财务档案中的交易目标对象;
Z0113:将部分子档案的特征点和其他子档案特征点作为临时档案中子档案的概率记为P;若核实到P>P’时,则表示部分子档案和其他子档案皆为临时档案中的子档案;若核实到P<P’时,则表示其他子档案并非属于临时档案中的子档案;P’为预设的标准概率。
在步骤Z03中,获取第一周所调取的档案数量k1和调取档案数量的时间为Q1,获取第二周所调取的档案数量k2和调取档案数量的时间为Q2;根据每周调取的档案数量和档案调取的时间建立直角坐标系,横坐标为调取的档案数量K,纵坐标为调取档案数量所对应时间Q;设定直线方程为Q=cK+b,c、b为任意实数;代入档案数量和对应调取档案数量时间的数据集,能够得到调取ki档案数量的时间Qi,若核实到调取档案数量的时间大于预设标准时间,则建立新的存储库,将调取档案数量的频次小于预设频次的指定档案移动至新的存储库中;若核实到调取档案数量的时间小于预设标准时间,则将档案移动至虚拟库中。
与现有技术相比,本发明所达到的有益效果是:本发明通过建立临时档案与子档案之间的联系,能够确保所需使用的档案能够被及时、完整的调取,加快了工作人员的工作效率,同时确保调取的档案与临时档案有密切关系,防止因调取档案内容与临时档案内容不相符,增加工作人员的工作数量;本发明对所调取档案数量的时间进行推测,根据推测的时间,对数据库中保存的档案进行整理;防止因数据库中档案过多,增加档案被调取的时间,通过此方法,增加了档案被调取的效率。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种跨境电商的财务档案大数据管理系统的模块组成示意图;
图2是本发明一种跨境电商的财务档案大数据管理方法的步骤示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图2,本发明提供技术方案:
一种跨境电商的财务档案大数据管理系统,所述财务档案大数据管理系统包括档案整理模块、档案验证核算模块和财务档案存储调整模块;
所述档案整理模块用于建立虚拟库并保存所需调取的临时档案,并匹配与所需调取的临时档案的子档案,从而能够将档案一次性完整调取,防止因为反复调取降低工作效率;
所述档案验证核算模块用于对所调取的临时档案进行验证核算,若核实到验证核算结果与标准的核算结果不相同,则处理档案并将档案与临时档案在虚拟库中合并,保证所有与临时档案相关联的子档案都能够被完整调取,确保档案的核算结果能够与标准的核算结果相同;
所述财务档案存储调整模块用于获取历史数据中调取的财务档案数量,并根据历史财务档案数量推测调取所有相关联档案数量的时间,根据预测的时间值对数据库中的档案进行处理,从而能够加快财务档案从数据库中调取的时间;
所述档案整理模块与档案验证核算模块相连接;所述档案整理模块与财务档案存储调整模块相连接。
进一步的,所述档案整理模块包括档案调取单元、档案关联单元、虚拟库建立单元和档案年限识别单元;
所述档案调取单元用于从数据库中调取跨境电商中的财务档案信息,并将档案信息输送至档案分类单元;
所述档案关联单元用于获取所需调取的财务档案,调取与财务档案相关的子档案;
所述虚拟库建立单元用于建立虚拟库,并在虚拟库中保存临时调取的财务档案;
所述档案年限识别单元用于识别档案年份,从而能够将超出设定年份的档案进行鉴别并毁灭,由于财务档案的保存年限都在30年或者永久,因此核对档案的年限,能够将超过年限的档案及时清理,同时将需要清理的档案汇报至鉴定人员,从而能够对档案合理整理;
进一步的,所述档案验证核算模块包括集群验证单元、权限检测单元、分离式存储验证单元、档案内容合并监测单元和路径检测单元;
所述集群验证单元用于调取保存在虚拟库中的财务档案,并对财务档案中的内容进行验证核算;若财务档案验证核算后,核实到档案中的财务核算与标准的财务档案的核算不相同,则监测从虚拟库中调取的财务档案;
所述权限检测单元用于核实数据库中档案的调取是否需要权限验证,若核实到需要权限验证时,则在经过验证后将部分财务档案与已调取档案合并;若核实到不需要权限验证,则直接将部分财务档案与已调取档案合并;
所述分离式存储验证单元用于核实到经过验证后的部分档案为分离式存储时,则跳转至档案内容合并监测单元中;由于部分档案设置有权限,且是通过分离式存储的方式保存档案,因此在调取档案时,需要核对合并后的档案内容是否完整,防止因缺少部分内容而导致最后的核算结果不正确;
所述档案内容合并监测单元用于监测分离式存储档案内容的合并过程,直至得到完整的财务档案;所指的合并过程为档案内容按照顺序进行合并;
所述路径检测单元用于检测分离式存储档案合并后并传输至虚拟库中的路径;
所述集群验证单元的输出端与权限检测单元的输入端相连接,所述权限检测单元的输出端与分离式存储单元、档案内容合并监测单元的输入端相连接;所述档案内容合并监测单元的输出端与路径检测单元的输入端相连接。
进一步的,所述财务档案存储调整模块包括档案数量预测单元和档案整理规划单元;
所述档案数量预测单元用于获取历史数据中调取的档案数量,并以此来推测此次调取所有档案数量的时间;
所述档案整理规划单元用于对档案进行整理规划,以便于操作人员便利调取档案;
对档案进行整理规划是指根据数据库内档案被调取的频率次数,将频率次数与预设标准次数相互比较,若频率次数小于预设标准次数,则设置新的数据库,将方案移动至新的数据库中,确保剩余的档案能够被工作人员快速调取,同时实时更新档案被调取的次数,确保档案能够及时被调取;
所述档案数量预测单元的输出端与档案整理规划单元的输入端相连接。
进一步的,一种跨境电商的财务档案大数据管理方法,所述管理方法执行如下步骤:
Z01:获取所需调取的临时档案,根据临时档案与子档案的关联性进行聚类验证,得到与临时档案相关联的所有子档案;
Z02:对调取后的档案进行核算验证,若核实到财务档案与历史的财务档案核算结果不相同,则预先分析数据库中是否具备有权限的档案,若具备有权限的档案,则分析具备权限的档案与临时档案的关联关系;若具备权限的档案与临时档案存在关联关系,则将具备权限的档案与临时档案进行合并并保存至虚拟库中,并根据具备权限的档案的存储模式,监控档案合并过程;若具备权限的档案与临时档案不存在关联关系,则核实其他具备权限的档案;若不具备有权限的档案,则表示档案中的数据内容被修改;
Z03:获取历史时间段中调取的档案数量以及所调取档案数量对应时间,推测此次调取档案数量所对应的时间值;如若推测的时间值大于预设标准时间,则整理数据库中保存的档案数量;如若推测的时间值小于标准时间,则直接调取档案至虚拟库中。
在步骤Z01中,对与临时档案相关联的所有子档案进行聚类分为两种方式:
如若还未有子档案与临时档案建立相关联的联系,则在数据库中随机选择一批样本档案进行聚类,进而得到与临时档案相关联的子档案;
如若有部分子档案与临时档案已建立相关联的联系,则将已确定的子档案特征和其他子档案特征作为输入变量,初始化神经网络,得到已确定的子档案和其他子档案为临时档案的子档案集的概率。
如若还未有子档案与临时档案建立相关联的联系,则将临时档案相关联的所有子档案进行聚类,且聚类方法如下:
Z011:随机选择一批数量为G的样本档案,并将G个样本档案作为簇中心,将所调取的临时档案作为簇;
Z012:计算剩余样本与簇中心之间的距离集合,根据距离的长度,将样本赋值给最近的簇;
Z013:根据步骤Z012中的聚类结果,更新步骤Z011中簇中心的位置;
Z014:循环步骤Z011-Z013,并重新聚类,直至簇中心的位置不再发生明显变化为止;
上述过程中,距离的长度可以通过欧式距离的方法进行计算,本方法在对样本档案进行距离时,会对样本档案进行预处理,对样本档案进行预处理即为对样本档案进行归一化等等,确保样本档案为相同类型的文本,防止因未预处理的样本档案对后期聚类产生影响;通过此方法能够得到与所调取临时档案相关联的子档案,从而起到对档案进行分类的作用。
如若有部分子档案与临时档案已建立相关联的联系,则将已确定的子档案特征和其他子档案特征作为输入变量,并始化神经网络,初始化神经网络的步骤如下:
Z0111:创建神经网络,并对神经网络初始化;
Z0112:提取部分子档案的特征点和其他子档案的特征点作为输入向量,将部分子档案的特征点和其他子档案特征点作为临时档案中子档案的概率;其中输入向量具体为财务档案上交易时间的类别、财务档案中的交易对象和财务档案中的交易目标对象;
Z0113:将部分子档案的特征点和其他子档案特征点作为临时档案中子档案的概率记为P;若核实到P>P’时,则表示部分子档案和其他子档案皆为临时档案中的子档案;若核实到P<P’时,则表示其他子档案并非属于临时档案中的子档案;P’为预设的标准概率;
由于已有部分子档案已经成为临时档案的子档案一员,因此获取了子档案的特征,与还未有子档案与临时档案建立相关联的联系不同,通过本方案加快了调取子档案的时间,共组效率更高;将已确定的部分子档案与其他部分子档案的特征在神经网络中作为输入变量,其中输入变量确定为财务档案上交易时间的类别、财务档案中的交易对象和财务档案中的交易目标对象;其中财务档案上交易时间的类别,例如为20xx年xx月xx日,因此其他财务档案上的时间类别需与确定的部分子档案相同;所得出的输出结果为概率,根据机器学习模型得到与临时档案相关联的所有子档案,通过此方法,机器的学习能力强,分类的结果也更加精确。
在步骤Z03中,获取第一周所调取的档案数量k1和调取档案数量的时间为Q1,获取第二周所调取的档案数量k2和调取档案数量的时间为Q2;根据每周调取的档案数量和档案调取的时间建立直角坐标系,横坐标为调取的档案数量K,纵坐标为调取档案数量所对应时间Q;设定直线方程为Q=cK+b,c、b为任意实数;代入档案数量和对应调取档案数量时间的数据集,能够得到调取ki档案数量的时间Qi,若核实到调取档案数量的时间大于预设标准时间,则建立新的存储库,将调取档案数量的频次小于预设频次的指定档案移动至新的存储库中;若核实到调取档案数量的时间小于预设标准时间,则将档案移动至虚拟库中;
在上述方法中,调取档案数量的频次为档案被移动至虚拟库中的次数,并对调取档案的次数进行排序,确保正在被调取的档案能够快速被调取。
实施例1:获取第一周调取的档案数量k1=20,对应调取档案数量的时间Q1=3min,获取第二周所调取的档案数量k2=35,对应调取档案数量的时间Q2=4min;建立直角坐标系,将档案数量作为横轴,将调取档案数量所对应时间Q作为纵轴;在直角坐标系中,设置Q=cK+b;代入上述公式得到c=4,b=100;能够得到在第三周调取档案数量为k3=55,对应调取档案数量的时间Q3=5.33min;将调取档案数量的时间与对应的预设时间5.40相比较,得到5.33<5.40,因此,能够将档案移动至虚拟库中。
实施例2:获取第一周调取的档案数量k1=20,对应调取档案数量的时间Q1=3min,获取第二周所调取的档案数量k2=35,对应调取档案数量的时间Q2=4min;建立直角坐标系,将档案数量作为横轴,将调取档案数量所对应时间Q作为纵轴;在直角坐标系中,设置Q=cK+b;代入上述公式得到c=4,b=100;能够得到在第三周调取档案数量为k3=55,对应调取档案数量的时间Q3=5.33min;将调取档案数量的时间与对应的预设时间5.25相比较,得到5.33>5.25,获取调取档案数量的频次,将调取档案频次小于预设频次的指定档案移动至新的存储库中,从而减少工作人员调取档案时的等待时间。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种跨境电商的财务档案大数据管理系统,其特征在于:所述财务档案大数据管理系统包括档案整理模块、档案验证核算模块和财务档案存储调整模块;
所述档案整理模块用于建立虚拟库并保存所需调取的临时档案,并匹配与所需调取的临时档案的子档案;
所述档案验证核算模块用于对所调取的临时档案进行验证核算,若核实到验证核算结果与标准的核算结果不相同,则处理档案并将档案与临时档案在虚拟库中合并;若核实到财务档案与历史的财务档案核算结果不相同,则预先分析数据库中是否具备有权限的档案,若具备有权限的档案,则分析具备权限的档案与临时档案的关联关系;若具备权限的档案与临时档案存在关联关系,则将具备权限的档案与临时档案进行合并并保存至虚拟库中,并根据具备权限的档案的存储模式,监控档案合并过程;若具备权限的档案与临时档案不存在关联关系,则核实其他具备权限的档案;若不具备有权限的档案,则表示档案中的数据内容被修改;
所述档案验证核算模块包括集群验证单元、权限检测单元、分离式存储验证单元、档案内容合并监测单元和路径检测单元;
所述集群验证单元用于调取保存在虚拟库中的财务档案,并对财务档案中的内容进行验证核算;若财务档案验证核算后,核实到档案中的财务核算与标准的财务档案的核算不相同,则监测从虚拟库中调取的财务档案;
所述权限检测单元用于核实数据库中档案的调取是否需要权限验证,若核实到需要权限验证时,则在经过验证后将部分财务档案与已调取档案合并;若核实到不需要权限验证,则直接将部分财务档案与已调取档案合并;
所述分离式存储验证单元用于核实到经过验证后的部分档案为分离式存储时,则跳转至档案内容合并监测单元中;
所述档案内容合并监测单元用于监测分离式存储档案内容的合并过程,直至得到完整的财务档案;
所述路径检测单元用于检测分离式存储档案合并后并传输至虚拟库中的路径;
所述集群验证单元的输出端与权限检测单元的输入端相连接,所述权限检测单元的输出端与分离式存储单元、档案内容合并监测单元的输入端相连接;所述档案内容合并监测单元的输出端与路径检测单元的输入端相连接;
所述财务档案存储调整模块用于获取历史数据中调取的财务档案数量,并根据历史财务档案数量推测调取所有相关联档案数量的时间,根据预测的时间值对数据库中的档案进行处理;
所述档案整理模块与档案验证核算模块相连接;所述档案整理模块与财务档案存储调整模块相连接。
2.根据权利要求1所述的一种跨境电商的财务档案大数据管理系统,其特征在于:所述档案整理模块包括档案调取单元、档案关联单元、虚拟库建立单元和档案年限识别单元;
所述档案调取单元用于从数据库中调取跨境电商中的财务档案信息,并将档案信息输送至档案分类单元;
所述档案关联单元用于获取所需调取的财务档案,调取与财务档案相关联的子档案;
所述虚拟库建立单元用于建立虚拟库,并在虚拟库中保存临时调取的财务档案;
所述档案年限识别单元用于识别档案年份;
所述档案调取单元的输出端与档案关联单元和档案年限识别单元的输入端相连接;所述档案关联单元的输出端与虚拟库建立单元的输入端相连接。
3.根据权利要求1所述的一种跨境电商的财务档案大数据管理系统,其特征在于:所述财务档案存储调整模块包括档案数量预测单元和档案整理规划单元;
所述档案数量预测单元用于获取历史数据中调取的档案数量,并以此来推测此次调取所有档案数量的时间;
所述档案整理规划单元用于对档案进行整理规划,以便于操作人员便利调取档案;
所述档案数量预测单元的输出端与档案整理规划单元的输入端相连接。
4.一种跨境电商的财务档案大数据管理方法,其特征在于:所述管理方法执行如下步骤:
Z01:获取所需调取的临时档案,根据临时档案与子档案的关联性进行聚类验证,得到与临时档案相关联的所有子档案;
Z02:对调取后的档案进行核算验证,若核实到财务档案与历史的财务档案核算结果不相同,则预先分析数据库中是否具备有权限的档案,若具备有权限的档案,则分析具备权限的档案与临时档案的关联关系;若具备权限的档案与临时档案存在关联关系,则将具备权限的档案与临时档案进行合并并保存至虚拟库中,并根据具备权限的档案的存储模式,监控档案合并过程;若具备权限的档案与临时档案不存在关联关系,则核实其他具备权限的档案;若不具备有权限的档案,则表示档案中的数据内容被修改;
Z03:获取历史时间段中调取的档案数量以及所调取档案数量对应时间,推测此次调取档案数量所对应的时间值;如若推测的时间值大于预设标准时间,则整理数据库中保存的档案数量;如若推测的时间值小于标准时间,则直接调取档案至虚拟库中。
5.根据权利要求4所述的一种跨境电商的财务档案大数据管理方法,其特征在于:在步骤Z01中,对与临时档案相关联的所有子档案进行聚类分为两种方式:
如若还未有子档案与临时档案建立相关联的联系,则在数据库中随机选择一批样本档案进行聚类,进而得到与临时档案相关联的子档案;
如若有部分子档案与临时档案已建立相关联的联系,则将已确定的子档案特征和其他子档案特征作为输入变量,初始化神经网络,得到已确定的子档案和其他子档案为临时档案的子档案集的概率。
6.根据权利要求5所述的一种跨境电商的财务档案大数据管理方法,其特征在于:如若还未有子档案与临时档案建立相关联的联系,则将临时档案相关联的所有子档案进行聚类,且聚类方法如下:
Z011:随机选择一批数量为G的样本档案,并将G个样本档案作为簇中心,将所调取的临时档案作为簇;
Z012:计算剩余样本与簇中心之间的距离集合,根据距离的长度,将样本赋值给最近的簇;
Z013:根据步骤Z012中的聚类结果,更新步骤Z011中簇中心的位置;
Z014:循环步骤Z011-Z013,并重新聚类,直至簇中心的位置不再发生明显变化为止。
7.根据权利要求5所述的一种跨境电商的财务档案大数据管理方法,其特征在于:如若有部分子档案与临时档案已建立相关联的联系,则将已确定的子档案特征和其他子档案特征作为输入变量,并始化神经网络,初始化神经网络的步骤如下:
Z0111:创建神经网络,并对神经网络初始化;
Z0112:提取部分子档案的特征点和其他子档案的特征点作为输入向量,将部分子档案的特征点和其他子档案特征点作为临时档案中子档案的概率;其中输入向量具体为财务档案上交易时间的类别、财务档案中的交易对象和财务档案中的交易目标对象;
Z0113:将部分子档案的特征点和其他子档案特征点作为临时档案中子档案的概率记为P;若核实到P>P’时,则表示部分子档案和其他子档案皆为临时档案中的子档案;若核实到P<P’时,则表示其他子档案并非属于临时档案中的子档案;P’为预设的标准概率。
8.根据权利要求4所述的一种跨境电商的财务档案大数据管理方法,其特征在于:在步骤Z03中,获取第一周所调取的档案数量k1和调取档案数量的时间为Q1,获取第二周所调取的档案数量k2和调取档案数量的时间为Q2;根据每周调取的档案数量和档案调取的时间建立直角坐标系,横坐标为调取的档案数量K,纵坐标为调取档案数量所对应时间Q;设定直线方程为Q=cK+b,c、b为任意实数;代入档案数量和对应调取档案数量时间的数据集,能够得到调取ki档案数量的时间Qi,若核实到调取档案数量的时间大于预设标准时间,则建立新的存储库,将调取档案数量的频次小于预设频次的指定档案移动至新的存储库中;若核实到调取档案数量的时间小于预设标准时间,则将档案移动至虚拟库中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210431107.6A CN114723543B (zh) | 2022-04-22 | 2022-04-22 | 一种跨境电商的财务档案大数据管理系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210431107.6A CN114723543B (zh) | 2022-04-22 | 2022-04-22 | 一种跨境电商的财务档案大数据管理系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114723543A CN114723543A (zh) | 2022-07-08 |
CN114723543B true CN114723543B (zh) | 2023-04-18 |
Family
ID=82246592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210431107.6A Active CN114723543B (zh) | 2022-04-22 | 2022-04-22 | 一种跨境电商的财务档案大数据管理系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114723543B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116091175B (zh) * | 2023-04-10 | 2023-08-22 | 南京航空航天大学 | 一种基于大数据的交易信息数据管理系统及方法 |
CN117435660B (zh) * | 2023-12-20 | 2024-03-08 | 尚德软件股份有限公司 | 一种信息整合系统及方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110765134A (zh) * | 2019-10-25 | 2020-02-07 | 四川东方网力科技有限公司 | 档案建立方法、设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7856414B2 (en) * | 2001-03-29 | 2010-12-21 | Christopher Zee | Assured archival and retrieval system for digital intellectual property |
WO2018051233A1 (en) * | 2016-09-14 | 2018-03-22 | FileFacets Corp. | Electronic document management using classification taxonomy |
CN112214657B (zh) * | 2020-09-30 | 2023-11-28 | 人保再保险股份有限公司 | 一种财务档案管理方法、系统及电子设备 |
CN112463726A (zh) * | 2020-11-19 | 2021-03-09 | 深圳供电局有限公司 | 一种移动财务票据的自动化归档方法 |
-
2022
- 2022-04-22 CN CN202210431107.6A patent/CN114723543B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110765134A (zh) * | 2019-10-25 | 2020-02-07 | 四川东方网力科技有限公司 | 档案建立方法、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114723543A (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114723543B (zh) | 一种跨境电商的财务档案大数据管理系统及方法 | |
CN103294592B (zh) | 利用用户工具交互来自动分析其服务交付中的缺陷的方法与系统 | |
Wang et al. | An RFID-based digital warehouse management system in the tobacco industry: a case study | |
CN110069623A (zh) | 摘要文本生成方法、装置、存储介质和计算机设备 | |
CN109993454A (zh) | 审计风险处理方法、装置、计算机设备和存储介质 | |
CN109409780B (zh) | 变更处理方法、装置、计算机设备和存储介质 | |
CN114493335A (zh) | 用于产品质量追溯的系统 | |
CN111260214A (zh) | 核电站预留工单领料方法、装置、设备及存储介质 | |
CN116757837A (zh) | 一种应用于中标贷的信用风控方法及系统 | |
KR102533239B1 (ko) | 인공지능 기반 위조 상품 탐지를 위한 이미지 라이브러리 시스템 및 가품 탐지 방법 | |
CN116167870A (zh) | 一种用于保险业务的费用管理系统 | |
CN111427936B (zh) | 报表生成方法、装置、计算机设备和存储介质 | |
CN112380321A (zh) | 基于票据知识图谱的主次数据库分配方法及相关设备 | |
CN110956552A (zh) | 保险问题处理方法、装置、设备及存储介质 | |
CN113590683A (zh) | 一种多维度的电子票据可疑用票综合监测分析方法 | |
JP3721315B2 (ja) | 名寄せシステム、名寄せ方法、そのシステムでの処理をコンピュータに行なわせるためのプログラムを格納した記憶媒体、及び、情報一致判断装置 | |
CN115082179A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN111222941A (zh) | 一种基于大数据的线上采购信息分类系统及手持操作终端 | |
CN115185923B (zh) | 一种气象观测元数据管理的方法、系统和智能终端 | |
CN113256180B (zh) | 一种基于机器学习的客服工单信息智能动态加载方法和系统 | |
CN113240353B (zh) | 一种面向跨境电商的出口工厂分类方法及装置 | |
CN113326310B (zh) | 基于nlp的调研数据标准化方法及系统 | |
CN116051296B (zh) | 基于标准化保险数据的客户评价分析方法及系统 | |
CN111858291B (zh) | 计费系统迁移测试中数据异常的根因确定方法、设备及系统 | |
CN1517923A (zh) | 一种线上销售订单处理系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A financial archive big data management system and method for cross-border e-commerce Granted publication date: 20230418 Pledgee: Bank of China Co.,Ltd. Changzhou New North Branch Pledgor: Keshuo Information Technology Changzhou Co.,Ltd. Registration number: Y2024980013127 |