CN110598007A - 账单文件处理方法、装置、介质及电子设备 - Google Patents
账单文件处理方法、装置、介质及电子设备 Download PDFInfo
- Publication number
- CN110598007A CN110598007A CN201910848611.4A CN201910848611A CN110598007A CN 110598007 A CN110598007 A CN 110598007A CN 201910848611 A CN201910848611 A CN 201910848611A CN 110598007 A CN110598007 A CN 110598007A
- Authority
- CN
- China
- Prior art keywords
- bill
- file
- feature
- information
- billing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 239000013598 vector Substances 0.000 claims abstract description 66
- 238000012545 processing Methods 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000012795 verification Methods 0.000 claims description 51
- 238000012544 monitoring process Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 8
- 230000010365 information processing Effects 0.000 claims 2
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 230000009471 action Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Library & Information Science (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本公开提供了一种账单文件处理方法、账单文件处理装置、计算机可读介质以及电子设备。该方法包括:获取待处理的账单文件,并从所述账单文件中提取账单内容信息;获取所述账单文件的文件标识信息,并确定与所述文件标识信息相关联的特征匹配规则;利用所述特征匹配规则对所述账单内容信息进行特征匹配以得到所述账单文件的特征向量;利用所述特征向量对所述账单文件进行逻辑校验,并将校验通过的账单文件标记为有效账单文件。该方法校验得到的有效账单文件可以通过区块链技术进行共享存储。该方法不仅可以降低账单文件的处理成本,而且可以提高账单文件的处理效率。
Description
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种账单文件处理方法、账单文件处理装置、计算机可读介质以及电子设备。
背景技术
银行对账单是指银行客观记录企业资金流转情况的记录单。就其概念而言,反映的主体是银行和企业,反映的内容是企业的资金,反映的形式是对企业资金流转的记录。就其用途来说,银行对账单是银行和企业之间对资金流转情况进行核对和确认的凭单。就其特征而言,银行对账单具有客观性、真实性、全面性等基本特征。
当企业接收到银行对账单或者其他类型的用于记录资金流转信息的账单文件时,一般需要对相关账单文件进行校验和解析处理,以便于后续对账单文件进行准确地存档或者其他处理。由于不同银行或者企业的账单文件具有不同的内容格式,因此对不同来源的账单文件难以形成统一的处理方法,普遍存在处理效率低、准确性差、处理成本高等问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种账单文件处理方法、账单文件处理装置、计算机可读介质以及电子设备,进而至少在一定程度上克服账单文件处理效率低、准确性差、处理成本高等技术问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的一个方面,提供一种账单文件处理方法,该方法包括:
获取待处理的账单文件,并从所述账单文件中提取账单内容信息;
获取所述账单文件的文件标识信息,并确定与所述文件标识信息相关联的特征匹配规则;
利用所述特征匹配规则对所述账单内容信息进行特征匹配以得到所述账单文件的特征向量;
利用所述特征向量对所述账单文件进行逻辑校验,并将校验通过的账单文件标记为有效账单文件。
根据本公开实施例的一个方面,提供一种账单文件处理装置,该装置包括:
账单内容提取模块,被配置为获取待处理的账单文件,并从所述账单文件中提取账单内容信息;
匹配规则确定模块,被配置为获取所述账单文件的文件标识信息,并确定与所述文件标识信息相关联的特征匹配规则;
特征向量匹配模块,被配置为利用所述特征匹配规则对所述账单内容信息进行特征匹配以得到所述账单文件的特征向量;
账单文件校验模块,被配置为利用所述特征向量对所述账单文件进行逻辑校验,并将校验通过的账单文件标记为有效账单文件。
在本公开的一些实施例中,基于以上技术方案,所述装置还包括:
文件样本确定模块,被配置为确定账单文件来源以及与所述账单文件来源相对应的账单文件样本;
匹配目标确定模块,被配置为获取与所述账单文件来源相关的对账需求信息,并根据所述对账需求信息确定多个特征匹配目标;
匹配规则确定模块,被配置为利用所述特征匹配目标从所述账单文件样本中提取多个属性特征,并确定用于对所述多个属性特征与所述多个特征匹配目标进行特征匹配的特征匹配规则;
关联关系建立模块,被配置为获取与所述账单文件来源相对应的文件标识信息,并建立所述文件标识信息与所述特征匹配规则之间的关联关系。
在本公开的一些实施例中,基于以上技术方案,所述特征向量匹配模块包括:
账单特征提取模块,被配置为利用所述特征匹配规则对所述账单内容信息进行特征提取以得到所述账单文件的多个账单特征值;
特征集合确定模块,被配置为根据所述多个账单特征值确定具有树形结构的账单特征集合;
特征向量确定模块,被配置为根据所述账单特征集合中位于叶子节点上的账单特征值确定所述账单文件的特征向量。
在本公开的一些实施例中,基于以上技术方案,所述特征向量匹配模块还包括:
账户标识识别模块,被配置为识别所述账单内容信息中的账户标识信息;
特征集合拆分模块,被配置为当所述账单内容信息中包括多个所述账户标识信息时,根据所述账户标识信息将所述账单特征集合拆分为多个具有树形结构的账户特征子集合。
在本公开的一些实施例中,基于以上技术方案,所述特征向量确定模块包括:
特征集合筛选子模块,被配置为获取监控账户白名单,并根据所述监控账户白名单从所述账单特征集合中筛选得到一个或者多个目标账户特征子集合;
特征向量确定子模块,被配置为根据所述目标账户特征子集合中位于叶子节点上的账单特征值确定所述账单文件的特征向量。
在本公开的一些实施例中,基于以上技术方案,所述账单文件校验模块包括:
校验类型确定模块,被配置为根据所述特征匹配规则确定所述特征向量中的各个特征值的校验类型,所述校验类型为必要校验特征或非必要校验特征;
必要特征校验模块,被配置为对所述校验类型为必要校验特征的特征值进行逻辑校验以得到所述账单文件的校验结果。
在本公开的一些实施例中,基于以上技术方案,所述必要校验特征包括汇总信息类特征、明细信息类特征和余额信息类特征。
根据本公开实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的账单文件处理方法。
根据本公开实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器被配置为经由执行所述可执行指令来执行如以上技术方案中的账单文件处理方法。
在本公开实施例提供的技术方案中,通过为不同来源渠道的账单文件配置特征匹配规则,同时建立特征匹配规则与文件标识信息的关联关系,可以对各种来源的账单文件进行自动化地识别和特征匹配,进而可以利用特征匹配得到的特征向量对账单文件进行逻辑校验以得到有效账单文件。该方法对各种不同的账单文件来源渠道具有高度的普遍适用性,无需针对不同的账单文件来源渠道进行独立编辑代码,不仅可以降低账单文件的处理成本,而且可以提高账单文件的处理效率。另外,本公开实施例提供的技术方案可以快速适应账单内容的变化,具有灵活性高、实时性好等优点。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了应用本公开技术方案的示例性系统架构示意图;
图2示意性地示出了本公开一些实施例中账单文件处理方法的步骤流程图。
图3示意性地示出了本公开一些实施例中配置特征匹配规则的步骤流程图。
图4示意性地示出了本公开一些实施例中利用特征匹配规则获取账单文件特征向量的步骤流程图。
图5示意性地示出了一种账单特征集合的树形结构框架。
图6示意性地示出了本公开一些实施例中拆分账单特征集合的步骤流程图。
图7示意性地示出了本公开一些实施例中确定特征向量的步骤流程图。
图8示意性地示出了本公开一些实施例中进行逻辑校验的步骤流程图。
图9示意性地示出了本公开一些实施例中用于保存有效账单文件的数据共享系统。
图10示意性地示出了本公开一些实施例中区块链的组成结构。
图11示意性地示出了本公开一些实施例中由区块链生成区块的过程。
图12示意性地示出了在本公开一些实施例中的账单文件处理装置的结构框图。
图13示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
在本领域的相关技术中,为了实现对账单文件的自动化处理,可以为每个银行或者企业等各种账单来源渠道进行单独编码形成独立的且具有一一对应关系的代码实体,一个代码实体仅用于对单一来源渠道的账单进行校验和解析处理。由于需要对各种账单来源渠道进行单独编码,且每一个代码实体都需要进行独立地测试和运行维护,因此这种处理方法仍然存在运行成本高的问题。另外,当遇到某一来源渠道的账单内容或者账单格式发生变化时,必须从代码层面上对账单文件的处理规则和流程做出调整,无法快速适应,存在使用灵活性差的问题。
基于以上方案存在的问题,本公开提供了一种能够实现对多来源渠道的账单文件进行统一高效地自动化处理的账单文件处理方法、账单文件处理装置、计算机可读介质以及电子设备。
图1示出了应用本公开技术方案的示例性系统架构示意图。
如图1所示,系统架构100可以包括客户端110、网络120和服务端130。客户端110可以包括智能手机、平板电脑、笔记本电脑、台式电脑等各种终端设备。服务端130可以包括网络服务器、应用服务器、数据库服务器等各种服务器设备。网络120可以是能够在客户端110和服务端130之间提供通信链路的各种连接类型的通信介质,例如可以是有线通信链路或者无线通信链路。
根据实现需要,本公开实施例中的系统架构可以具有任意数目的客户端、网络和服务端。例如,服务端130可以是由多个服务器设备组成的服务器群组。另外,本公开实施例中的账单文件处理方法可以应用于客户端110,也可以应用于服务端130,本公开对此不做特殊限定。
举例而言,当本公开实施例中的账单文件处理方法应用于服务端130时,根据用户对来自某一银行或者企业等来源渠道的账单文件的处理需求,客户端110可以通过网络120向服务端130发送针对账单文件的处理请求,然后由服务端130执行相关的账单文件处理方法以得到对相应账单文件的处理结果,例如可以对相应账单文件进行校验,以判断账单内容的准确性。对账单文件的处理结果可以被存储在服务端130的数据库中,同时也可以通过网络120返回给客户端110,以便用户可以实时掌握账单文件的处理进度和处理结果。
下面结合具体实施方式对本公开提供的账单文件处理方法、账单文件处理装置、计算机可读介质以及电子设备做出详细说明。
图2示意性地示出了本公开一些实施例中账单文件处理方法的步骤流程图。如图2所示,该方法主要可以包括以下步骤:
步骤S210.获取待处理的账单文件,并从账单文件中提取账单内容信息。
为了实现对账单文件的自动化处理,本步骤可以按照预先设定的文件获取时间或者文件获取条件从银行、企业等各种外部账单来源渠道或者内部数据库中自动拉取待处理的账单文件。在自动拉取或者接收得到不同来源渠道的待处理的账单文件之后,本步骤还将从账单文件中提取账单内容信息以便后续对账单内容进行解析、校验和其他处理。账单内容信息一般可以包括借方或者贷方的账户信息、交易类型、交易币种、交易日期、借贷笔数、借贷金额等通用性的账单信息,另外也可以包括针对不同来源渠道的具有差异性和个异性的账单信息。在一些可选的实施方式中,本步骤可以通过安全文件传送协议(SecureFile Transfer Protocol,简称SFTP)获取待处理的账单文件,SFTP可以为账单文件提供安全的网络加密,针对获取到的待处理的账单文件,需要经过解密处理以及签名验证后才能从中提取账单内容信息。
步骤S220.获取账单文件的文件标识信息,并确定与文件标识信息相关联的特征匹配规则。
文件标识信息是用于对来自于不同来源渠道或者同一来源渠道的各种账单文件进行差异化标识的信息,文件标识信息除了可以用于区分不同的账单文件以外,也可以用于识别账单文件的来源渠道。本步骤通过获取账单文件的文件标识信息可以识别该账单文件的来源渠道,以避免出现不同渠道账单文件的相互干扰。另外,针对各种不同的账单文件,本示例性实施方式可以预先建立文件标识信息与特征匹配规则的关联关系,基于该关联关系,本步骤利用获取到的文件标识信息即可确定与之对应的特征匹配规则。举例而言,账单交易双方可以按照约定的规则生成文件标识信息,同时可以为各种账单文件制定不同的特征匹配规则,通过识别账单文件的文件标识信息即可确定账单文件的来源渠道以及与之对应的特征匹配规则。例如,文件标识信息可以是具有一定长度的字符串,该字符串中的一部分字符用于标识账单文件来源,另一部分字符用于标识特征匹配规则。
步骤S230.利用特征匹配规则对账单内容信息进行特征匹配以得到账单文件的特征向量。
如上所述,账单内容信息中包括有数量众多且种类各异的与账户、金额、时间等内容相关的信息,这些信息中有些是在后续的解析校验或者对账、存档等处理过程中需要使用的重要程度较高的信息,而有些则是无需进行校验或者在后续的对账、存档等处理过程中不会用到的重要程度较低的信息。另外,账单内容信息中的部分信息还需要进行数值计算、格式转换、合并或者删除等规则化处理。因此,本示例性实施方式可以预先设定特征匹配规则,基于通过步骤S220确定的特征匹配规则,本步骤可以对账单内容信息进行特征匹配,例如可以是按照相关规则从账单内容信息中准确获取必要的特征信息,滤除不必要的特征信息,同时对部分特征信息进行规则化处理,最终对相关信息进行整合以得到账单文件的特征向量。
步骤S240.利用特征向量对账单文件进行逻辑校验,并将校验通过的账单文件标记为有效账单文件。
特征向量由对应于不同向量维度的特征值构成,一个特征值用于表征账单文件中一处或者多处账单内容的特征信息,或者由多个特征值共同表征账单文件中一处或者多处账单内容的特征信息。利用特征向量进行逻辑校验的方式可以是对特征向量中指定维度的特征值进行取值比对或者计算,以判断相关特征值的取值是否符合规定的账单逻辑,例如可以根据相关特征值判断账单文件中的账户信息是否与系统保存的账户信息一致,又如可以根据相关特征值判断账户期初余额、借方交易金额、贷方交易金额、账户期末余额等各种金额数值之间的计算是否正确等等。针对逻辑校验通过的账单文件可以被标记为有效账单文件,后续可以将其保存至数据库或者传送给指定人员继续执行其他处理过程。另外,对于逻辑校验未通过的账单文件,可以将其标记为无效账单文件,无效账单文件可以被传送给指定人员进行人工核验,或者可以被退回给发出该账单文件的账单交易方。
在本公开实施例提供的账单文件处理方法中,通过为不同来源渠道的账单文件配置特征匹配规则,同时建立特征匹配规则与文件标识信息的关联关系,可以对各种来源的账单文件进行自动化地识别和特征匹配,进而可以利用特征匹配得到的特征向量对账单文件进行逻辑校验以得到有效账单文件。该方法对各种不同的账单文件来源渠道具有高度的普遍适用性,无需针对不同的账单文件来源渠道进行独立编辑代码,不仅可以降低账单文件的处理成本,而且可以提高账单文件的处理效率。另外,该方法可以快速适应账单内容的变化,具有灵活性高、实时性好等优点。
为了对账单文件进行特征匹配,本公开可以预先配置特征匹配规则,同时为了提高特征匹配规则的准确性和实时可用性,本公开还可以定期地或者根据一定的触发条件实时地对特征匹配规则进行更新。图3示意性地示出了本公开一些实施例中配置特征匹配规则的步骤流程图。如图3所示,在步骤S220中确定与文件标识信息相关联的特征匹配规则之前,还包括以下用于配置特征匹配规则的步骤:
步骤S310.确定账单文件来源以及与账单文件来源相对应的账单文件样本。
账单文件来源是与当前用户具有交易往来的银行、企业等渠道,由不同账单文件来源获取到的账单文件一般具有不同的账单格式和文件格式,例如不同的账单文件来源可能使用xml、txt或者csv等各种不同的文件格式。本步骤首先确定一个账单文件来源,同时需要确定与该账单文件来源相对应的账单文件样本。账单文件样本可以是由账单文件来源提供的符合其自身文件规格的示例性文件,例如该账单文件样本例如可以是等不同格式的文件。当某一账单文件来源对账单文件的规范性内容做出调整时,本步骤也可以从相应的账单文件来源处获取更新后的账单文件样本。
步骤S320.获取与账单文件来源相关的对账需求信息,并根据对账需求信息确定多个特征匹配目标。
不同的账单文件来源对于账单文件的处理需求也不尽相同,本步骤可以获取与账单文件来源相关的对账需求信息。例如,对账需求信息可以包括“余额连续性”、“流水不重复”、“汇总信息与明细信息校核无误”等等。其中,余额连续性指的是对于连续获取的账单文件,后一份账单文件的期初余额等于前一份账单文件的期末余额。为了满足相应的对账需求信息,本步骤可以确定多个特征匹配目标。例如,特征匹配目标可以包括“渠道类型”、“币种类型”、“变更金额”、“借贷类型”、“期初余额”、“期末余额”等等。
步骤S330.利用特征匹配目标从账单文件样本中提取多个属性特征,并确定用于对多个属性特征与多个特征匹配目标进行特征匹配的特征匹配规则。
利用步骤S320确定的多个特征匹配目标,本步骤可以从账单文件样本中查找并提取与之相对应的属性特征,同时可以确定用于对多个属性特征和多个特征匹配目标进行特征匹配的特征匹配规则,该特征匹配规则即用于建立属性特征与特征匹配目标之间的映射关系,每一个特征匹配目标可以与一个或者多个属性特征建立映射关系。例如,针对特征匹配目标“渠道类型”可以从账单文件样本中提取对应于字段“Stmt”或者字段“Nm”的属性特征,针对“币种类型”可以提取对应于字段“Ccy”的属性特征,针对“变更金额”可以提取对应于字段“Amt”的属性特征,针对“借贷类型”可以提取对应于字段“CdtDbtInd”的属性特征,针对“期初余额”可以提取对应于字段“TxsSummry”的属性特征,针对“借贷类型”可以提取对应于字段“Bal”的属性特征,等等。
特征匹配规则除了用于建立属性特征与特征匹配目标之间的映射关系以外,还可以用于对属性特征的取值进行计算和转换以使属性特征的取值形式符合特征匹配目标的规范要求。例如,针对特征匹配目标“币种类型”可以按照某一币种的最小单位进行转换,针对特征匹配目标“借贷类型”,可以从英文转换成枚举数值,针对“时间类型”可以进行时区转换,等等。
步骤S340.获取与账单文件来源相对应的文件标识信息,并建立文件标识信息与特征匹配规则之间的关联关系。
由步骤S330确定特征匹配规则后,本步骤将获取与账单文件来源相对应的文件标识信息,并对文件标识信息和特征匹配规则建立关联关系。如此一来,在后续对真实的账单文件进行处理的过程中,便可以直接根据获取到的文件标识信息确定对应于一个账单文件来源的特征匹配规则,从而可以利用确定的特征匹配规则对账单文件的账单内容信息进行特征匹配以得到相应的特征向量,并最终完成对账单文件的校验等处理过程。
图4示意性地示出了本公开一些实施例中利用特征匹配规则获取账单文件特征向量的步骤流程图。如图4所示,在以上各实施例的基础上,步骤S230.利用特征匹配规则对账单内容信息进行特征匹配以得到账单文件的特征向量,可以包括以下步骤:
步骤S410.利用特征匹配规则对账单内容信息进行特征提取以得到账单文件的多个账单特征值。
如上一实施例所述,特征匹配规则建立了特征匹配目标与账单文件样本的属性特征的映射关系,基于这种映射关系,本步骤可以对账单内容信息进行特征提取以得到账单文件的多个账单特征值。必要的时候,本步骤还可以对账单特征值进行计算和取值转换以得到符合校验要求或者数据库存储要求的账单特征值。
步骤S420.根据多个账单特征值确定具有树形结构的账单特征集合。
账单内容信息中的各个信息节点具有复杂的层级关系,本步骤针对从账单内容信息中提取得到的多个账单特征值可以按照各个账单特征值相互之间的层级关系进行布局以形成具有树形结构的账单特征集合。
图5示意性地示出了一种账单特征集合的树形结构框架。如图5所示,以“账单文件Root”为根节点,第一层子节点分别为“账单来源MsgId”、“文件标识Nm”、“附加信息AddtInf”、“账单内容Rpt”。由“账单内容Rpt”可以延伸出第二层子节点,第二层子节点包括了多个账户子节点:“账户Stmt1”、“账户Stmt2”、“账户Stmt3”……“账户Stmtn”。其中每一个账户子节点都可以继续延伸出第三层子节点,例如由“账户Stmt1”延伸得到的第三层子节点包括了“期初余额Smmy”、“期末余额Bal”以及多个流水子节点:“流水Ntry1”、“流水Ntry2”……“流水Ntryn”。各个流水子节点可以继续延伸出第四层子节点,例如由“流水Ntry1”延伸得到的第四层子节点包括了“变更金额Amt”、“币种类型Ccy”、“借贷类型CdtDbtInd”、“流水节点ID”等多个子节点。
步骤S430.根据账单特征集合中位于叶子节点上的账单特征值确定账单文件的特征向量。
基于步骤S420确定的具有树形结构的账单特征集合,本步骤可以采集位于树形结构的叶子节点上的账单特征值,按照特定的顺序对这些账单特征值进行排序组合后形成一个特征序列,针对该特征序列可以按照预设的编码规则对其进行编码,从而可以得到账单文件的特征向量。
对于一个账单文件而言,其账单内容中可能同时包含有一个或者多个账户,针对账单文件中包含多个账户的情况,本公开可以对账单特征集合做拆分处理,以避免各个账户之间相互干扰而出现信息混淆或者信息导入错误等问题。图6示意性地示出了本公开一些实施例中拆分账单特征集合的步骤流程图。如图6所示,在步骤S430.根据账单特征集合中位于叶子节点上的账单特征值确定账单文件的特征向量之前,拆分账单特征集合的方法包括以下步骤:
步骤S610.识别账单内容信息中的账户标识信息。
针对与账单文件来源相关的每一个银行账户,可以在账单文件内提供一个具有唯一性标识功能的账户标识信息,例如可以是账户的账号信息,或者可以是单独配置的识别标识。
步骤S620.当账单内容信息中包括多个账户标识信息时,根据账户标识信息将账单特征集合拆分为多个具有树形结构的账户特征子集合。
当一个账单文件的账单内容信息中同时包括多个账户标识信息时,本步骤可以根据账户标识信息对树形结构的账单特征集合进行拆分处理以得到多个子树,每一个子树即对应于一个账户特征子集合。例如,针对图5所示的账单文件树,将各个账户子节点作为拆分节点,可以得到分别以“账户Stmt1”、“账户Stmt2”、“账户Stmt3”……“账户Stmtn”等账户子节点作为根节点的子树。针对各个子树分别采集叶子节点上的账单特征值可以避免各个账户信息的相互干扰,从而可以提高形成特征向量的准确性。
图7示意性地示出了本公开一些实施例中确定特征向量的步骤流程图。如图7所示,在以上各实施例的基础上,步骤S430.根据账单特征集合中位于叶子节点上的账单特征值确定账单文件的特征向量,可以包括以下步骤:
步骤S710.获取监控账户白名单,并根据监控账户白名单从账单特征集合中筛选得到一个或者多个目标账户特征子集合。
在本公开实施例中,可以预先配置并维护针对一个或者多个账单文件来源的监控账户白名单,本步骤根据该监控账户白名单可以对账单特征集合做筛选处理,从中筛选得到一个或者多个目标账户特征子集合。例如,本步骤可以按照监控账户白名单中的账户信息对各个账户特征子集合对应的子树的根节点进行逐一对比查询,如果某一账户特征子集合对应的账户出现在监控账户白名单中,便将确定为目标账户特征子集合;而如果某一账户特征子集合对应的账户没有出现在监控账户白名单中,则将其滤除。
步骤S720.根据目标账户特征子集合中位于叶子节点上的账单特征值确定账单文件的特征向量。
针对步骤S710筛选得到的目标账户特征子集合,本步骤采集位于叶子节点上的账单特征值,并根据账单特征值确定账单文件的特征向量。除目标账户特征子集合以外的其他账户特征子集合已在步骤S710中被滤除,因此与这些被滤除的账户相对应的账单内容信息不会出现在账单文件的特征向量中。换言之,本公开实施例通过配置并维护监控账户白名单,可以精简构成特征向量的账单特征值,仅对用户关心的关键账户进行监控,而与其他非关键账户相关的账单内容则可以被滤除,从而可以提高账单文件的处理效率和处理准确性。
除了监控账户的筛选以外,本公开实施例还可以对构成特征向量的需要进行逻辑校验的特征值进行筛选,以便进一步提高账单文件的处理效率和处理准确性。图8示意性地示出了本公开一些实施例中进行逻辑校验的步骤流程图。如图8所示,在以上各实施例的基础上,步骤S240中的利用特征向量对账单文件进行逻辑校验,可以包括以下步骤:
步骤S810.根据特征匹配规则确定特征向量中的各个特征值的校验类型,校验类型为必要校验特征或非必要校验特征。
根据预先配置和确定的特征匹配规则,构成特征向量的各个特征值可按照校验需求划分为两种校验类型,即必要校验特征和非必要校验特征。必要校验特征是在账单逻辑校验中需要校验或者使用的特征以及后续需要进行对账或者其他处理的特征。非必要校验特征仅用于对特征类型交易的信息进行展示,而在后续的逻辑校验过程以及其他处理过程中无需被校验或者使用。
步骤S820.对校验类型为必要校验特征的特征值进行逻辑校验,以得到账单文件的校验结果。
根据步骤S810对各个特征值的校验类型划分结果,本步骤可以针对校验类型为必要校验特征的特征值进行逻辑校验,基于必要校验特征获得的校验结果即作为账单文件的校验结果。
在本公开的一些实施例中,必要校验特征主要可以包括汇总信息类特征、明细信息类特征和余额信息类特征三种类型。
举例而言,汇总信息类特征可以包括汇总的借贷笔数、借贷总金额、总变更笔数、发生额等等。另外,汇总信息类特征还可以是与账户相关的信息,例如可以包括账号、币种、银行国际代码(SWIFT Code)等等。针对汇总信息类特征进行的逻辑校验例如包括校验相关账户信息与监控账户白名单中对应的账户信息是否一致。
明细信息类特征例如可以包括明细借贷笔数、借方金额合计、贷方金额合计、明细总笔数、明细发生额等等。针对汇总信息类特征与明细信息类特征共同进行的逻辑校验例如可以包括校验汇总的借贷笔数、借贷总金额、总变更笔数、发生额等汇总信息与明细借贷笔数、借方金额合计、贷方金额合计、明细总笔数、明细发生额等明细信息是否一致。
余额信息类特征例如可以包括期初余额、期末余额等等。针对余额信息类特征进行的逻辑校验例如可以包括校验当前账单文件的期初余额与上一份账单文件的期末余额是否一致,校验计算期初余额与借方总发生额相加再减去贷方总发生额得到的金额数值与期末余额是否一致。
对于通过逻辑校验的账单文件可以被标记为有效账单文件,后续可以将有效账单文件保存至客户端或者服务端的数据库中。
在本公开的一些实施例中,可以使用区块链技术对有效账单文件进行共享存储。图9示意性地示出了本公开一些实施例中用于保存有效账单文件的数据共享系统。如图9所示,数据共享系统900是指用于进行节点与节点之间数据共享的系统,该数据共享系统中可以包括多个节点910,多个节点910可以是指数据共享系统中各个客户端。每个节点910在进行正常工作时可以接收到输入信息,并基于接收到的输入信息维护该数据共享系统内的共享数据。为了保证数据共享系统内的信息互通,数据共享系统中的每个节点之间可以存在信息连接,节点之间可以通过上述信息连接进行信息传输。例如,当数据共享系统中的任意节点接收到输入信息时,数据共享系统中的其他节点便根据共识算法获取该输入信息,将该输入信息作为共享数据中的数据进行存储,使得数据共享系统中全部节点上存储的数据均一致。
对于数据共享系统中的每个节点,均具有与其对应的节点标识,而且数据共享系统中的每个节点均可以存储有数据共享系统中其他节点的节点标识,以便后续根据其他节点的节点标识,将生成的区块广播至数据共享系统中的其他节点。每个节点中可维护一个如下表所示的节点标识列表,将节点名称和节点标识对应存储至该节点标识列表中。其中,节点标识可为IP(Internet Protocol,网络之间互联的协议)地址以及其他任一种能够用于标识该节点的信息,表1中仅以IP地址为例进行说明。
节点名称 | 节点标识 |
节点1 | 117.114.151.174 |
节点2 | 117.116.189.145 |
… | … |
节点N | 119.123.789.258 |
数据共享系统中的每个节点均存储一条相同的区块链。区块链由多个区块组成,图10示意性地示出了本公开一些实施例中区块链的组成结构。如图10所示,区块链由多个区块组成,创始块中包括区块头和区块主体,区块头中存储有输入信息特征值、版本号、时间戳和难度值,区块主体中存储有输入信息;创始块的下一区块以创始块为父区块,下一区块中同样包括区块头和区块主体,区块头中存储有当前区块的输入信息特征值、父区块的区块头特征值、版本号、时间戳和难度值,并以此类推,使得区块链中每个区块中存储的区块数据均与父区块中存储的区块数据存在关联,保证了区块中输入信息的安全性。
图11示意性地示出了本公开一些实施例中由区块链生成区块的过程。如图11所示,区块链所在的节点在接收到输入信息时,对输入信息进行校验,完成校验后,将输入信息存储至内存池中,并更新其用于记录输入信息的哈希树;之后,将更新时间戳更新为接收到输入信息的时间,并尝试不同的随机数,多次进行特征值计算,使得计算得到的特征值可以满足下述公式:
SHA256(SHA256(version+prev_hash+merkle_root+ntime+nbits+x))<TARGET
其中,SHA256为计算特征值所用的特征值算法;version(版本号)为区块链中相关区块协议的版本信息;prev_hash为当前区块的父区块的区块头特征值;merkle_root为输入信息的特征值;ntime为更新时间戳的更新时间;nbits为当前难度,在一段时间内为定值,并在超出固定时间段后再次进行确定;x为随机数;TARGET为特征值阈值,该特征值阈值可以根据nbits确定得到。
这样,当计算得到满足上述公式的随机数时,便可将信息对应存储,生成区块头和区块主体,得到当前区块。随后,区块链所在节点根据数据共享系统中其他节点的节点标识,将新生成的区块分别发送给其所在的数据共享系统中的其他节点,由其他节点对新生成的区块进行校验,并在完成校验后将新生成的区块添加至其存储的区块链中。
应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
以下介绍本公开的装置实施例,可以用于执行本公开上述实施例中的账单文件处理方法。对于本公开装置实施例中未披露的细节,请参照本公开上述的账单文件处理方法的实施例。
图12示意性地示出了在本公开一些实施例中的账单文件处理装置的结构框图。如图12所示,账单文件处理装置1200主要可以包括:
账单内容提取模块1210,被配置为获取待处理的账单文件,并从账单文件中提取账单内容信息;
匹配规则确定模块1220,被配置为获取账单文件的文件标识信息,并确定与文件标识信息相关联的特征匹配规则;
特征向量匹配模块1230,被配置为利用特征匹配规则对账单内容信息进行特征匹配以得到账单文件的特征向量;
账单文件校验模块1240,被配置为利用特征向量对账单文件进行逻辑校验,并将校验通过的账单文件标记为有效账单文件。
在本公开的一些实施例中,基于以上各实施例,账单文件处理装置1200还包括:
文件样本确定模块,被配置为确定账单文件来源以及与账单文件来源相对应的账单文件样本;
匹配目标确定模块,被配置为获取与账单文件来源相关的对账需求信息,并根据对账需求信息确定多个特征匹配目标;
匹配规则确定模块,被配置为利用特征匹配目标从账单文件样本中提取多个属性特征,并确定用于对多个属性特征与多个特征匹配目标进行特征匹配的特征匹配规则;
关联关系建立模块,被配置为获取与账单文件来源相对应的文件标识信息,并建立文件标识信息与特征匹配规则之间的关联关系。
在本公开的一些实施例中,基于以上各实施例,特征向量匹配模块包括:
账单特征提取模块,被配置为利用特征匹配规则对账单内容信息进行特征提取以得到账单文件的多个账单特征值;
特征集合确定模块,被配置为根据多个账单特征值确定具有树形结构的账单特征集合;
特征向量确定模块,被配置为根据账单特征集合中位于叶子节点上的账单特征值确定账单文件的特征向量。
在本公开的一些实施例中,基于以上各实施例,特征向量匹配模块还包括:
账户标识识别模块,被配置为识别账单内容信息中的账户标识信息;
特征集合拆分模块,被配置为当账单内容信息中包括多个账户标识信息时,根据账户标识信息将账单特征集合拆分为多个具有树形结构的账户特征子集合。
在本公开的一些实施例中,基于以上各实施例,特征向量确定模块包括:
特征集合筛选子模块,被配置为获取监控账户白名单,并根据监控账户白名单从账单特征集合中筛选得到一个或者多个目标账户特征子集合;
特征向量确定子模块,被配置为根据目标账户特征子集合中位于叶子节点上的账单特征值确定账单文件的特征向量。
在本公开的一些实施例中,基于以上各实施例,账单文件校验模块包括:
校验类型确定模块,被配置为根据特征匹配规则确定特征向量中的各个特征值的校验类型,校验类型为必要校验特征或非必要校验特征;
必要特征校验模块,被配置为对校验类型为必要校验特征的特征值进行逻辑校验以得到账单文件的校验结果。
在本公开的一些实施例中,基于以上各实施例,必要校验特征包括汇总信息类特征、明细信息类特征和余额信息类特征。
本公开各实施例中提供的账单文件处理装置的具体细节已经在对应的方法实施例中进行了详细的描述,因此此处不再赘述。
图13示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图13示出的电子设备的计算机系统1300仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图13所示,计算机系统1300包括中央处理单元(Central Processing Unit,CPU)1301,其可以根据存储在只读存储器(Read-Only Memory,ROM)1302中的程序或者从存储部分1308加载到随机访问存储器(Random Access Memory,RAM)1303中的程序而执行各种适当的动作和处理。在RAM 1303中,还存储有系统操作所需的各种程序和数据。CPU1301、ROM 1302以及RAM 1303通过总线1304彼此相连。输入/输出(Input/Output,I/O)接口1305也连接至总线1304。
以下部件连接至I/O接口1305:包括键盘、鼠标等的输入部分1306;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1307;包括硬盘等的存储部分1308;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1309。通信部分1309经由诸如因特网的网络执行通信处理。驱动器1310也根据需要连接至I/O接口1305。可拆卸介质1311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1310上,以便于从其上读出的计算机程序根据需要被安装入存储部分1308。
特别地,根据本公开的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1309从网络上被下载和安装,和/或从可拆卸介质1311被安装。在该计算机程序被中央处理单元(CPU)1301执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本公开实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种账单文件处理方法,其特征在于,包括:
获取待处理的账单文件,并从所述账单文件中提取账单内容信息;
获取所述账单文件的文件标识信息,并确定与所述文件标识信息相关联的特征匹配规则;
利用所述特征匹配规则对所述账单内容信息进行特征匹配以得到所述账单文件的特征向量;
利用所述特征向量对所述账单文件进行逻辑校验,并将校验通过的账单文件标记为有效账单文件。
2.根据权利要求1所述的账单文件处理方法,其特征在于,在确定与所述文件标识信息相关联的特征匹配规则之前,所述方法还包括:
确定账单文件来源以及与所述账单文件来源相对应的账单文件样本;
获取与所述账单文件来源相关的对账需求信息,并根据所述对账需求信息确定多个特征匹配目标;
利用所述特征匹配目标从所述账单文件样本中提取多个属性特征,并确定用于对所述多个属性特征与所述多个特征匹配目标进行特征匹配的特征匹配规则;
获取与所述账单文件来源相对应的文件标识信息,并建立所述文件标识信息与所述特征匹配规则之间的关联关系。
3.根据权利要求1所述的账单文件处理方法,其特征在于,所述利用所述特征匹配规则对所述账单内容信息进行特征匹配以得到所述账单文件的特征向量,包括:
利用所述特征匹配规则对所述账单内容信息进行特征提取以得到所述账单文件的多个账单特征值;
根据所述多个账单特征值确定具有树形结构的账单特征集合;
根据所述账单特征集合中位于叶子节点上的账单特征值确定所述账单文件的特征向量。
4.根据权利要求3所述的账单文件处理方法,其特征在于,在根据所述账单特征集合中位于叶子节点上的账单特征值确定所述账单文件的特征向量之前,所述方法还包括:
识别所述账单内容信息中的账户标识信息;
当所述账单内容信息中包括多个所述账户标识信息时,根据所述账户标识信息将所述账单特征集合拆分为多个具有树形结构的账户特征子集合。
5.根据权利要求4所述的账单文件处理方法,其特征在于,所述根据所述账单特征集合中位于叶子节点上的账单特征值确定所述账单文件的特征向量,包括:
获取监控账户白名单,并根据所述监控账户白名单从所述账单特征集合中筛选得到一个或者多个目标账户特征子集合;
根据所述目标账户特征子集合中位于叶子节点上的账单特征值确定所述账单文件的特征向量。
6.根据权利要求1所述的账单信息处理方法,其特征在于,所述利用所述特征向量对所述账单文件进行逻辑校验,包括:
根据所述特征匹配规则确定所述特征向量中的各个特征值的校验类型,所述校验类型为必要校验特征或非必要校验特征;
对所述校验类型为必要校验特征的特征值进行逻辑校验以得到所述账单文件的校验结果。
7.根据权利要求6所述的账单信息处理方法,其特征在于,所述必要校验特征包括汇总信息类特征、明细信息类特征和余额信息类特征。
8.一种账单文件处理装置,其特征在于,包括:
账单内容提取模块,被配置为获取待处理的账单文件,并从所述账单文件中提取账单内容信息;
匹配规则确定模块,被配置为获取所述账单文件的文件标识信息,并确定与所述文件标识信息相关联的特征匹配规则;
特征向量匹配模块,被配置为利用所述特征匹配规则对所述账单内容信息进行特征匹配以得到所述账单文件的特征向量;
账单文件校验模块,被配置为利用所述特征向量对所述账单文件进行逻辑校验,并将校验通过的账单文件标记为有效账单文件。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的账单文件处理方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任一项所述的账单文件处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910848611.4A CN110598007B (zh) | 2019-09-09 | 2019-09-09 | 账单文件处理方法、装置、介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910848611.4A CN110598007B (zh) | 2019-09-09 | 2019-09-09 | 账单文件处理方法、装置、介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110598007A true CN110598007A (zh) | 2019-12-20 |
CN110598007B CN110598007B (zh) | 2023-10-27 |
Family
ID=68858236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910848611.4A Active CN110598007B (zh) | 2019-09-09 | 2019-09-09 | 账单文件处理方法、装置、介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110598007B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112395465A (zh) * | 2020-11-24 | 2021-02-23 | 维沃移动通信有限公司 | 发票数据的处理方法、装置、电子设备及可读存储介质 |
CN113220456A (zh) * | 2021-05-21 | 2021-08-06 | 中国农业银行股份有限公司 | 账单数据的处理方法及相关装置 |
CN117314662A (zh) * | 2023-09-06 | 2023-12-29 | 金网络(北京)数字科技有限公司 | 一种智能对账方法、系统、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130066775A1 (en) * | 2011-09-06 | 2013-03-14 | Mastercard International Incorporated | Apparatus, method, and computer program product for data cleansing and/or biller scrubbing |
CN107798109A (zh) * | 2017-11-01 | 2018-03-13 | 深圳市牛鼎丰科技有限公司 | 对账清算的方法、装置、计算机设备及存储介质 |
CN109543373A (zh) * | 2014-12-10 | 2019-03-29 | 阿里巴巴集团控股有限公司 | 一种基于用户行为的信息识别方法及装置 |
CN109584031A (zh) * | 2018-11-23 | 2019-04-05 | 泰康保险集团股份有限公司 | 对账方法、装置、电子设备及计算机可读介质 |
-
2019
- 2019-09-09 CN CN201910848611.4A patent/CN110598007B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130066775A1 (en) * | 2011-09-06 | 2013-03-14 | Mastercard International Incorporated | Apparatus, method, and computer program product for data cleansing and/or biller scrubbing |
CN109543373A (zh) * | 2014-12-10 | 2019-03-29 | 阿里巴巴集团控股有限公司 | 一种基于用户行为的信息识别方法及装置 |
CN107798109A (zh) * | 2017-11-01 | 2018-03-13 | 深圳市牛鼎丰科技有限公司 | 对账清算的方法、装置、计算机设备及存储介质 |
CN109584031A (zh) * | 2018-11-23 | 2019-04-05 | 泰康保险集团股份有限公司 | 对账方法、装置、电子设备及计算机可读介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112395465A (zh) * | 2020-11-24 | 2021-02-23 | 维沃移动通信有限公司 | 发票数据的处理方法、装置、电子设备及可读存储介质 |
CN113220456A (zh) * | 2021-05-21 | 2021-08-06 | 中国农业银行股份有限公司 | 账单数据的处理方法及相关装置 |
CN117314662A (zh) * | 2023-09-06 | 2023-12-29 | 金网络(北京)数字科技有限公司 | 一种智能对账方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110598007B (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7266638B2 (ja) | 統合ブロックチェーンに基づくデータ転送制御方法及びシステム | |
AU2017297271B2 (en) | System and method for automatic learning of functions | |
WO2020220810A1 (zh) | 数据融合的方法和装置 | |
CN111488363B (zh) | 数据处理方法、装置、电子设备及介质 | |
WO2022134466A1 (zh) | 数据处理方法及相关设备 | |
KR20210003234A (ko) | 분할된 블록체인 네트워크에서 블록체인의 블록을 유지하는 것 | |
CN103238308B (zh) | 传播源标识信息的方法和系统 | |
US20190354968A1 (en) | Utilization Management Method, Utilization Management System, and Node | |
CN110704531B (zh) | 基于区块链的用电客户信用管理方法及系统 | |
CN110598007B (zh) | 账单文件处理方法、装置、介质及电子设备 | |
AU2017296412A1 (en) | System and method for automatically understanding lines of compliance forms through natural language patterns | |
CN111339743B (zh) | 一种账号生成的方法和装置 | |
EP3485444A1 (en) | Method and system for automatically extracting relevant tax terms from forms and instructions | |
CN111931220B (zh) | 区块链网络的共识处理方法、装置、介质及电子设备 | |
CN112070608B (zh) | 信息处理方法、装置、介质及电子设备 | |
CN114567643B (zh) | 跨区块链的数据流转方法、装置及相关设备 | |
CN110705851A (zh) | 交易风险控制方法、装置及电子设备 | |
CN115186304B (zh) | 一种基于区块链的交易数据校验方法和系统 | |
US12021996B2 (en) | Universal blockchain data model | |
CN114219596B (zh) | 一种基于决策树模型的数据处理方法及相关设备 | |
CN111831682A (zh) | 处理公积金业务的方法、装置、设备和计算机可读介质 | |
CN110192212B (zh) | 数字资产平台 | |
CN112015826B (zh) | 基于区块链的智能合约安全性检测方法及相关设备 | |
CN105988998B (zh) | 关系网络构建方法及装置 | |
CN111797590B (zh) | 数据核对方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |