CN112035406A - 纸质资金数据文件的转换处理方法 - Google Patents
纸质资金数据文件的转换处理方法 Download PDFInfo
- Publication number
- CN112035406A CN112035406A CN202010895704.5A CN202010895704A CN112035406A CN 112035406 A CN112035406 A CN 112035406A CN 202010895704 A CN202010895704 A CN 202010895704A CN 112035406 A CN112035406 A CN 112035406A
- Authority
- CN
- China
- Prior art keywords
- information
- bank
- account
- data file
- row
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 14
- 238000003672 processing method Methods 0.000 title claims abstract description 9
- 238000000034 method Methods 0.000 claims description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 10
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/116—Details of conversion of file system types or formats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及一种纸质资金数据文件的转换处理方法,其包括如下步骤:步骤1、将所述纸质资金数据文件转换为所需的电子文件格式;步骤2、对步骤1中的电子文件格式进行识别处理,以得到电子文件中的资金表格信息;步骤3、查找确认资金表格中的标题数据行,并利用特征字典对标题数据行中的每列的标准字段进行分析,根据每列的标准字段的内容进行分析,以确定资金表格信息中完整的银行帐号区域信息、银行流水区域信息;步骤4、将上述确定的银行帐号区域信息转换保存到账号表中,将上述确定的银行流水区域信息转换保存到流水表中。本发明能有效将资金数据文件转换至所需的数据文件类型,提高数据文件转换的便捷性与可靠性。
Description
技术领域
本发明涉及一种转换处理方法,尤其是一种纸质资金数据文件的转换处理方法。
背景技术
目前,存在资金数据文件转换为标准格式数据文件的需要,其中,资金数据文件主要为xls、xlsx、txt、csv等常规数据格式,此类格式为资金数据的主要载体。
在实际生活中,资金数据的载体并非单一的电子档文件,用户有时不得不受限于特殊因素,从而只能获取到纸质版本的数据文件转化成的PDF等格式文件。尽管能读取并识别PDF文件格式,但在支持读取的前提下,继而支持用户转化为标准格式的数据文件则显得尤为重要,但目前对于纸质仍然无法有效进行读取与识别,即无法转换到标准数据文件。
发明内容
本发明的目的是克服现有技术中存在的不足,提供一种纸质资金数据文件的转换处理方法,其能有效将资金数据文件转换至所需的数据文件类型,提高数据文件转换的便捷性与可靠性。
按照本发明提供的技术方案,一种纸质资金数据文件的转换处理方法,所述转换处理方法包括如下步骤:
步骤1、提供纸质资金数据文件,并将所述纸质资金数据文件转换为所需的电子文件格式;其中,所述纸质资金数据文件内至少包括表格形式的帐号信息和/或表格形式的账单流水信息;
步骤2、对步骤1中的电子文件格式进行识别处理,以得到电子文件中的资金表格信息;
步骤3、查找确认资金表格中的标题数据行,并利用特征字典对标题数据行中的每列的标准字段进行分析,以确定所述标题数据行为帐号信息的标题行或账单信息的标题行,且根据每列的标准字段的内容进行分析,以确定资金表格信息中完整的银行帐号区域信息、银行流水区域信息;
步骤4、将上述确定的银行帐号区域信息转换保存到账号表中,将上述确定的银行流水区域信息转换保存到流水表中。
步骤1中,电子文件格式包括PDF文件格式。
所述帐号表中包括银行卡号,银行账号,姓名,银行卡类型,开户行名称,发卡地区,有效期,证件类型,证件号,开户日期,销户日期的标准字段中的一个或多个。
所述流水表中包括本人卡号,本人账号,本人名称,本人卡号归属行,对方卡号,对方账号,对方名称,对方卡号归属行,对方证件号,交易日期,交易时间,币种,原币金额,人民币金额,借方金额,贷方金额,发生额,收付标记,余额,摘要,交易地点的标准字段中的一个或多个。
将银行流水区域信息转换保存到流水表中时,当且仅当银行流水区域信息中对应一行的银行流水信息同时包含本人卡号、发生额、交易日期的标准字段时,才允许将银行流水区域中所在行的银行流水信息转换保存到流水表中。
将银行账号区域信息转换保存到账号表中时,需要对每行的银行账号信息进行处理,所述处理包括将开户日期、销户日期统一格式。
将银行流水区域信息转换保存到流水表中时,需要对每行的银行账号流水信息进行处理,所述处理包括交易日期、交易时间统一格式,将交易金额、余额统一为数值类型。
本发明的类型:能有效将资金数据文件转换至所需的数据文件类型,提高数据文件转换的便捷性与可靠性。
附图说明
图1为表格形式的帐号信息。
图2为表格形式的账单流水信息。
具体实施方式
下面结合具体附图和实施例对本发明作进一步说明。
为了能有效将资金数据文件转换至所需的数据文件类型,提高数据文件转换的便捷性与可靠性,本发明的转换处理方法包括如下步骤:
步骤1、提供纸质资金数据文件,并将所述纸质资金数据文件转换为所需的电子文件格式;其中,所述纸质资金数据文件内至少包括表格形式的帐号信息和/或表格形式的账单流水信息;
具体地,纸质资金数据文件内至少包括表格形式的帐号信息、或表格形式的账单流水信息,当然,也可以同时包含表格形式的帐号信息与表格形式的账单流水信息,图1中示出了一种情况下的帐号信息,图2示出了一种情况下的账单流水信息。
通过对纸质资金数据文件采用扫描等方式,能转换为所需的电子文件格式,如电子文件格式包括PDF文件格式。当然,电子文件格式还可以为其他常用的格式,具体可以根据需要进行选择处理,此处不再赘述。
步骤2、对步骤1中的电子文件格式进行识别处理,以得到电子文件中的资金表格信息;
本发明实施例中,可采用现有常用的文字、数值识别处理的技术手段能对电子文件格式进行识别,得到资金表格信息,此时,资金表格信息中文字、数值能被选择、处理等常见的文字处理。
步骤3、查找确认资金表格中的标题数据行,并利用特征字典对标题数据行中的每列的标准字段进行分析,以确定所述标题数据行为帐号信息的标题行或账单信息的标题行,且根据每列的标准字段的内容进行分析,以确定资金表格信息中完整的银行帐号区域信息、银行流水区域信息;
具体地,利用特征字典对每列的标准字段进行分析时,即提取资金表格信息中的特征列,所述特征列是指账号信息或账单流水中的标准字段。具体实施时,各种格式的银行账单,因为银行不同或导出账单的机构不同,存在一个字段存在很多种不同命名的可能,如流水中的收付标记列有借贷标识,借贷标志,D/C,收付,收/支,进出标识,存取类型等等很多种叫法,系统根据数据收集和经验积累维护了每个标准字段的很多种对应关系,这个对应关系就是特征字典。
本发明实施例中,所述特征字典可预设或用户自定义确定得到,根据特征字典对资金表格信息中的所有信息进行完全匹配识别或模糊匹配,以识出可能的特征列并且结合列中的数据验证确认为有效的特征列,然后根据识别出特征列所对应的标准字段分析识别出有效的账单流水区域或账号区域,确定区域的标题行,通过倒序分析标题行下的数据区域行,以识别出该标题行对应区域的结束行,从而识别确定出完整的银行账号区域信息、银行流水区域信息。
步骤4、将上述确定的银行帐号区域信息转换保存到账号表中,将上述确定的银行流水区域信息转换保存到流水表中。
本发明实施例中,所述帐号表中包括银行卡号,银行账号,姓名,银行卡类型,开户行名称,发卡地区,有效期,证件类型,证件号,开户日期,销户日期的标准字段中的一个或多个。所述流水表中包括本人卡号,本人账号,本人名称,本人卡号归属行,对方卡号,对方账号,对方名称,对方卡号归属行,对方证件号,交易日期,交易时间,币种,原币金额,人民币金额,借方金额,贷方金额,发生额,收付标记,余额,摘要,交易地点的标准字段中的一个或多个。
具体实施时,将银行流水区域信息转换保存到流水表中时,当且仅当银行流水区域信息中对应一行的银行流水信息同时包含本人卡号、发生额、交易日期的标准字段时,才允许将银行流水区域中所在行的银行流水信息转换保存到流水表中。即需要满足银行流水的条件下,才允许将所在行的银行流水信息转换保存到流水表中,否则认为是无效数据,丢弃或将该行数据保存在特定表中。
进一步地,将银行账号区域信息转换保存到账号表中时,需要对每行的银行账号信息进行处理,所述处理包括所述处理包括将开户日期、销户日期统一格式。将银行流水区域信息转换保存到流水表中时,需要对每行的银行账号流水信息进行处理,所述处理包括交易日期、交易时间统一格式,将交易金额、余额统一为数值类型。
本发明实施例中,将交易日期和交易时间格式为统一的格式,如:yyyy-MM-dd。将金额相关的字段,如交易金额,余额等字段格式化为统一精度的数值类型。
银行流水区域信息中,本人卡号不在帐号区域信息中的数据行,提取该行中的本人卡号和本人名称字段保存到卡号表中并标识为主账号,交易流水表中的对方卡号不在账号表中的数据行,提取该行中的对方卡号和对方名称字段保存到卡号表中并标识为对手账号。
具体实施时,银行账单提取时一般都是提供某些指定人员(被调人)的账单流水,这些被调人的账号被称做为主账号。其他与这些被调人发生交易的账号别称为对手账号。
账号的辅助资料信息是根据银行卡号识别计算卡号对应的银行名称和开户发卡行所在的地区。不同银行的银行卡号会将特定的前几位标识为特定的编码。通过各个银行的编码规则,能够根据规则字典识别出某一银行卡号所属的银行名称和发卡行所在的地区。根据规则字典中的归属行名称编码长度截取指定长度的编码,查表找出所属银行。根据所属银行代码和规则字典中的发卡行所在地区编码起始位置和长度截取指定长度的编码查表找出发卡行所在地区。
步骤4中,在对银行流水区域信息进行处理时,自动分析账单的存取类型,具体地,支持以下几种存储类型:
1)、借贷模式:识别出账单中的借方金额,贷方金额后会将存取类型定义为借贷模式。借方金额表示转出,贷方金额表示转入。
2)、标志列模式:识别出收付标记列后会将存取类型定义为标志列模式。会分析账单流水的前100行,尝试根据发生额和余额来计算出收付标记列中的转入标志和转出标志,如果未能正确识别出转入转出标志则需要用户手工输入。
3)、正负模式:识别的发生额列中存在正负数时,会将存取类型识别为正负模式。正负模式情况下,会将发生额为负数的流水项识别为转出,发生额为正数时识别为转入。
4)、自动计算模式:当无法识别存取类型时,如果能够查找到发生额和余额列则会设为自动计算模式。用户也可以手工选择自动计算模式,可以根据发生额,和余额计算流水的转入转出,此模式需要账单流水的顺序是准确的,否则会导致无法计算,针对账单中部分流水区域无法计算收付标记时,系统会将对应的流水标识为未识别(0)。
5)、收款付款模式:当识别到付款方账号和收款方账号时,将存取类型识别为收付款模式。收付款模式下如果账单文件中没有主账号信息,则需要用户手动正确设置主账号。
在识别区域的存储类型时,会按照借贷模式,收款付款模式,正负模式,标记列模式,自动计算模式的顺序识别账单的存储类型,如果识别失败则需要手工选择。不同的模式会对应不同的标准标题字段,用户在手工分析账单时应该先调整存储类型,再根据存储类型来调整设置标准字段。从而,对某个银行账单的流水表中可能通过某种方式来表示一笔流水是转入还是转出,本发明实施例中,通过上述5种存储类型的比对,能够正确的识别计算流水是转入还是转出。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (7)
1.一种纸质资金数据文件的转换处理方法,其特征是,所述转换处理方法包括如下步骤:
步骤1、提供纸质资金数据文件,并将所述纸质资金数据文件转换为所需的电子文件格式;其中,所述纸质资金数据文件内至少包括表格形式的帐号信息和/或表格形式的账单流水信息;
步骤2、对步骤1中的电子文件格式进行识别处理,以得到电子文件中的资金表格信息;
步骤3、查找确认资金表格中的标题数据行,并利用特征字典对标题数据行中的每列的标准字段进行分析,以确定所述标题数据行为帐号信息的标题行或账单信息的标题行,且根据每列的标准字段的内容进行分析,以确定资金表格信息中完整的银行帐号区域信息、银行流水区域信息;
步骤4、将上述确定的银行帐号区域信息转换保存到账号表中,将上述确定的银行流水区域信息转换保存到流水表中。
2.根据权利要求1所述的纸质资金数据文件的转换处理方法,其特征是:步骤1中,电子文件格式包括PDF文件格式。
3.根据权利要求1所述的纸质资金数据文件的转换处理方法,其特征是:所述帐号表中包括银行卡号,银行账号,姓名,银行卡类型,开户行名称,发卡地区,有效期,证件类型,证件号,开户日期,销户日期的标准字段中的一个或多个。
4.根据权利要求1所述的纸质资金数据文件的转换处理方法,其特征是:所述流水表中包括本人卡号,本人账号,本人名称,本人卡号归属行,对方卡号,对方账号,对方名称,对方卡号归属行,对方证件号,交易日期,交易时间,币种,原币金额,人民币金额,借方金额,贷方金额,发生额,收付标记,余额,摘要,交易地点的标准字段中的一个或多个。
5.根据权利要求4所述的纸质资金数据文件的转换处理方法,其特征是:将银行流水区域信息转换保存到流水表中时,当且仅当银行流水区域信息中对应一行的银行流水信息同时包含本人卡号、发生额、交易日期的标准字段时,才允许将银行流水区域中所在行的银行流水信息转换保存到流水表中。
6.根据权利要求1所述的纸质资金数据文件的转换处理方法,其特征是:将银行账号区域信息转换保存到账号表中时,需要对每行的银行账号信息进行处理,所述处理包括将开户日期、销户日期统一格式。
7.根据权利要求1所述的纸质资金数据文件的转换处理方法,其特征是:将银行流水区域信息转换保存到流水表中时,需要对每行的银行账号流水信息进行处理,所述处理包括交易日期、交易时间统一格式,将交易金额、余额统一为数值类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010895704.5A CN112035406A (zh) | 2020-08-31 | 2020-08-31 | 纸质资金数据文件的转换处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010895704.5A CN112035406A (zh) | 2020-08-31 | 2020-08-31 | 纸质资金数据文件的转换处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112035406A true CN112035406A (zh) | 2020-12-04 |
Family
ID=73587009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010895704.5A Pending CN112035406A (zh) | 2020-08-31 | 2020-08-31 | 纸质资金数据文件的转换处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112035406A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113034266A (zh) * | 2021-03-26 | 2021-06-25 | 上海孚厘科技有限公司 | 一种电子流水数据的管理方法 |
CN116702024A (zh) * | 2023-05-16 | 2023-09-05 | 见知数据科技(上海)有限公司 | 流水数据类型识别方法、装置、计算机设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000030007A2 (en) * | 1998-11-13 | 2000-05-25 | The Chase Manhattan Bank | System and method for multicurrency and multibank processing over a non-secure network |
CN106844567A (zh) * | 2016-12-23 | 2017-06-13 | 《中国医药科学》杂志社有限公司 | 一种纸质稿件转换为网络文本页面的方法及系统 |
CN110597816A (zh) * | 2019-09-17 | 2019-12-20 | 深圳追一科技有限公司 | 数据处理方法、装置、计算机设备和计算机可读存储介质 |
CN110888875A (zh) * | 2019-11-01 | 2020-03-17 | 江苏税软软件科技有限公司 | 一种财务数据标准化采集的方法 |
CN111352907A (zh) * | 2020-03-30 | 2020-06-30 | 见知数据科技(上海)有限公司 | 流水文件解析方法、装置、计算机设备和存储介质 |
-
2020
- 2020-08-31 CN CN202010895704.5A patent/CN112035406A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000030007A2 (en) * | 1998-11-13 | 2000-05-25 | The Chase Manhattan Bank | System and method for multicurrency and multibank processing over a non-secure network |
CN106844567A (zh) * | 2016-12-23 | 2017-06-13 | 《中国医药科学》杂志社有限公司 | 一种纸质稿件转换为网络文本页面的方法及系统 |
CN110597816A (zh) * | 2019-09-17 | 2019-12-20 | 深圳追一科技有限公司 | 数据处理方法、装置、计算机设备和计算机可读存储介质 |
CN110888875A (zh) * | 2019-11-01 | 2020-03-17 | 江苏税软软件科技有限公司 | 一种财务数据标准化采集的方法 |
CN111352907A (zh) * | 2020-03-30 | 2020-06-30 | 见知数据科技(上海)有限公司 | 流水文件解析方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
王恺铭: "浅谈计算机现场审计中将纸质文件转换为电子数据的方法", 广东审计, no. 04, pages 38 - 39 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113034266A (zh) * | 2021-03-26 | 2021-06-25 | 上海孚厘科技有限公司 | 一种电子流水数据的管理方法 |
CN116702024A (zh) * | 2023-05-16 | 2023-09-05 | 见知数据科技(上海)有限公司 | 流水数据类型识别方法、装置、计算机设备和存储介质 |
CN116702024B (zh) * | 2023-05-16 | 2024-05-28 | 见知数据科技(上海)有限公司 | 流水数据类型识别方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7461775B2 (en) | Apparatus and methods for processing misread or miskeyed magnetic indicia | |
US20200294159A1 (en) | Methods, Systems, and Computer Program Products for Processing and/or Preparing a Tax Return and Initiating Certain Financial Transactions | |
US6059185A (en) | Automated system and method for improved check processing | |
US5433483A (en) | Consumer-initiated, automatic classified expenditure bank check system | |
US9195977B2 (en) | System and method for remote deposit system | |
US6336094B1 (en) | Method for electronically recognizing and parsing information contained in a financial statement | |
CA2027948C (en) | Computer aided reconciliation method and apparatus | |
KR100411650B1 (ko) | 전표처리방법 및 시스템 | |
US7337953B2 (en) | Negotiable instrument authentication systems and methods | |
US5801366A (en) | Automated system and method for point-of-sale (POS) check processing | |
US8768802B2 (en) | System and method of matching financial transaction records to merchant records of a merchant profile database | |
KR100368587B1 (ko) | 전표처리 시스템 및 전표파일링 시스템 | |
US10509958B2 (en) | Systems and methods for capturing critical fields from a mobile image of a credit card bill | |
EP0891594A1 (en) | Automated system and method for checkless check transaction | |
CN112035406A (zh) | 纸质资金数据文件的转换处理方法 | |
US20130138541A1 (en) | Methods and systems for managing government issued entitlements | |
US7386509B1 (en) | Apparatus and methods for correlating magnetic indicia data with database records | |
CN113191130A (zh) | 一种银行电子流水数据预处理方法 | |
US20130339244A1 (en) | Methods and systems for check cashing risk analysis | |
US6796488B1 (en) | Automated system and method for check amount encoding at a point-of-sale | |
CN113240508A (zh) | 一种银行流水智能处理系统 | |
CN116738258B (zh) | 基于数据分析的用户关键数据挖掘方法 | |
CN115239500A (zh) | 一种外汇处理方法及系统 | |
CA2146847C (en) | Consumer-initiated, automatic classified expenditure bank check system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |