CN105354236B - 一种对账信息生成方法及系统 - Google Patents

一种对账信息生成方法及系统 Download PDF

Info

Publication number
CN105354236B
CN105354236B CN201510649974.7A CN201510649974A CN105354236B CN 105354236 B CN105354236 B CN 105354236B CN 201510649974 A CN201510649974 A CN 201510649974A CN 105354236 B CN105354236 B CN 105354236B
Authority
CN
China
Prior art keywords
information
data
file
line
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510649974.7A
Other languages
English (en)
Other versions
CN105354236A (zh
Inventor
曹奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaran Information Technology Co ltd
Original Assignee
Shanghai Handpal Information Technology Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Handpal Information Technology Service Co ltd filed Critical Shanghai Handpal Information Technology Service Co ltd
Priority to CN201510649974.7A priority Critical patent/CN105354236B/zh
Publication of CN105354236A publication Critical patent/CN105354236A/zh
Application granted granted Critical
Publication of CN105354236B publication Critical patent/CN105354236B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种对账信息生成方法及系统,属于信息处理技术领域;方法包括:选择本次需要抓取对账文件的供应商的信息;根据被选择的供应商,采用信息抓取方式从运营系统中抓取对账文件;根据被选择的供应商,采用信息解析方式对被抓取的对账文件进行解析,以得到初步解析结果;根据被选择的供应商,采用行解析方式对初步解析结果中的每一行数据进行解析得到最终解析结果,以作为对账信息保存。系统包括:存储单元、选择单元、抓取单元、第一解析单元、第二解析单元和保存单元。上述技术方案的有益效果是:识别并保存不同供应商的不同存储格式的对账文件,统一存储方式,降低核对信息时耗费的格式修改时间,提升对账信息的核对效率。

Description

一种对账信息生成方法及系统
技术领域
本发明涉及信息处理技术领域,尤其涉及一种对账信息生成方法及系统。
背景技术
现有技术中,综合性的交易系统在实际运行时可能涉及不同的供应商,各供应商自己的交易清单信息的存储形式也可能是多样化的,并不会有统一的存储标准,同样信息内容的格式也各不相同,因此会造成上传到交易系统进行结算的对账文件(各类交易清单信息以及其他对账信息)各不相同,交易平台在进行供应商的订单信息核对时,需要事先做大量的工作来修改和统一不同对账信息的存储形式,因此增加了对账处理的工作量,降低了对账效率。
发明内容
根据现有技术中存在的问题,现提供一种对账信息生成方法及系统的技术方案,旨在识别并保存不同供应商的不同存储格式的对账文件,统一对账信息的存储方式,从而降低核对对账信息时耗费的格式修改时间,提升对账信息的核对效率。
上述技术方案具体包括:
一种对账信息生成方法,其中,包括一用于保存关联于不同的供应商的对账文件的运营系统;并且
对应每个供应商预设一信息抓取方式,一信息解析方式,以及一行解析方式,还包括:
步骤S1,选择本次需要抓取对账文件的所述供应商的信息;
步骤S2,根据被选择的所述供应商,采用相应的所述信息抓取方式从所述运营系统中抓取所述对账文件;
步骤S3,根据被选择的所述供应商,采用相应的所述信息解析方式对被抓取的所述对账文件进行解析,得到初步解析结果;
步骤S4,根据被选择的所述供应商,采用相应的所述行解析方式对所述初步解析结果中的每一行数据进行解析得到最终解析结果,以作为对账信息保存。
优选的,该对账信息生成方法,其中,所述信息抓取方式包括:
采用FTP文件获取方式抓取所述对账文件;或者
采用HTTP文件获取方式抓取所述对账文件;或者
采用SFTP文件获取方式抓取所述对账文件;或者
采用电子邮件获取方式抓取所述对账文件;或者
采用WebService文件获取方式抓取所述对账文件。
优选的,该对账信息生成方法,其中,所述信息解析方式包括:
于所述对账文件为xls格式时,采用poi方式进行解析;或者
于所述对账文件为电子邮件时,采用htmlparser方式进行解析;或者
于所述对账文件为txt格式时,采用IOUtil方式进行解析。
优选的,该对账信息生成方法,其中,所述步骤S4中,所述初步解析结果中包括多行数据,并以一预设的标识符区分对应所述对账文件中的每一列数据;
于所述初步解析结果的一行内,包括对应所述对账文件中的至少一列数据。
优选的,该对账信息生成方法,其中,所述初步解析结果中包括多行数据;
则所述步骤S4具体包括:
步骤S41,选择所述初步解析结果中的每一行数据;
步骤S42,采用相应的所述行解析方式,分别将所述每一行数据转换成适于保存的所述最终解析结果,并保存为所述对账信息。
优选的,该对账信息生成方法,其中,所述初步解析结果中,以一预设的标识符区分对应所述对账文件中的每一列数据;
则每个所述行解析方式中指定对应的行解析信息,具体包括:
用于指示需要进行行解析的数据所在的列数序号的序号信息;和/或
用于指示进行行解析的数据被保存于数据库中的字段名称的字段信息;和/或
用于指示进行行解析的数据被保存时需要被转换成的数据类型的类型信息;和/或
用于指示进行行解析的数据被保存时的格式化要求的格式化信息;和/或
用于指示进行行解析的数据被保存时的数据转换要求的转换信息;和/或
用于指示进行行解析的数据被保存时的数据取值要求的取值信息;和/或
用于指示进行行解析时,对应的一列数据是否需要被忽略的解析方式信息。
一种对账信息生成系统,其中,连接一用于保存关联于不同的供应商的对账文件的运营系统,并且包括:
存储单元,用于保存预设的对应每个供应商的一信息抓取方式,一信息解析方式,以及一行解析方式;
选择单元,供使用者选择本次对账信息生成过程所需的供应商;
抓取单元,分别连接所述选择单元和所述存储单元,用于根据被选择的所述供应商,采用相应的所述信息抓取方式从所述运营系统中获取所述对账文件;
第一解析单元,分别连接所述抓取单元和所述存储单元,用于根据被选择的所述供应商,采用相应的所述信息解析方式对被抓取的所述对账文件进行解析,以得到并输出初步解析结果;
第二解析单元,分别连接所述第一解析单元和所述存储单元,用于根据被选择的所述供应商,采用相应的所述行解析方式对所述初步解析结果中的每一行数据进行解析,以得到并输出最终解析结果;
保存单元,连接所述第二解析单元,用于将所述最终解析结果作为对账信息保存。
优选的,该对账信息生成系统,其中,所述信息抓取方式包括:
采用FTP文件获取方式抓取所述对账文件;或者
采用HTTP文件获取方式抓取所述对账文件;或者
采用SFTP文件获取方式抓取所述对账文件;或者
采用电子邮件获取方式抓取所述对账文件;或者
采用WebService文件获取方式抓取所述对账文件。
优选的,该对账信息生成系统,其中,所述信息解析方式包括:
于所述对账文件为xls格式时,采用poi方式进行解析;或者
于所述对账文件为电子邮件时,采用htmlparser方式进行解析;或者
于所述对账文件为txt格式时,采用IOUtil方式进行解析。
优选的,该对账信息生成系统,其中,所述第一解析单元生成的所述初步解析结果中包括多行数据,并以一预设的标识符区分对应所述对账文件中的每一列数据;
则于所述初步解析结果的一行内,包括对应所述对账文件中的至少一列数据。
优选的,该对账信息生成系统,其中,所述第一解析单元生成的所述初步解析结果中包括多行数据;
则所述第二解析单元中包括:
选择模块,用于选择本次行解析所针对的每一行数据;
行解析模块,连接所述选择模块,采用相应的所述行解析方式将被选择的每一行数据分别转换成适于保存的所述最终解析结果并输出。
优选的,该对账信息生成系统,其中,所述初步解析结果中,以一预设的标识符区分对应所述对账文件中的每一列数据;
则每个所述行解析方式中指定对应的行解析信息,具体包括:
用于指示需要进行行解析的数据所在的列数序号的序号信息;和/或
用于指示进行行解析的数据被保存于数据库中的字段名称的字段信息;和/或
用于指示进行行解析的数据被保存时需要被转换撑的数据类型的类型信息;和/或
用于指示进行行解析的数据被保存时的格式化要求的格式化信息;和/或
用于指示进行行解析的数据被保存时的数据转换要求的转换信息;和/或
用于指示进行行解析的数据被保存时的数据取值要求的取值信息;和/或
用于指示进行行解析时,对应的一列数据是否需要被忽略的解析方式信息。
上述技术方案的有益效果是:
1)提供一种对账信息生成方法,能够识别并保存不同供应商的不同存储格式的对账文件,统一对账信息的存储方式,从而降低核对对账信息时耗费的格式修改时间,提升对账信息的核对效率;
2)提供一种对账信息生成系统,能够支持实现上述对账信息生成方法。
附图说明
图1是本发明的较佳的实施例中,一种对账信息生成方法的总体流程示意图;
图2是本发明的较佳的实施例中,于图1的基础上,对初步解析结果进行行解析的具体流程示意图;
图3是本发明的较佳的实施例中,一种对账信息生成系统的总体结构示意图;
图4是本发明的较佳的实施例中,于图3的基础上,第二解析单元的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
本发明的较佳的实施例中,基于现有技术中存在的上述问题,现提供一种对账信息生成方法,该方法中,包括一用于保存关联于不同的供应商的对账文件的运营系统,即该运营系统中包括供应商上传的基于不同存储形式的交易清单信息,也就是本发明中所述的对账文件。
则对应每个供应商预设一信息抓取方式,一信息解析方式,以及一行解析方式。
因此,如图1所示,上述对账信息生成方法具体包括:
步骤S1,选择本次需要抓取对账文件的供应商的信息;
步骤S2,根据被选择的供应商,采用相应的信息抓取方式从运营系统中抓取对账文件;
步骤S3,根据被选择的供应商,采用相应的信息解析方式对被抓取的对账文件进行解析,以得到初步解析结果;
步骤S4,根据被选择的供应商,采用相应的行解析方式对初步解析结果中的每一行数据进行解析得到最终解析结果,以作为相应的对账信息保存。
在一个具体实施例中,首先选择本次对账信息生成所对应的供应商,随后可以根据该被选择供应商,依照上述预设的信息确定相对应的信息抓取方式、信息解析方式以及行解析方式。
则该实施例中,首先根据本次指定的信息抓取方式,从上述运营系统中抓取被选择的供应商相关的对账文件,随后根据本次指定的信息解析方式,对被抓取的对账文件进行初步解析,以得到相应的初步解析结果,最后根据本次指定的行解析方式,对上述初步解析结果进行逐行解析,以得到最终解析结果。该最终解析结果即可以作为本次生成的最终的对账信息并保存于指定的对账信息数据库中。
本发明的较佳的实施例中,上述步骤S2中,可以根据需要抓取的对账文件的不同,选择下述中的一种作为信息抓取方式:
采用文件传输协议(File Transfer Protocol,FTP)方式抓取对账文件;
采用超文本传输协议(HyperText Transfer Protocol,HTTP)方式抓取对账文件;
采用安全文件传送协议(Secure File Transfer Protocol,SFTP)方式抓取对账文件;
采用电子邮件获取方式(例如javaMail)抓取对账文件;
采用Web服务(WebService)方式抓取对账文件。
则本发明的较佳的实施例中,由于对应一个供应商传输到运营系统上的对账文件通常是统一格式的,因此对应一个供应商,可以预先设定一种信息抓取方式。
本发明的较佳的实施例中,进一步地,上述步骤S3中,所谓信息解析方式,可以包括下述中的一种:
于对账文件为xls格式时,采用poi方式进行解析;或者
于对账文件为html格式的电子邮件时,采用htmlparser方式进行解析;或者
于对账文件为txt格式时,采用IOUtil方式进行解析。
则本发明的较佳的实施例中,可以根据上述信息抓取方式确定本次抓取对应的对账文件的格式(例如若本次选择的供应商所对应的抓取方式为采用电子邮件获取,则对应的对账信息为html格式的电子邮件),则同样可以根据被选择的信息抓取方式确定本次抓取后进行初步解析时的信息解析方式,因此对应一种信息抓取方式,可以预先设定一种信息解析方式。
上文中所述的poi方式,全称为Apache poi,是Apache软件基金会的开放源码函式库,能够提供可编程接口(Application Programming Interface,API)给Java程序,以对Microsoft Office格式的文件档案进行读取和写入的功能。
上文中所述的htmlparser方式,为一种以java语言写就的html解析库,可以用于提取和高速解析html文件。
上文中所述的IOUtil方式,实际为golang标准库中的一个函数包,能够用于解析txt文件。
本发明的较佳的实施例中,上述步骤S4中,初步解析结果中包括多行数据,并以一预设的标识符区分对应对账文件中的每一列数据,并于初步解析结果的一行内,包括对应对账文件中的至少一列数据。
具体地,本发明的较佳的实施例中,上述标识符可以为“|”,即在一行数据中,每两个相邻的“|”之间的数据对应的为之前的对账文件中的一列数据。
上述一行数据中,包括完整的至少一列数据,即包括完整的相邻两个“|”之间定义的数据。换言之,本发明的较佳的实施例中,不存在相邻的两个“|”之间定义的数据包括在两行不同的数据之中。上述初步解析结果中,每行数据的结尾可以为结束标识符“\r\n”。
本发明的其他实施例中,上述标识符可以为其他符号,例如“,”,只要能够实现将对应原先对账文件中的每一列数据分割开即可。
本发明的较佳的实施例中,上述初步解析结果中的每一行数据,表示对账文件中的一个对账数据,则上述每行数据中的每一列数据,用于表示对应的对账数据中的其中一个属性字段。
则本发明的较佳的实施例中,如图2所示,上述步骤S4具体包括:
步骤S41,选择初步解析结果中的每一行数据;
步骤S42,采用相应的行解析方式,分别将每一行数据转换成适于保存的最终解析结果,并保存为对账信息。
具体地,本发明的较佳的实施例中,首先可以选择上述多行数据中的第一行作为行解析的对象,随后采用上述预设的行解析方式对该被作为解析对象的一行数据进行解析,以得到对应该一行数据的适于保存在数据库中的最终解析结果并保存。
随后,转向下一行数据并继续进行解析,同样得到最终解析结果并保存。
换言之,本发明的较佳的实施例中,上述行解析过程是逐行解析逐行保存的。
本发明的较佳的实施例中,上述步骤S41中,在对一个初步解析结果的第一行进行解析时,首先判断其是否为标题:若是,则跳过该行数据并转向下一行进行解析;若否则直接对该行进行解析。
本发明的较佳的实施例中,对初步解析结果进行行解析进行逐行解析,当读到一行数据为空行时,则表示对于该初步解析结果的行解析结束。
则本发明的较佳的实施例中,上述每个行解析方式中指定对应的行解析信息,则行解析信息中可以包括下述方式中的一种或几种:
用于指示需要进行行解析的数据所在的列数序号的序号信息;和/或
用于指示进行行解析的数据被保存于数据库中的字段名称的字段信息;和/或
用于指示进行行解析的数据被保存时需要被转换撑的数据类型的类型信息;和/或
用于指示进行行解析的数据被保存时的格式化要求的格式化信息;和/或
用于指示进行行解析的数据被保存时的数据转换要求的转换信息;和/或
用于指示进行行解析的数据被保存时的数据取值要求的取值信息;和/或
用于指示进行行解析时,对应的一列数据是否需要被忽略的解析方式信息。
具体地,本发明的一个较佳的实施例中,关联于被选择的信息抓取方式,预设一种行解析方式,即预设一类行解析信息,具体包括:
[{"id=1","propertyName":"属性1"}——场景1
{"id=2","propertyName":"属性2","notEmpty":"false"}——场景2
{"id=3,"propertyName":"属性3","dataType":"String"}——场景3
{"id=4","propertyName":"属性4","dataType":"Integer"}——场景4
{"id=5","propertyName":"属性5","notEmpty":"true"}——场景5
{"id=6","propertyName":"属性6",
"dataType":"BigDecimal","moneyFormat":"2"}——场景6
{"id","propertyName":"属性7","dataType":"Date","sourceFormat":"yyyy-MM-dd HH:mm:ss"}——场景7
{"id","propertyName":"属性8","dataType":"int"}——场景8
{"id","propertyName":"ignore"}]——场景9
上文中所述的场景1-9只是为了便于对不同的场景进行区分,并且利于在下文中进行相应的描述。
则对上述行解析信息的具体说明如下:
id:即上述序号信息,用于表示一行数据中从左至右数的列的位置。
propertyName:即上述字段信息,用于表示需要保存到数据库的字段的名称。
dataType:即上述类型信息,用于表示保存到数据库中时需要转换成的数据类型。
sourceFormat:即上述格式化信息。
moneyFormat:即上述转换信息,取值为1表示该列数据需要进行分转元;取值为2表示该列数据需要进行元转分。
notEmpty:即上述取值信息,用于表示该列数据取值是否可以为空,False不可为空,true可以为空。
Ignore:即上述解析方式信息,若propertyName是Ignore,则表示此字段忽略不落地。
则具体地,上述行解析信息中:
场景1:表示把列1存储到属性1上面。
场景2:表示把列2存储到属性2上面,列2不可以为空。
场景3:表示把列3存储到属性3上面,并且转换成String类型的数据。
场景4:表示把列4存储到属性4上面,并且转换成Integer类型的数据。
场景5:表示把列5存储到属性5上面,列5可以为空。
场景6:表示把列6存储到属性6上面,并且转换成BigDecimal类型的数据,并且扩大100倍,因为要元转分。
场景7:表示把列7存储到属性7上面,并且转换成Date类型的数据,并且格式化成yyyy-MM-dd HH:mm:ss样式。
场景8:表示把列8存储到属性8上面,并且转换成int类型的数据。
场景9:表示把列9忽略。
本发明的较佳的实施例中,依照上述行解析信息对初步解析结果中的每一行数据均进行行解析,从而将初步解析结果转换成适于保存在数据库中的具有统一格式的最终解析结果,并将其作为对账信息保存在数据库中。
综上所述,本发明技术方案中,首先根据不同的信息抓取方式将关联于不同供应商的对账文件从运营系统中抓取出来,并根据抓取方式确定初步的信息解析方式对对账文件进行解析,随后根据对应的行解析方式,将初步解析结果中的每一行信息进行行解析,以将其转换成统一的适于保存在数据库中的存储形式,最终将经过行解析的最终解析结果保存于数据库中,以作为对应该供应商的对账信息。
本发明的较佳的实施例中,基于上述对账信息生成方法,现提供一种对账信息生成系统,该系统连接一用于保存关联于不同的供应商的对账文件的运营系统(附图中未示出)。
则本发明的较佳的实施例中,如图3所示,上述对账信息生成系统具体包括:
存储单元1,用于保存预设的对应每个供应商的信息抓取方式,以及对应每个所述信息抓取方式的信息解析方式,以及对应每个所述信息抓取方式的行解析方式;
选择单元2,供使用者选择本次对账信息生成所需的供应商;
抓取单元3,分别连接选择单元2和存储单元1,用于根据被选择的供应商,采用相应的信息抓取方式从运营系统中获取对账文件;
第一解析单元4,分别连接抓取单元3和存储单元1,用于根据本次对账信息生成所选择的信息抓取方式,采用相应的信息解析方式对被抓取的对账文件进行解析,以得到并输出初步解析结果;
第二解析单元5,分别连接第一解析单元4和存储单元1,用于根据本次对账信息生成所选择的信息抓取方式,采用相应的行解析方式对初步解析结果中的每一行数据进行解析,以得到并输出最终解析结果;
保存单元6,连接第二解析单元5,用于将最终解析结果作为对账信息保存。
本发明的较佳的实施例中,上述信息抓取方式包括:
采用FTP文件获取方式抓取对账文件;或者
采用HTTP文件获取方式抓取对账文件;或者
采用SFTP文件获取方式抓取对账文件;或者
采用电子邮件获取方式抓取对账文件;或者
采用WebService文件获取方式抓取对账文件。
本发明的较佳的实施例中,上述信息解析方式包括:
于对账文件为xls格式时,采用poi方式进行解析;或者
于对账文件为电子邮件时,采用htmlparser方式进行解析;或者
于对账文件为txt格式时,采用IOUtil方式进行解析。
本发明的较佳的实施例中,上述第一解析单元生成的初步解析结果中包括多行数据,并以一预设的标识符区分对应对账文件中的每一列数据;
则于初步解析结果的一行内,包括对应对账文件中的至少一列数据。
则本发明的较佳的实施例中,如图4所示,上述第二解析单元5中包括:
选择模块51,用于选择本次行解析所针对的一行数据;
行解析模块52,连接选择模块51,采用相应的所述行解析方式将被选择的每一行数据分别转换成适于保存的所述最终解析结果并输出。
进一步地,本发明的较佳的实施例中,上述每个行解析方式中指定对应的行解析信息,具体包括下述的一种或几种:
用于指示需要进行行解析的数据所在的列数序号的序号信息;
用于指示进行行解析的数据被保存于数据库中的字段名称的字段信息;
用于指示进行行解析的数据被保存时需要被转换撑的数据类型的类型信息;
用于指示进行行解析的数据被保存时的格式化要求的格式化信息;
用于指示进行行解析的数据被保存时的数据转换要求的转换信息;
用于指示进行行解析的数据被保存时的数据取值要求的取值信息;
用于指示进行行解析时,对应的一列数据是否需要被忽略的解析方式信息。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (8)

1.一种对账信息生成方法,其特征在于,包括一用于保存关联于不同的供应商的对账文件的运营系统;并且
对应每个供应商预设一信息抓取方式,一信息解析方式,以及一行解析方式,还包括:
步骤S1,选择本次需要抓取对账文件的所述供应商的信息;
步骤S2,根据被选择的所述供应商,采用相应的所述信息抓取方式从所述运营系统中抓取所述对账文件;
步骤S3,根据被选择的所述供应商,采用相应的所述信息解析方式对被抓取的所述对账文件进行解析,得到初步解析结果;
步骤S4,根据被选择的所述供应商,采用相应的所述行解析方式对所述初步解析结果中的每一行数据进行解析得到最终解析结果,以作为对账信息保存;
所述初步解析结果中包括多行数据;
则所述步骤S4具体包括:
步骤S41,选择所述初步解析结果中的每一行数据;
步骤S42,采用相应的所述行解析方式,分别将所述每一行数据转换成适于保存的所述最终解析结果,并保存为所述对账信息;
所述步骤S41中,对所述初步解析结果进行逐行解析,并在对所述初步解析结果中的第一行进行解析时,首先判断其是否为标题:
若是,则跳过该行数据并转向下一行进行解析;
若否,则直接对该行数据进行解析;
所述步骤S4中,所述初步解析结果中包括多行数据,并以一预设的标识符区分对应所述对账文件中的每一列数据;
于所述初步解析结果的一行内,包括对应所述对账文件中的至少一列数据。
2.如权利要求1所述的对账信息生成方法,其特征在于,所述信息抓取方式包括:
采用FTP文件获取方式抓取所述对账文件;或者
采用HTTP文件获取方式抓取所述对账文件;或者
采用SFTP文件获取方式抓取所述对账文件;或者
采用电子邮件获取方式抓取所述对账文件;或者
采用WebService文件获取方式抓取所述对账文件。
3.如权利要求1所述的对账信息生成方法,其特征在于,所述信息解析方式包括:
于所述对账文件为xls格式时,采用poi方式进行解析;或者
于所述对账文件为电子邮件时,采用htmlparser方式进行解析;或者
于所述对账文件为txt格式时,采用IOUtil方式进行解析。
4.如权利要求1所述的对账信息生成方法,其特征在于,所述初步解析结果中,以一预设的标识符区分对应所述对账文件中的每一列数据;
则每个所述行解析方式中指定对应的行解析信息,具体包括:
用于指示需要进行行解析的数据所在的列数序号的序号信息;和/或
用于指示进行行解析的数据被保存于数据库中的字段名称的字段信息;和/或
用于指示进行行解析的数据被保存时需要被转换成的数据类型的类型信息;和/或
用于指示进行行解析的数据被保存时的格式化要求的格式化信息;和/或
用于指示进行行解析的数据被保存时的数据转换要求的转换信息;和/或
用于指示进行行解析的数据被保存时的数据取值要求的取值信息;和/或
用于指示进行行解析时,对应的一列数据是否需要被忽略的解析方式信息。
5.一种对账信息生成系统,其特征在于,连接一用于保存关联于不同的供应商的对账文件的运营系统,并且包括:
存储单元,用于保存预设的对应每个供应商的一信息抓取方式,一信息解析方式,以及一行解析方式;
选择单元,供使用者选择本次对账信息生成过程所需的供应商;
抓取单元,分别连接所述选择单元和所述存储单元,用于根据被选择的所述供应商,采用相应的所述信息抓取方式从所述运营系统中获取所述对账文件;
第一解析单元,分别连接所述抓取单元和所述存储单元,用于根据被选择的所述供应商,采用相应的所述信息解析方式对被抓取的所述对账文件进行解析,以得到并输出初步解析结果;
第二解析单元,分别连接所述第一解析单元和所述存储单元,用于根据被选择的所述供应商,采用相应的所述行解析方式对所述初步解析结果中的每一行数据进行解析,以得到并输出最终解析结果;
保存单元,连接所述第二解析单元,用于将所述最终解析结果作为对账信息保存;
所述第一解析单元生成的所述初步解析结果中包括多行数据;
则所述第二解析单元中包括:
选择模块,用于选择本次行解析所针对的每一行数据;
行解析模块,连接所述选择模块,采用相应的所述行解析方式将被选择的每一行数据分别转换成适于保存的所述最终解析结果并输出;
所述行解析模块对所述初步解析结果进行逐行解析,并在对所述初步解析结果中的第一行进行解析时,首先判断其是否为标题:
若是,则跳过该行数据并转向下一行进行解析;
若否,则直接对该行数据进行解析;
所述第一解析单元生成的所述初步解析结果中包括多行数据,并以一预设的标识符区分对应所述对账文件中的每一列数据;
则于所述初步解析结果的一行内,包括对应所述对账文件中的至少一列数据。
6.如权利要求5所述的对账信息生成系统,其特征在于,所述信息抓取方式包括:
采用FTP文件获取方式抓取所述对账文件;或者
采用HTTP文件获取方式抓取所述对账文件;或者
采用SFTP文件获取方式抓取所述对账文件;或者
采用电子邮件获取方式抓取所述对账文件;或者
采用WebService文件获取方式抓取所述对账文件。
7.如权利要求5所述的对账信息生成系统,其特征在于,所述信息解析方式包括:
于所述对账文件为xls格式时,采用poi方式进行解析;或者
于所述对账文件为电子邮件时,采用htmlparser方式进行解析;或者
于所述对账文件为txt格式时,采用IOUtil方式进行解析。
8.如权利要求5所述的对账信息生成系统,其特征在于,所述初步解析结果中,以一预设的标识符区分对应所述对账文件中的每一列数据;
则每个所述行解析方式中指定对应的行解析信息,具体包括:
用于指示需要进行行解析的数据所在的列数序号的序号信息;和/或
用于指示进行行解析的数据被保存于数据库中的字段名称的字段信息;和/或
用于指示进行行解析的数据被保存时需要被转换撑的数据类型的类型信息;和/或
用于指示进行行解析的数据被保存时的格式化要求的格式化信息;和/或
用于指示进行行解析的数据被保存时的数据转换要求的转换信息;和/或
用于指示进行行解析的数据被保存时的数据取值要求的取值信息;和/或
用于指示进行行解析时,对应的一列数据是否需要被忽略的解析方式信息。
CN201510649974.7A 2015-10-09 2015-10-09 一种对账信息生成方法及系统 Active CN105354236B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510649974.7A CN105354236B (zh) 2015-10-09 2015-10-09 一种对账信息生成方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510649974.7A CN105354236B (zh) 2015-10-09 2015-10-09 一种对账信息生成方法及系统

Publications (2)

Publication Number Publication Date
CN105354236A CN105354236A (zh) 2016-02-24
CN105354236B true CN105354236B (zh) 2021-11-30

Family

ID=55330209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510649974.7A Active CN105354236B (zh) 2015-10-09 2015-10-09 一种对账信息生成方法及系统

Country Status (1)

Country Link
CN (1) CN105354236B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3407206B1 (en) 2017-05-22 2021-08-04 Fujitsu Limited Reconciled data storage system
CN107392745B (zh) * 2017-07-14 2021-11-30 上海瀚之友信息技术服务有限公司 一种对帐数据碎片化处理方法
CN109598602B (zh) * 2017-09-28 2022-02-01 平安普惠企业管理有限公司 对账方法、装置、设备及计算机可读存储介质
CN108230136A (zh) * 2018-03-23 2018-06-29 万帮充电设备有限公司 对账方法及装置
CN109034937A (zh) * 2018-06-06 2018-12-18 北京六艺九州科技有限公司 一种订单处理方法和gds系统
CN113591446B (zh) * 2021-06-29 2023-11-03 四川新网银行股份有限公司 一种配置化对账文件生成装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458705A (zh) * 2008-12-29 2009-06-17 阿里巴巴集团控股有限公司 一种不同应用系统间的数据核对方法、装置及系统
CN101582075A (zh) * 2009-06-24 2009-11-18 大连海事大学 Web信息抽取系统
CN102867266A (zh) * 2012-08-27 2013-01-09 北京联时空网络通信设备有限公司 一种讯价方法及装置
CN103399908A (zh) * 2013-07-30 2013-11-20 北京北纬通信科技股份有限公司 业务数据抓取方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8732044B2 (en) * 2006-05-23 2014-05-20 Mastercard International Incorporated Electronic transaction apparatus and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458705A (zh) * 2008-12-29 2009-06-17 阿里巴巴集团控股有限公司 一种不同应用系统间的数据核对方法、装置及系统
CN101582075A (zh) * 2009-06-24 2009-11-18 大连海事大学 Web信息抽取系统
CN102867266A (zh) * 2012-08-27 2013-01-09 北京联时空网络通信设备有限公司 一种讯价方法及装置
CN103399908A (zh) * 2013-07-30 2013-11-20 北京北纬通信科技股份有限公司 业务数据抓取方法和系统

Also Published As

Publication number Publication date
CN105354236A (zh) 2016-02-24

Similar Documents

Publication Publication Date Title
CN105354236B (zh) 一种对账信息生成方法及系统
CN109933752B (zh) 一种导出电子文档的方法和装置
EP1478193A2 (en) Generation of test streams for testing digital TV software
CN107704479B (zh) 文件生成方法和装置
US20010039540A1 (en) Method and structure for dynamic conversion of data
CN102073534B (zh) 数据解析方法及装置
US20090204617A1 (en) Content acquisition system and method of implementation
CN115994251B (zh) 靶弹遥测数据解析装置及解析系统
CN111061696A (zh) 一种交易报文日志的解析方法及装置
CN102203734A (zh) 条件处理方法和设备
US20150121192A1 (en) Debugging errors in display of web pages with partial page refresh
JP2010191864A (ja) タスク自動生成システム、その方法及びそのプログラム
US20080201356A1 (en) System and method of report representation
CN116069407A (zh) 解析swift报文和自动映射到业务交易栏位的方法及系统
CN110750962A (zh) 天气数据转换方法和系统
US20130232108A1 (en) Enhanced Messaging Transaction Performance With Auto-Selected Dual-Tag Fields
US20130159327A1 (en) Apparatus and method for visualizing data
CN111563123B (zh) 一种hive仓库元数据实时同步方法
CN114546780A (zh) 数据监控方法、装置、设备、系统及存储介质
CN109657184B (zh) 富文本处理方法、装置、服务器及计算机可读介质
KR101165201B1 (ko) 컨텐츠 제공 시스템의 변환서버
CN107707328B (zh) 摘要信息传输方法和装置
CN117454881B (zh) 一种基于静态页面的网站动态标签解析方法
CN103314601A (zh) 信息处理设备
JP2008310570A (ja) 電文解析方法、電文解析装置、及び電文解析プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231018

Address after: Room A320, 3rd Floor, No. 1359 Zhonghua Road, Huangpu District, Shanghai, 200010

Patentee after: Shanghai Jiaran Information Technology Co.,Ltd.

Address before: 200003 Fengsheng Building, No. 763 Mengzi Road, Huangpu District, Shanghai

Patentee before: SHANGHAI HANDPAL INFORMATION TECHNOLOGY SERVICE Co.,Ltd.