CN101094026A - 大量数据同步、传输和入数据库的方法 - Google Patents

大量数据同步、传输和入数据库的方法 Download PDF

Info

Publication number
CN101094026A
CN101094026A CN 200610027738 CN200610027738A CN101094026A CN 101094026 A CN101094026 A CN 101094026A CN 200610027738 CN200610027738 CN 200610027738 CN 200610027738 A CN200610027738 A CN 200610027738A CN 101094026 A CN101094026 A CN 101094026A
Authority
CN
China
Prior art keywords
data
file
database
filename
catalogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200610027738
Other languages
English (en)
Inventor
冯谧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUCCESSFULL TELECOM TECHNOLOGY Co Ltd
Original Assignee
SUCCESSFULL TELECOM TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUCCESSFULL TELECOM TECHNOLOGY Co Ltd filed Critical SUCCESSFULL TELECOM TECHNOLOGY Co Ltd
Priority to CN 200610027738 priority Critical patent/CN101094026A/zh
Publication of CN101094026A publication Critical patent/CN101094026A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种大量数据同步、传输和入数据库的方法,该方法包括以下步骤:设定一个文件传输协议(ftp)服务器作为数据的接收地,对每一个数据来源创建一个特定的帐号;在ftp服务器上创建一目录作为数据交互地;将数据生成到一系列文件;数据接收系统定期检查各数据源对应的目录,核查到有新的数据进入系统后,进行数据的分析和入库工作;数据处理完毕后,数据接收系统生成响应结果文件并存放在相应数据源的目录下;数据源在不停进行新数据上传的同时,定期核查响应文件以决定是否重新上传数据。与现有技术相比,本发明可以极高的提高数据同步的速度和效率,改善了传统的实时数据接口方式的性能瓶颈。

Description

大量数据同步、传输和入数据库的方法
技术领域
本发明涉及数据存储方法,尤其涉及一种大量数据同步、传输和入数据库的方法。
背景技术
为移动运营商服务的系统,除了用户量非常巨大外,涉及到的业务数据量也非常巨大;而且移动业务系统往往涉及到多个系统间的数据交互,需要有大量的数据进行同步和传递,很多业务系统中每天需要同步的数据量超过几个GB,处理的业务记录数超过千万甚至上亿。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种大量数据同步、传输和入数据库的方法。
本发明的目的可以通过以下技术方案来实现:大量数据同步、传输和入数据库的方法,其特征在于,该方法包括以下步骤:
1).设定一个文件传输协议(ftp)服务器作为数据的接收地,对每一个数据来源创建一个特定的帐号;
2).对每一个数据源,在ftp服务器上创建有独立读写权限的目录作为数据交互地;
3).用户需要数据同步给本系统时,按照一定的规则将数据生成到一系列文件,按照命名规则将这些文件命名后上传到ftp服务器的指定目录下;
4).数据接收系统按照定期轮询的方式检查各数据源对应的目录,时间间隔可以根据业务需要灵活配置,以不影响数据的实时性为限;
5).接收系统核查到有新的数据进入系统后,进行数据的分析和入库工作;
6).数据处理完毕后,数据接收系统生成响应结果文件并存放在相应数据源的目录下;
7).数据源在不停进行新数据上传的同时,也会定期核查ftp服务器相应目录下的响应文件,并根据响应文件的内容,重新上传数据。
所述的步骤3)中的规则包括:
A).文件名包括以便唯一标识的要素;
B).文件的内容按照行进行组织,每行包含一条数据记录,数据记录中的各字段按照指定顺序排列,字段间以“,”为分隔符分隔;
C).文件传输过程中文件名中增加temp,标识文件正在上传中,暂时不要处理;
D).文件上传结束后对文件更名,删除temp标识,表示文件处理完毕,可以对此文件中的内容进行解析和处理。
所述的文件名包括以便唯一标识的要素,该要素包括:
A).生成时间,按照YYYYMMDDHHMMSS格式(如20060503102035,2006年5月3日10点20分35秒);
B).数据特征:如unsubrecordconfirm表示“退订请求确认”确认;
C).本文件在整个数据集合中的序列号,如01,表示此次数据分布在多个文件中,而本文件为第一个。
所述的步骤6)中响应结果文件会作为数据源核对发送结果的依据。
所述的响应结果文件包括以下部分:
1).文件名命名:文件名包含文件生成的时间戳,用于标识对不同文件的处理结果;
2).文件中包含错误列表,内容包括出错文件名、出错记录详细信息、数据接收方判断的错误原因;
3).文件中包括处理过的文件名列表。
本发明通过自定义的协议完成大容量数据在多个系统间的快速转移,并通过自定义的入库方法保证数据转移完成后能快速的插入数据库。
附图说明
图1为本发明的结构示意图。
具体实施方式
下面结合附图对本发明作进一步说明。
如图1所示,包括以下步骤:
1.设定一个ftp服务器作为数据的接收地,对每一个数据来源创建一个特定的帐号。
2.对每一个数据源,在ftp服务器上创建有独立读写权限的目录作为数据交互地。
3.用户需要数据同步给本系统时,按照一定的规则将数据生成到一系列文件,按照命名规则将这些文件命名后上传到ftp服务器的指定目录下。具体规则可能包括:
1).文件名包括如下要素以便唯一标识:
a)生成时间,按照YYYYMMDDHHMMSS格式(如20060503102035,2006年5月3日10点20分35秒)。
b)数据特征:如unsubrecordconfirm表示“退订请求确认”确认
c)本文件在整个数据集合中的序列号,如01,表示此次数据分布在多个文件中,而本文件为第一个。
2).文件的内容按照行进行组织,每行包含一条数据记录,数据记录中的各字段按照指定顺序排列,字段间以“,”为分隔符分隔。
3).文件传输过程中文件名中增加temp,标识文件正在上传中,暂时不要处理。
4).文件上传结束后对文件更名,删除temp标识,表示文件处理完毕,可以对此文件中的内容进行解析和处理。
4.数据接收系统按照定期轮询的方式检查各数据源对应的目录。时间间隔可以根据业务需要灵活配置,以不影响数据的实时性为限。
5.接收系统核查到有新的数据进入系统后,进行数据的分析和入库工作。具体流程如下:
1).修改文件名,增加going标识,标明数据文件正在处理中。
2).由于数据文件内容是按照指定的格式、顺序排列的,所以可以采用数据库批量入库的脚本进行大批量数据一次入库。
3).数据文件处理完毕后,进行数据备份,将处理完的数据文件从原始目录迁移到备份目录。
4).根据数据文件的处理结果,生成响应文件。对文件中的错误数据记录入响应文件,对正确处理数据的统计结果也同时记录入响应文件。
6.数据处理完毕后,数据接收系统生成响应结果文件并存放在相应数据源的目录下。响应结果文件会作为数据源核对发送结果的依据,会包括如下部分:
1).文件名命名:文件名包含文件生成的时间戳,用于标识对不同文件的处理结果。
2).文件中包含错误列表,内容包括出错文件名、出错记录详细信息、数据接收方判断的错误原因。
3).文件中包括处理过的文件名列表。
7.数据源在不停进行新数据上传的同时,也会定期核查ftp服务器相应目录下的响应文件。并根据响应文件的内容,重新上传数据。

Claims (5)

1.大量数据同步、传输和入数据库的方法,其特征在于,该方法包括以下步骤:
1).设定一个文件传输协议(ftp)服务器作为数据的接收地,对每一个数据来源创建一个特定的帐号;
2).对每一个数据源,在ftp服务器上创建有独立读写权限的目录作为数据交互地;
3).用户需要数据同步给本系统时,按照一定的规则将数据生成到一系列文件,按照命名规则将这些文件命名后上传到ftp服务器的指定目录下;
4).数据接收系统按照定期轮询的方式检查各数据源对应的目录,时间间隔可以根据业务需要灵活配置,以不影响数据的实时性为限;
5).接收系统核查到有新的数据进入系统后,进行数据的分析和入库工作;
6).数据处理完毕后,数据接收系统生成响应结果文件并存放在相应数据源的目录下;
7).数据源在不停进行新数据上传的同时,也会定期核查ftp服务器相应目录下的响应文件,并根据响应文件的内容,重新上传数据。
2.根据权利要求1所述的大量数据同步、传输和入数据库的方法,其特征在于,所述的步骤3)中的规则包括:
A).文件名包括以便唯一标识的要素;
B).文件的内容按照行进行组织,每行包含一条数据记录,数据记录中的各字段按照指定顺序排列,字段间以“,”为分隔符分隔;
C).文件传输过程中文件名中增加temp,标识文件正在上传中,暂时不要处理;
D).文件上传结束后对文件更名,删除temp标识,表示文件处理完毕,可以对此文件中的内容进行解析和处理。
3.根据权利要求2所述的大量数据同步、传输和入数据库的方法,其特征在于,所述的文件名包括以便唯一标识的要素,该要素包括:
A).生成时间,按照YYYYMMDDHHMMSS格式(如20060503102035,2006年5月3日10点20分35秒);
B).数据特征:如unsubrecordconfirm表示“退订请求确认”确认;
C).本文件在整个数据集合中的序列号,如_01,表示此次数据分布在多个文件中,而本文件为第一个。
4.根据权利要求1所述的大量数据同步、传输和入数据库的方法,其特征在于,所述的步骤6)中响应结果文件会作为数据源核对发送结果的依据。
5.根据权利要求1或4所述的大量数据同步、传输和入数据库的方法,其特征在于,所述的响应结果文件包括以下部分:
1).文件名命名:文件名包含文件生成的时间戳,用于标识对不同文件的处理结果;
2).文件中包含错误列表,内容包括出错文件名、出错记录详细信息、数据接收方判断的错误原因;
3).文件中包括处理过的文件名列表。
CN 200610027738 2006-06-19 2006-06-19 大量数据同步、传输和入数据库的方法 Pending CN101094026A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610027738 CN101094026A (zh) 2006-06-19 2006-06-19 大量数据同步、传输和入数据库的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610027738 CN101094026A (zh) 2006-06-19 2006-06-19 大量数据同步、传输和入数据库的方法

Publications (1)

Publication Number Publication Date
CN101094026A true CN101094026A (zh) 2007-12-26

Family

ID=38992086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610027738 Pending CN101094026A (zh) 2006-06-19 2006-06-19 大量数据同步、传输和入数据库的方法

Country Status (1)

Country Link
CN (1) CN101094026A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826035A (zh) * 2010-04-07 2010-09-08 深圳创维-Rgb电子有限公司 一种应用程序间的通讯方法
CN101833580A (zh) * 2010-05-12 2010-09-15 中兴通讯股份有限公司 一种报表查询系统及其采集数据的方法和装置
CN101834873A (zh) * 2010-05-19 2010-09-15 深圳市科脉技术有限公司 一种商业数据库的数据传输方法
WO2011006334A1 (zh) * 2009-07-14 2011-01-20 中兴通讯股份有限公司 一种短消息业务数据处理方法及系统
CN101980187A (zh) * 2010-10-13 2011-02-23 中兴通讯股份有限公司 数据入库方法和装置
CN101452487B (zh) * 2008-12-31 2011-03-16 中国建设银行股份有限公司 一种数据加载的方法、系统及数据加载装置
WO2012119539A1 (zh) * 2011-03-07 2012-09-13 联想(北京)有限公司 文件同步方法、文件同步装置及电子设备
CN102946435A (zh) * 2012-11-22 2013-02-27 东莞宇龙通信科技有限公司 文件的同步方法及装置
CN103220343A (zh) * 2013-03-29 2013-07-24 南京联创科技集团股份有限公司 大数据多系统转发方法
CN103455599A (zh) * 2013-09-03 2013-12-18 北京网秦天下科技有限公司 用于数据同步的方法、设备和系统
CN103618781A (zh) * 2013-11-22 2014-03-05 北京海泰方圆科技有限公司 业务系统与电子文件管理系统的文件传输方法
CN106408270A (zh) * 2016-10-08 2017-02-15 北京恒华伟业科技股份有限公司 一种业务功能可配置附件的管理方法和装置
CN109639708A (zh) * 2018-12-28 2019-04-16 东莞见达信息技术有限公司 深度学习数据访问控制方法及装置
CN110505307A (zh) * 2019-08-30 2019-11-26 公安部交通管理科学研究所 一种网间交通流数据的交换方法及系统
CN111277425A (zh) * 2018-12-05 2020-06-12 中国移动通信集团湖南有限公司 集中化数据传输管理的装置
CN111865969A (zh) * 2020-07-17 2020-10-30 江苏润易联信息技术有限公司 适于金融信息的安全传输方法和系统
CN115442361A (zh) * 2022-08-30 2022-12-06 重庆长安汽车股份有限公司 一种大批量文件的同步传输方法、系统、设备及介质
CN115442361B (zh) * 2022-08-30 2024-06-04 重庆长安汽车股份有限公司 一种大批量文件的同步传输方法、系统、设备及介质

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452487B (zh) * 2008-12-31 2011-03-16 中国建设银行股份有限公司 一种数据加载的方法、系统及数据加载装置
WO2011006334A1 (zh) * 2009-07-14 2011-01-20 中兴通讯股份有限公司 一种短消息业务数据处理方法及系统
CN101826035A (zh) * 2010-04-07 2010-09-08 深圳创维-Rgb电子有限公司 一种应用程序间的通讯方法
CN101833580A (zh) * 2010-05-12 2010-09-15 中兴通讯股份有限公司 一种报表查询系统及其采集数据的方法和装置
CN101834873A (zh) * 2010-05-19 2010-09-15 深圳市科脉技术有限公司 一种商业数据库的数据传输方法
CN101834873B (zh) * 2010-05-19 2012-12-05 深圳市科脉技术有限公司 一种商业数据库的数据传输方法
CN101980187A (zh) * 2010-10-13 2011-02-23 中兴通讯股份有限公司 数据入库方法和装置
WO2012119539A1 (zh) * 2011-03-07 2012-09-13 联想(北京)有限公司 文件同步方法、文件同步装置及电子设备
US9460103B2 (en) 2011-03-07 2016-10-04 Beijing Lenovo Software Ltd. File synchronization method, files synchronization apparatus and electronic device
CN102946435A (zh) * 2012-11-22 2013-02-27 东莞宇龙通信科技有限公司 文件的同步方法及装置
CN103220343B (zh) * 2013-03-29 2016-07-06 南京联创科技集团股份有限公司 大数据多系统转发方法
CN103220343A (zh) * 2013-03-29 2013-07-24 南京联创科技集团股份有限公司 大数据多系统转发方法
CN103455599A (zh) * 2013-09-03 2013-12-18 北京网秦天下科技有限公司 用于数据同步的方法、设备和系统
CN103618781B (zh) * 2013-11-22 2017-09-15 北京海泰方圆科技股份有限公司 业务系统与电子文件管理系统的文件传输方法
CN103618781A (zh) * 2013-11-22 2014-03-05 北京海泰方圆科技有限公司 业务系统与电子文件管理系统的文件传输方法
CN106408270A (zh) * 2016-10-08 2017-02-15 北京恒华伟业科技股份有限公司 一种业务功能可配置附件的管理方法和装置
CN111277425A (zh) * 2018-12-05 2020-06-12 中国移动通信集团湖南有限公司 集中化数据传输管理的装置
CN111277425B (zh) * 2018-12-05 2023-04-07 中国移动通信集团湖南有限公司 集中化数据传输管理的装置
CN109639708B (zh) * 2018-12-28 2022-03-18 东莞见达信息技术有限公司 深度学习数据访问控制方法及装置
CN109639708A (zh) * 2018-12-28 2019-04-16 东莞见达信息技术有限公司 深度学习数据访问控制方法及装置
CN110505307A (zh) * 2019-08-30 2019-11-26 公安部交通管理科学研究所 一种网间交通流数据的交换方法及系统
CN110505307B (zh) * 2019-08-30 2022-04-26 公安部交通管理科学研究所 一种网间交通流数据的交换方法及系统
CN111865969A (zh) * 2020-07-17 2020-10-30 江苏润易联信息技术有限公司 适于金融信息的安全传输方法和系统
CN115442361A (zh) * 2022-08-30 2022-12-06 重庆长安汽车股份有限公司 一种大批量文件的同步传输方法、系统、设备及介质
CN115442361B (zh) * 2022-08-30 2024-06-04 重庆长安汽车股份有限公司 一种大批量文件的同步传输方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
CN101094026A (zh) 大量数据同步、传输和入数据库的方法
CN107729366B (zh) 一种普适多源异构大规模数据同步系统
CN103324552B (zh) 两阶段单实例去重数据备份方法
US8762325B2 (en) Processing of files for electronic content management
CN104317800A (zh) 一种海量智能用电数据混合存储系统及方法
CN101004744A (zh) 远程多点文件索引同步系统及方法
CN103209087A (zh) 分布式日志统计处理方法和系统
CN102736923B (zh) 软件定制安装方法及系统
CN101964795A (zh) 日志采集系统、日志采集方法和日志回收服务器
CN103401933B (zh) 一种资源信息和对应资源文件批量上传的方法和系统
CN102984325A (zh) 一种手机测试数据整合系统及方法
CN103501241A (zh) 垃圾文件清理方法、装置和系统
CN103078899A (zh) 一种同步企业通讯录的方法及装置
CN102609502A (zh) 基于日志方式的移动终端桌面搜索方法及系统
CN114416638A (zh) 一种电子文件自动归档方法及系统
CN102779160A (zh) 海量数据信息索引系统和索引构建方法
CN100357943C (zh) 一种检查机群文件系统中垃圾文件的方法
CN202268912U (zh) 基于云计算架构的数据管理系统
CN102594874A (zh) 一种同步处理方法和装置
CN105095224A (zh) 一种在移动通信网络中进行olap分析的方法、装置和系统
CN104113594A (zh) 一种基于js上传组件的文件上传方法及系统
CN101697600A (zh) 一种彩铃数据自动分析处理方法和装置
CN104679821A (zh) 数据访问处理方法和装置
CN101404648A (zh) 一种媒体终端及媒体终端的数据同步方法和系统
CN111241044B (zh) 搭建异构数据库的方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20071226