CN114722003A - 中心化数据采集方法、装置、设备及存储介质 - Google Patents

中心化数据采集方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114722003A
CN114722003A CN202210303139.8A CN202210303139A CN114722003A CN 114722003 A CN114722003 A CN 114722003A CN 202210303139 A CN202210303139 A CN 202210303139A CN 114722003 A CN114722003 A CN 114722003A
Authority
CN
China
Prior art keywords
file
shared
list
transmitted
files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210303139.8A
Other languages
English (en)
Inventor
郝伟
沈传宝
刘加瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Huayun'an Technology Co ltd
Original Assignee
Anhui Huayun'an Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Huayun'an Technology Co ltd filed Critical Anhui Huayun'an Technology Co ltd
Priority to CN202210303139.8A priority Critical patent/CN114722003A/zh
Publication of CN114722003A publication Critical patent/CN114722003A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/176Support for shared access to files; File sharing support
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施例提供了一种中心化数据采集方法、装置、设备及存储介质。所述方法包括读取映射列表,其中,所述映射列表包括一个或多个文件服务器的IP地址和对应文件服务器的共享文件夹的路径信息;根据所述映射列表和历史列表确定文件服务器的共享文件夹中未传输过的共享文件,生成待传输文件列表,其中,所述历史列表中包括已上传成功的共享文件的上传时间、对应的文件服务器的IP地址、路径信息和文件信息;根据所述待传输文件列表,从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件,并将读取的共享文件上传到云存储端。以此方式,可以有效地提高数据的传输性能和安全可用性。

Description

中心化数据采集方法、装置、设备及存储介质
技术领域
本公开涉及数据采集领域,尤其涉及中心化数据采集技术领域。
背景技术
在大数据环境下的数据文件的传输,通常都是基于分布式的传输方式,而分布式的传输方式直接与云存储同步,效率和可用性都不高,一旦某台主机出现问题,则会导致此主机的数据文件无法传输,需要人工对此主机进行处理后,才可以恢复正常传输,并且需要在每个节点进行部署,可靠性低,且每台机器都需要相应的读写权限,因此,现有的分布式传输方式无法满足要求。
发明内容
本公开提供了一种中心化数据采集的方法、装置、设备以及存储介质。
根据本公开的第一方面,提供了一种中心化数据采集方法。该方法包括:读取映射列表,其中,所述映射列表包括一个或多个文件服务器的IP地址和对应文件服务器的共享文件夹的路径信息;根据所述映射列表和历史列表确定文件服务器的共享文件夹中未传输过的共享文件,生成待传输文件列表,其中,所述历史列表中包括已上传成功的共享文件的上传时间、对应的文件服务器的IP地址、路径信息和文件信息;根据所述待传输文件列表,从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件,并将读取的共享文件上传到云存储端。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据所述映射列表和历史列表确定所述共享文件夹中未传输过的共享文件,生成待传输文件列表,包括:
根据所述文件服务器的IP地址和对应的文件服务器中共享文件夹的路径信息,确定对应的文件服务器的共享文件夹中共享文件的文件信息;
将所述共享文件夹中共享文件的文件信息与所述历史列表中记录的已上传成功的共享文件的文件信息进行对比,确定未传输过的共享文件,生成待传输文件列表。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,映射列表中还包括共享文件的文件信息;根据所述映射列表和历史列表确定所述共享文件夹中未传输过的共享文件,生成待传输文件列表,包括:
将所述映射列表中的共享文件的文件信息与所述历史列表中记录的已上传成功的共享文件的文件信息进行对比,确定未传输过的共享文件,生成待传输文件列表。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据所述待传输文件列表,从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件,包括:
根据所述待传输文件列表,以多线程的方式从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件;
所述将读取的共享文件上传到云存储端,包括:
以多线程的方式将读取的共享文件上传到云存储端。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件,并将读取的共享文件上传到云存储端时,所述方法还包括:
获取文件读取状态和/或文件上传状态;当文件读取状态和/或文件上传状态满足对应的告警条件时,生成对应的告警提示信息。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,映射列表和待传输文件列表中的共享文件根据创建日期排序。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,将所述读取的待传输文件列表中的文件数据多线程上传到云存储端之后,所述方法还包括:接收云存储端发送的文件传输成功的反馈;根据所述反馈更新所述历史列表。
根据本公开的第二方面,提供了一种中心化数据采集装置。该装置包括:
读取模块,用于读取映射列表,其中,所述映射列表包括一个或多个文件服务器的IP地址和对应文件服务器的共享文件夹的路径信息;
对比模块,用于根据所述映射列表和历史列表确定文件服务器的共享文件夹中未传输过的共享文件,生成待传输文件列表,其中,所述历史列表中包括已上传成功的共享文件的上传时间、对应的文件服务器的IP地址、路径信息和文件信息;
所述读取模块,还用于根据所述待传输文件列表,从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件;
上传模块,用于将读取的共享文件上传到云存储端。
根据本公开的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
根据本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本公开的第一方面和/或第二发面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。附图用于更好地理解本方案,不构成对本公开的限定在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示出了能够在其中实现本公开的实施例的示例性运行环境示意图;
图2示出了根据本公开实施例的中心化数据采集方法的流程图;
图3示出了根据本公开的实施例的中心化数据采集装置的框图;
图4示出了能够实施本公开的实施例的示例性电子设备的方框图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
现有的基于分布式的传输方式直接与云存储同步,效率和可用性都不高,一旦某台主机出现问题,则会导致此主机的数据文件无法传输,并且需要在每个节点进行部署,可靠性低,无法满足要求。
针对上述问题,本公开提供了一种中心化数据采集的方法、装置、设备以及存储介质,读取映射列表,其中,所述映射列表包括一个或多个文件服务器的IP地址和对应文件服务器的共享文件夹的路径信息;根据所述映射列表和历史列表确定文件服务器的共享文件夹中未传输过的共享文件,生成待传输文件列表,其中,所述历史列表中包括已上传成功的共享文件的上传时间、对应的文件服务器的IP地址、路径信息和文件信息;根据所述待传输文件列表,从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件,并将读取的共享文件上传到云存储端,在一台主机上实现了数据的收集、汇总和上传,有效地提高了数据的传输性能和安全可用性。
图1示出了能够在其中实现本公开的实施例的示例性运行环境100的示意图。
如图1所示,在运行环境中包括同步端程序汇总服务器、多个共享文件夹服务器以及云存储端,同步端程序汇总服务器中的同步端程序(syn),可以读取多个共享服务器文件夹中的共享文件数据,并将读取的各共享服务器的共享文件数据上传到云存储端进行存储,在同步端程序汇总服务器上可以实现多台共享服务器的共享文件数据的采集、汇总和上传,有效地提高了数据的传输性能和安全可用性。
在一些实施例中,同步端程序汇总服务器采用双机热备的方式,可用性高,一旦出现问题,可以以双机热备的方式立即恢复。
图2示出了根据本公开实施例的中心化数据采集方法的流程图。
步骤S210,读取映射列表,其中,所述映射列表包括一个或多个文件服务器的IP地址和对应文件服务器的共享文件夹的路径信息。
在一些实施例中,一个或多个服务器的IP地址指的是各服务器对应的互联网协议地址,如“192.168.1.1”,对应文件服务器的共享文件夹的路径信息为共享文件的路径表示,如“\\192.168.1.1\文件夹名称\\文件名.后缀名”。
步骤S220,根据所述映射列表和历史列表确定文件服务器的共享文件夹中未传输过的共享文件,生成待传输文件列表,其中,所述历史列表中包括已上传成功的共享文件的上传时间、对应的文件服务器的IP地址、路径信息和文件信息。
在一些实施例中,可以采用后续扫描的方式确定文件服务器的共享文件夹中未传输过的共享文件,具体地,可以根据映射列表中文件服务器的IP地址和对应的文件服务器中共享文件夹的路径信息,确定对应的文件服务器的共享文件夹中共享文件的文件信息;
再将共享文件夹中共享文件的文件信息与历史列表中记录的已上传成功的共享文件的文件信息进行对比,确定未传输过的共享文件,生成待传输文件列表。
在一些实施例中,还可以采取事先扫描的方式确定文件服务器的共享文件夹中未传输过的共享文件,具体地,事先在映射列表中扫描文件列表,确定共享文件的文件信息,根据共享文件的文件信息与历史列表中记录的已上传成功的共享文件的文件信息进行对比,确定未传输过的共享文件,生成待传输文件列表。
在一些实施例中,共享文件的文件信息可以包括共享文件名、共享文件属性和共享文件大小等信息,为了进一步的提高文件信息对比的效率,可以直接将共享文件夹中的共享文件名与历史列表中记录的已上传成功的共享文件名进行对比,确定出未传输过的共享文件,生成待传输文件列表。
在一些实施例中,本申请采用的增量式管理模式,为了确定出共享文件是新增文件,可以将映射列表中的共享文件根据创建日期排序。
进一步地,所生成的待传输文件列表中的共享文件也可以根据创建日期排序。
步骤S230,根据所述待传输文件列表,从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件,并将读取的共享文件上传到云存储端。
在一些实施例中,根据待传输文件列表,可以以单线程或多线程的方式从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件。
在一些实施例中,可以以单线程或多线程的方式将读取的共享文件上传到云存储端。
在一些实施例中,为了监管多线程的文件读取状态或文件上传状态,可以设置守护程序获取文件读取状态和/或文件上传状态,当文件读取状态和/或文件上传状态满足对应的告警条件时,生成对应的告警提示信息,提醒工作人员及时查看对应的共享服务器的状态。
在一些实施例中,文件读取状态包括在读状态、等待状态、中断状态、离线状态等,所满足的告警条件可以为中断状态、离线状态,文件上传状态包括正在上传、等待上传、上传中断等,所满足的告警条件可以为上传中断状态。
在一些实施例中,在将读取的文件数据多线程上传到云存储端之后,同步程序汇总服务器接收云存储端发送的文件传输成功的反馈,根据所述反馈获取已传输成功的共享文件的上传时间、对应的文件服务器的IP地址、路径信息和文件信息,并将获取到的信息更新到历史列表中。
根据本公开的实施例,实现了以下技术效果:
采用基于多线程的文件传输机制,在一台主机上实现了数据的收集、汇总和上传。虽然对机器性能要求很高,但是可用性高。一旦出现问题,可以以双机热备的方式立即恢复,有效地提高了数据的传输性能和安全可用性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为依据本公开,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本公开所必须的。
以上是关于方法实施例的介绍,以下通过装置实施例,对本公开所述方案进行进一步说明。
图3示出了根据本公开的实施例的中心化数据采集装置300的方框图,如图3所示,装置300包括:
读取模块310,用于读取映射列表,其中,所述映射列表包括一个或多个文件服务器的IP地址和对应文件服务器的共享文件夹的路径信息。
对比模块320,用于根据所述映射列表和历史列表确定文件服务器的共享文件夹中未传输过的共享文件,生成待传输文件列表,其中,所述历史列表中包括已上传成功的共享文件的上传时间、对应的文件服务器的IP地址、路径信息和文件信息。
所述读取模块310,还用于根据所述待传输文件列表,从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件;
上传模块330,用于将读取的共享文件上传到云存储端。
在一些实施例中,所述读取模块310具体用于:
以多线程的方式从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件。
在一些实施例中,所述对比模块320具体用于:
根据文件服务器的IP地址和对应的文件服务器中共享文件夹的路径信息,确定对应的文件服务器的共享文件夹中共享文件的文件信息;
将共享文件夹中共享文件的文件信息与历史列表中记录的已上传成功的共享文件的文件信息进行对比,确定未传输过的共享文件,生成待传输文件列表。
在一些实施例中,所述对比模块320还具体用于:
映射列表中还包括共享文件的文件信息;将映射列表中的共享文件的文件信息与历史列表中记录的已上传成功的共享文件的文件信息进行对比,确定未传输过的共享文件,生成待传输文件列表。
在一些实施例中,所述上传模块330具体用于:
以多线程的方式将读取的共享文件上传到云存储端。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
可以理解的是,图3所示的中心化数据采集装置300中的各个模块/单元具有实现本公开实施例提供的中心化数据采集方法200中的各个步骤的功能,并能达到其相应的技术效果,为了简洁,在此不再赘述。
图4示出了一种可以用来实施本公开的实施例的电子设备的结构图。电子设备400旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备400还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图4所示,电子设备400可以包括计算单元401,其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序,来执行各种适当的动作和处理。在RAM403中,还可存储电子设备400操作所需的各种程序和数据。计算单元401、ROM402以及RAM403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
电子设备400中的多个部件连接至I/O接口405,包括:输入单元406,例如键盘、鼠标等;输出单元407,例如各种类型的显示器、扬声器等;存储单元408,例如磁盘、光盘等;以及通信单元409,例如网卡、调制解调器、无线通信收发机等。通信单元409允许电子设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理,例如方法200。例如,在一些实施例中,方法200可被实现为计算机程序产品,包括计算机程序,其被有形地包含于计算机可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由ROM402和/或通信单元409而被载入和/或安装到设备400上。当计算机程序加载到RAM403并由计算单元401执行时,可以执行上文描述的方法200的一个或多个步骤。备选地,在其他实施例中,计算单元401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法200。
本文中以上描述的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,计算机可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。计算机可读介质可以是计算机可读信号介质或计算机可读储存介质。计算机可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。计算机可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
需要注意的是,本公开还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行方法200,并达到本公开实施例执行其方法达到的相应技术效果,为简洁描述,在此不再赘述。
另外,本公开还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,计算机程序在被处理器执行时实现方法200。
为了提供与用户的交互,可以在计算机上实施以上描述的实施例,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将以上描述的实施例实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (10)

1.一种中心化数据采集方法,其特征在于,所述方法包括:
读取映射列表,其中,所述映射列表包括一个或多个文件服务器的IP地址和对应文件服务器的共享文件夹的路径信息;
根据所述映射列表和历史列表确定文件服务器的共享文件夹中未传输过的共享文件,生成待传输文件列表,其中,所述历史列表中包括已上传成功的共享文件的上传时间、对应的文件服务器的IP地址、路径信息和文件信息;
根据所述待传输文件列表,从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件,并将读取的共享文件上传到云存储端。
2.根据权利要求1所述的方法,其特征在于,所述根据所述映射列表和历史列表确定所述共享文件夹中未传输过的共享文件,生成待传输文件列表,包括:
根据所述文件服务器的IP地址和对应的文件服务器中共享文件夹的路径信息,确定对应的文件服务器的共享文件夹中共享文件的文件信息;
将所述共享文件夹中共享文件的文件信息与所述历史列表中记录的已上传成功的共享文件的文件信息进行对比,确定未传输过的共享文件,生成待传输文件列表。
3.根据权利要求1所述的方法,其特征在于,所述映射列表中还包括共享文件的文件信息;所述根据所述映射列表和历史列表确定所述共享文件夹中未传输过的共享文件,生成待传输文件列表,包括:
将所述映射列表中的共享文件的文件信息与所述历史列表中记录的已上传成功的共享文件的文件信息进行对比,确定未传输过的共享文件,生成待传输文件列表。
4.根据权利要求1所述的方法,其特征在于,所述根据所述待传输文件列表,从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件,包括:
根据所述待传输文件列表,以多线程的方式从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件;
所述将读取的共享文件上传到云存储端,包括:
以多线程的方式将读取的共享文件上传到云存储端。
5.根据权利要求1所述的方法,其特征在于,所述从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件,并将读取的共享文件上传到云存储端时,所述方法还包括:
获取文件读取状态和/或文件上传状态;当文件读取状态和/或文件上传状态满足对应的告警条件时,生成对应的告警提示信息。
6.根据权利要求2或3所述的方法,其特征在于,所述映射列表和待传输文件列表中的共享文件根据创建日期排序。
7.根据权利要求1所述的方法,其特征在于,将所述读取的待传输文件列表中的文件数据多线程上传到云存储端之后,所述方法还包括:
接收云存储端发送的文件传输成功的反馈;
根据所述反馈更新所述历史列表。
8.一种中心化数据采集装置,包括:
读取模块,用于读取映射列表,其中,所述映射列表包括一个或多个文件服务器的IP地址和对应文件服务器的共享文件夹的路径信息;
对比模块,用于根据所述映射列表和历史列表确定文件服务器的共享文件夹中未传输过的共享文件,生成待传输文件列表,其中,所述历史列表中包括已上传成功的共享文件的上传时间、对应的文件服务器的IP地址、路径信息和文件信息;
所述读取模块,还用于根据所述待传输文件列表,从对应的文件服务器的共享文件夹中读取所述未传输过的共享文件;
上传模块,用于将读取的共享文件上传到云存储端。
9.一种电子设备,包括:包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~7中任一项所述的方法。
CN202210303139.8A 2022-03-24 2022-03-24 中心化数据采集方法、装置、设备及存储介质 Pending CN114722003A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210303139.8A CN114722003A (zh) 2022-03-24 2022-03-24 中心化数据采集方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210303139.8A CN114722003A (zh) 2022-03-24 2022-03-24 中心化数据采集方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114722003A true CN114722003A (zh) 2022-07-08

Family

ID=82240271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210303139.8A Pending CN114722003A (zh) 2022-03-24 2022-03-24 中心化数据采集方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114722003A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116668436A (zh) * 2023-08-02 2023-08-29 安徽华云安科技有限公司 基于smb协议的分布式数据采集方法和系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116668436A (zh) * 2023-08-02 2023-08-29 安徽华云安科技有限公司 基于smb协议的分布式数据采集方法和系统

Similar Documents

Publication Publication Date Title
CN110019873B (zh) 人脸数据处理方法、装置及设备
CN113364877B (zh) 数据处理方法、装置、电子设备和介质
CN113961510B (zh) 一种文件处理方法、装置、设备及存储介质
CN114722003A (zh) 中心化数据采集方法、装置、设备及存储介质
CN114185734A (zh) 一种监控集群的方法、装置及电子设备
CN113608765A (zh) 数据处理方法、装置、设备以及存储介质
CN114389969A (zh) 客户端的测试方法、装置、电子设备和存储介质
CN111767126A (zh) 分布式批量处理的系统和方法
CN114070889B (zh) 配置方法、流量转发方法、设备、存储介质及程序产品
CN113676531B (zh) 电商流量削峰方法、装置、电子设备及可读存储介质
CN115543416A (zh) 一种配置更新方法、装置、电子设备及存储介质
CN112860796B (zh) 用于同步数据的方法、装置、设备以及存储介质
JP2016009225A (ja) データベース管理装置、データベース管理方法、プログラムおよび記録媒体
CN114064803A (zh) 一种数据同步方法和装置
CN113760469A (zh) 分布式计算的方法和装置
CN113641688A (zh) 节点更新方法、相关装置及计算机程序产品
CN113742376A (zh) 一种同步数据的方法、第一服务器以及同步数据的系统
CN113377295A (zh) 多生产者单消费者的数据存储和读取方法、装置、设备
CN112559547A (zh) 确定多存储对象副本之间一致性的方法及装置
CN113051244A (zh) 数据访问方法和装置、数据获取方法和装置
CN113760861A (zh) 一种数据迁移的方法和装置
CN115687244A (zh) 文件处理监控方法、装置、设备及介质
CN115408195A (zh) 一种异构平台的批量任务管理方法、设备和存储介质
CN112099963A (zh) 二进制日志文件解析的方法和装置
CN114416663A (zh) 一种电子文件的控制方法、装置、电子设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination