CN102387048B - 一种用于分布式文件系统的监控方法及分布式文件系统 - Google Patents

一种用于分布式文件系统的监控方法及分布式文件系统 Download PDF

Info

Publication number
CN102387048B
CN102387048B CN201110327096.9A CN201110327096A CN102387048B CN 102387048 B CN102387048 B CN 102387048B CN 201110327096 A CN201110327096 A CN 201110327096A CN 102387048 B CN102387048 B CN 102387048B
Authority
CN
China
Prior art keywords
file
access client
real
positional information
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110327096.9A
Other languages
English (en)
Other versions
CN102387048A (zh
Inventor
严耀华
王冲
江凌生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201110327096.9A priority Critical patent/CN102387048B/zh
Publication of CN102387048A publication Critical patent/CN102387048A/zh
Application granted granted Critical
Publication of CN102387048B publication Critical patent/CN102387048B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用于分布式文件系统的监控方法及分布式文件系统,通过实时监控模块在外部应用进程发送操作文件请求给文件访问客户端时,获取该请求中包括的所请求操作文件的文件信息;并在文件访问客户端接收到文件定位服务器反馈的位置信息后,获取文件访问客户端接收到的位置信息;即本发明中通过实时监控模块实时的记录了文件操作过程中,该文件的文件信息以及与该文件相对应的位置信息,因此方发生故障时,该记录可提供更详细的文件信息以及相关的位置信息,不需要多个模块之间协调定位即可直接获取相应的位置信息,从而排查出故障产生的位置,实现简单,排查周期短,可提高故障排查以及问题修复的效率。

Description

一种用于分布式文件系统的监控方法及分布式文件系统
技术领域
本发明涉及通信领域,具体涉及一种用于分布式文件系统的监控方法及分布式文件系统。
背景技术
分布式文件系统广泛的应用于云存储、IPTV、流媒体服务器等业务场合。例如用于IPTV系统存储IPTV系统的片源,在对TPTV系统进行读写时,由于分布式文件系统是多个独立模块间的协作运行,难免会出现读写异常情况,而对于存储IPTV的片源的分布式文件系统,最重要的就是保证读写流程正常通畅的进行,读写流程的异常将直接影响整个分布式文件系统的正常运作。但目前的分布式文件系统只是提供简单的读写出错异常的日志,因此会存在以下问题:
由于读写出错异常日志只有在读写出错异常情况下才提供,且提供的记录内容非常简单,并较好的反映读写过程,由于分布式系统是多个独立模块之间的协作工作,当其中一个模块出现异常操作时,根据简单的读写出错异常日志排查故障比较难实现,且往往还需要多个模块之间协调定位,过程繁杂,排查周期长,还不一定能查找到故障产生的位置,很难从根本上说明或解决问题。
发明内容
本发明要解决的主要技术问题是,提供一种用于分布式文件系统的监控方法及分布式文件系统,可实时记录分布式文件系统中对文件操作的流程,为分布式文件系统提供详细的记录,便于故障的及时排查和问题的及时解决。
为解决上述技术问题,本发明提供一种用于分布式文件系统的监控方法,包括:
外部应用进程发送操作文件请求给文件访问客户端,所述操作文件请求包括所请求操作文件的文件信息;
实时监控模块获取所述文件信息;
文件访问客户端根据所述操作文件请求向文件定位服务器发送位置查询请求,并根据文件定位服务器反馈的位置信息对所述文件进行操作;
实时监控模块获取所述文件访问客户端接收到的所述位置信息。
在本发明的一种实施例中,所述位置信息包括操作设备块信息,所述操作设备块信息包括挂载路径、设备号以及设备块号。
在本发明的一种实施例中,所述位置信息还包括所述文件的文件节点信息和操作页面信息。
在本发明的一种实施例中,所述实时监控模块包括APP日志模块,所述APP日志模块获取所述文件信息的同时,还包括获取所述操作的偏移量和当前位移。
在本发明的一种实施例中,所述实时监控模块包括FAC日志模块,所述FAC日志模块获取所述文件访问客户端接收到的所述位置信息。
在本发明的一种实施例中,所述操作文件请求包括读文件请求和写文件请求。
在本发明的一种实施例中,所述实时监控模块获取所述文件信息之前,还包括判断当前文件的读写是否正常,如否,开启实时监控模块,获取所述文件信息。
本发明还提供了一种分布式文件系统,包括:依次连接的文件定位服务器、文件访问客户端、以及存储模块,还包括与所述文件访问客户端连接的实时监控模块;
所述文件访问客户端用于向外部应用进程提供接口调用;根据外部应用进程发送的操作文件请求向文件定位服务器发送位置查询请求,所述操作文件请求包括所请求操作文件的文件信息;根据文件定位服务器反馈的位置信息在所述存储模块的相应位置对所述文件进行操作;
所述文件定位服务器用于存储所述分布式文件系统的文件的元数据信息;并根据文件访问客户端发送的位置查询请求,反馈相应的位置信息给所述文件访问客户端;
所述实时监控模块用于在所述文件访问客户端接收到所述操作文件请求时,获取所述文件信息;并用于获取所述文件定位服务器反馈给所述文件访问客户端的所述位置信息。
在本发明的一种实施例中,所述实时监控模块包括APP日志模块,所述APP日志模块用于在所述文件访问客户端接收到所述操作文件请求时,获取所述文件信息,并获取所述操作的偏移量和当前位移。
在本发明的一种实施例中,所述实时监控模块包括FAC日志模块,所述FAC日志模块用于获取所述文件定位服务器反馈给所述文件访问客户端的所述位置信息。
本发明的有益效果是:本发明提供的用于分布式文件系统的监控方法,通过实时监控模块在外部应用进程发送操作文件请求给文件访问客户端时,获取该请求中包括的所请求操作文件的文件信息;并在文件访问客户端接收到文件定位服务器反馈的位置信息后,获取文件访问客户端接收到的位置信息;即本发明中通过实时监控模块实时的对分布式文件系统中进行的文件操作流程做了详细的记录,具体记录了对文件操作过程中,该文件的文件信息以及与该文件相对应的位置信息,因此方发生故障时,该记录可提供更详细的文件信息以及相关的位置信息,不需要多个模块之间协调定位即可直接获取相应的位置信息,从而排查出故障产生的位置,实现简单,排查周期短,可提高故障排查以及问题修复的效率。
附图说明
图1为本发明一种实施例的分布式文件系统的系统框图;
图2为本发明一种实施例的读操作流程示意图;
图3为本发明一种实施例的写操作流程示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。
请参见图1,本例中的分布式文件系统包括依次连接的文件定位服务器、文件访问客户端、以及存储模块,还包括与文件访问客户端连接的实时监控模块;本例中的连接可为通信连接,其中:
文件访问客户端用于为外部应用进程提供接口调用服务;接收外部应用进程发送的操作文件请求,该操作文件请求包括所请求操作文件的文件信息,具体可包括文件名、文件大小等;文件访问客户端还根据外部应用进程发送的操作文件请求向文件定位服务器发送位置查询请求,并根据文件定位服务器反馈的位置信息在所述存储模块的相应位置对所述文件进行操作,具体可包括读操作和写操作,例如从存储模块的相应位置读取数据并通过相应的接口返回给外部应用程序,或向存储模块的相应位置写入相应的数据等;
文件定位服务器用于存储分布式文件系统中所有文件的元数据信息,具体可包括文件名、设备块信息等;并根据文件访问客户端发送的位置查询请求,反馈相应的位置信息给所述文件访问客户端,即向文件访问客户端提供元数据写入和查询等操作;
实时监控模块用于在文件访问客户端接收到操作文件请求时,获取该操作文件请求中包括的文件信息;并用于获取文件定位服务器反馈给文件访问客户端的位置信息。本例中文件定位服务器反馈给文件访问客户端的位置信息包括操作设备块信息,该操作设备块信息可包括挂载路径、设备号以及设备块号,还可包括请求操作文件的文件节点信息和操作页面信息。
本例中的存储模块可为SCIC磁盘或SATA磁盘等存储介质。
本例中,外部应用进程发送操作文件请求给文件访问客户端时,实时监控模块获取该操作文件请求中包括的文件信息;
文件访问客户端接收到该操作文件请求后向文件定位服务器发送位置查询请求,并根据文件定位服务器反馈的位置信息对所请求操作的文件进行相应的操作;
实时监控模块获取文件访问客户端接收到的所述位置信息。
因此本例中通过实时监控模块实时的对分布式文件系统中进行的文件操作流程做了详细的记录,具体记录请求操作文件的文件信息以及与该文件相对应的位置信息等,因此方发生故障时,通过该记录可提供更详细的文件信息以及相关的位置信息,不需要多个模块之间协调定位即可直接获取相应的位置信息,从而排查出故障产生的位置,实现简单,排查周期短,可提高故障排查以及问题修复的效率。
本例中的实时监控模块包括APP日志模块和FAC日志模块,其中,APP日志模块获取请求操作文件的文件信息同时,还包括从文件系统的文件访问客户端获取该操作的偏移量以及当前位移;FAC日志模块则获取文件访问客户端接收文件定位服务器反馈的上述位置信息。
本例中,实时监控模块在获取上述文件信息之前,还包括判断当前文件的操作流程是否正常的步骤,如不正常,才通知实时监控模块的开关模块开启实时监控模块,获取所述文件信息。当然,本例中还可分别针对APP日志模块和FAC日志模块设置对应的开关,以使实时监控模块根据实际需要选择开启不同的日志模块记录相关信息,例如,可设置APP日志模块的开关,并默认APP日志模块的开关在任何情况下都是开启状态;设置FAC日志模块开关,并设定只有在检测到操作流程不正常时才开启。
本例中实时监控模块的开关模块的设置,只在当前操作流程不正常时,才开启实时监控模块进行监控、记录,可确保系统不被无止境的正确读写日志流程干扰而影响整个文件系统的系能,从而保证分布式文件系统的高效性。
本例中的操作包括读操作和写操作,相应的本例中的操作文件请求包括读文件请求和写文件请求;操作设备块相应的包括读设备块和写设备块。当外部应用进程发送给文件访问客户端的请求为读文件请求时,该请求包括请求读的文件的文件名、文件大小等文件信息,此时文件定位服务器反馈给文件访问客户端的位置信息则包括读设备块信息,读设备块信息具体可包括挂载路径、设备号以及设备块号,还可包括请求读文件的文件节点信息和读页面信息。当外部应用进程发送给文件访问客户端的请求为写文件请求时,该请求包括请求写的文件的文件名、文件大小等文件信息,此时文件定位服务器反馈给文件访问客户端的位置信息则包括写设备块信息,写设备块信息具体可包括挂载路径、设备号以及设备块号,还可包括请求写文件的文件节点信息和写页面信息。
为了更好的理解本发明,下面分别以读操作和写操作的流程为例对本发明做进一步说明:
请参见图2,外部应用进程发送读文件请求给文件访问客户端,该读文件请求中包括请求读的文件的大小及文件名;例如可通过调用文件访问客户端提供的读文件接口,并传入需要读取的文件的文件名以及大小等;
实时数据控制模块判断开关是否开启,如判断开关开启时,启动APP日志模块获取上述读文件请求中包括的文件名以及大小,并获取当前读的偏移量和位移;
文件访问客户端接收到该读文件请求后,根据该读文件请求向文件定位服务器发送位置查询请求,查询将要读取文件的相关位置信息;
文件定位服务器根据文件访问客户端发送的位置查询请求,进行查询读设备块信息、读页面信息、以及文件的文件节点信息等位置信息,并将查询到的位置信息反馈给文件访问客户端;
文件客户端根据文件定位服务器反馈的位置信息,从存储模块上读取相应的数据并通过读文件接口反馈给外部应用进程;
实时数据控制模块启动FAC日志模块,获取文件定位服务器反馈给文件访问客户端的位置信息,具体包括获取记录读设备的挂载路径、设备号、设备块号、和读操作的读页面信息以及读的文件的文件节点信息等;外部应用进程返回读操作是否成功的操作码。
值得注意的是,本例中,FAC日志模块获取、记录上述位置信息与文件访问客户端根据接收到的位置信息进行读操作的步骤并无严格意义上的时间先后关系。
请参见图3,该图为写操作的流程示意图,具体如下:
外部应用进程发送写文件请求给文件访问客户端,该写文件请求中包括请求写的文件的大小及文件名;例如可通过调用文件访问客户端提供的写文件接口,并传入需要写取的文件的文件名以及大小等;
实时数据控制模块判断开关是否开启,如判断开关开启时,启动APP日志模块获取需要写的文件的大小以及文件名,并获取当前写的偏移量和位移;
文件访问客户端接收到该写文件请求后,根据该写文件请求向文件定位服务器发送位置查询请求,查询将要写的文件的相关位置信息;
文件定位服务器根据文件访问客户端发送的位置查询请求,进行查询写设备块信息、写页面信息、以及文件的文件节点信息等位置信息,并将查询到的位置信息反馈给文件访问客户端;其中,查询写设备块信息具体为:文件定位访问服务器根据文件系统的分配设备号规则分配相应的设备号,并按照规则将分配到的设备号按照未用的设备块顺序分配。
文件客户端根据文件定位服务器反馈的位置信息,将相应的数据写到存储模块的相应位置;
实时数据控制模块启动FAC日志模块,获取文件定位服务器反馈给文件访问客户端的位置信息,具体包括获取记录写设备的挂载路径、设备号、设备块号、和写操作的写页面信息以及写的文件的文件节点信息等;
外部应用进程返回写操作是否成功的操作码。
值得注意的是,本例中,FAC日志模块获取、记录上述位置信息与文件访问客户端根据接收到的位置信息进行写操作的步骤并无严格意义上的时间先后关系。
由上述过程可知,本例中的实时监控模块记录了读或写操作流程整个过程中的相关数据信息,因此在读或写过程中出错时,不需要多个模块之间协调定位即可直接获取相应的位置信息,即可根据该记录更有效、快捷的排查故障,进而找出问题的所在,提高处理效率。
以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (7)

1.一种用于分布式文件系统的监控方法,其特征在于包括:
外部应用进程发送操作文件请求给文件访问客户端,所述操作文件请求包括所请求操作文件的文件信息;
实时监控模块获取所述文件信息;
文件访问客户端根据所述操作文件请求向文件定位服务器发送位置查询请求,并根据文件定位服务器反馈的位置信息对所述文件进行操作;
实时监控模块获取所述文件访问客户端接收到的所述位置信息;
所述实时监控模块包括APP日志模块,所述APP日志模块获取所述文件信息的同时,还包括获取所述操作的偏移量和当前位移;
所述实时监控模块获取所述文件信息之前,还包括判断当前文件的读写是否正常,如否,开启实时监控模块,获取所述文件信息。
2.如权利要求1的方法,其特征在于,所述位置信息包括操作设备块信息,所述操作设备块信息包括挂载路径、设备号以及设备块号。
3.如权利要求2的方法,其特征在于,所述位置信息还包括所述文件的文件节点信息和操作页面信息。
4.如权利要求1-3任一项的方法,其特征在于,所述实时监控模块包括FAC日志模块,所述FAC日志模块获取所述文件访问客户端接收到的所述位置信息。
5.如权利要求4所述方法,其特征在于,所述操作文件请求包括读文件请求和写文件请求。
6.一种分布式文件系统,其特征在于包括:依次连接的文件定位服务器、文件访问客户端、以及存储模块,还包括与所述文件访问客户端连接的实时监控模块;
所述文件访问客户端用于向外部应用进程提供接口调用;根据外部应用进程发送的操作文件请求向文件定位服务器发送位置查询请求,所述操作文件请求包括所请求操作文件的文件信息;根据文件定位服务器反馈的位置信息在所述存储模块的相应位置对所述文件进行操作;
所述文件定位服务器用于存储所述分布式文件系统的文件的元数据信息;并根据文件访问客户端发送的位置查询请求,反馈相应的位置信息给所述文件访问客户端;
所述实时监控模块用于在所述文件访问客户端接收到所述操作文件请求时,获取所述文件信息;并用于获取所述文件定位服务器反馈给所述文件访问客户端的所述位置信息;
所述实时监控模块包括APP日志模块,所述APP日志模块用于在所述文件访问客户端接收到所述操作文件请求时,获取所述文件信息,并获取所述操作的偏移量和当前位移;
所述实时监控模块获取所述文件信息之前,还用于判断当前文件的读写是否正常,如否,开启实时监控模块,获取所述文件信息。
7.如权利要求6所述的系统,其特征在于,所述实时监控模块包括FAC日志模块,所述FAC日志模块用于获取所述文件定位服务器反馈给所述文件访问客户端的所述位置信息。
CN201110327096.9A 2011-10-25 2011-10-25 一种用于分布式文件系统的监控方法及分布式文件系统 Active CN102387048B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110327096.9A CN102387048B (zh) 2011-10-25 2011-10-25 一种用于分布式文件系统的监控方法及分布式文件系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110327096.9A CN102387048B (zh) 2011-10-25 2011-10-25 一种用于分布式文件系统的监控方法及分布式文件系统

Publications (2)

Publication Number Publication Date
CN102387048A CN102387048A (zh) 2012-03-21
CN102387048B true CN102387048B (zh) 2015-08-12

Family

ID=45826048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110327096.9A Active CN102387048B (zh) 2011-10-25 2011-10-25 一种用于分布式文件系统的监控方法及分布式文件系统

Country Status (1)

Country Link
CN (1) CN102387048B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929760A (zh) * 2012-10-19 2013-02-13 浪潮电子信息产业股份有限公司 一种远程监控系统上电过程宕机的方法
CN103001809B (zh) * 2012-12-25 2016-12-28 曙光信息产业(北京)有限公司 用于云存储系统的服务节点状态监控方法
CN104735099B (zh) * 2013-12-18 2018-05-08 北京神州泰岳软件股份有限公司 一种远端文件读取方法及系统
CN103763155A (zh) * 2014-01-24 2014-04-30 国家电网公司 分布式云存储系统多服务心跳监测方法
CN104104731B (zh) * 2014-07-28 2018-02-02 浪潮(北京)电子信息产业有限公司 一种维护数据一致性的方法及装置
CN106599046B (zh) * 2016-11-09 2020-06-30 北京同有飞骥科技股份有限公司 分布式文件系统的写入方法及装置
CN111444081B (zh) * 2019-01-17 2023-05-02 阿里巴巴集团控股有限公司 确定、响应和生成方法、客户端、服务器、设备和介质
CN112132643A (zh) * 2019-06-25 2020-12-25 北京京东尚科信息技术有限公司 商品上架的方法、装置、电子设备及可读介质
CN112187875B (zh) * 2020-09-09 2022-05-13 苏州浪潮智能科技有限公司 一种分布式系统多目标集群挂载策略自动匹配方法、系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1627699A (zh) * 2004-06-24 2005-06-15 西安交通大学 异常文件访问自适应检测方法
CN101673288A (zh) * 2009-10-13 2010-03-17 中兴通讯股份有限公司 一种iptv系统中的读、写文件的方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1627699A (zh) * 2004-06-24 2005-06-15 西安交通大学 异常文件访问自适应检测方法
CN101673288A (zh) * 2009-10-13 2010-03-17 中兴通讯股份有限公司 一种iptv系统中的读、写文件的方法和系统

Also Published As

Publication number Publication date
CN102387048A (zh) 2012-03-21

Similar Documents

Publication Publication Date Title
CN102387048B (zh) 一种用于分布式文件系统的监控方法及分布式文件系统
CN110691133B (zh) 一种应用于网络通信设备的web服务拟态系统及方法
CN103793479A (zh) 日志管理方法及系统
CN104202201A (zh) 一种日志处理方法、装置及终端
CN101819543A (zh) 快照数据处理方法和系统以及存储设备
CN102609479A (zh) 一种内存数据库节点复制方法
CN107590392A (zh) 利用脚本校验硬件完整性的系统及方法
CN102142989A (zh) 内容分发网络中的故障定位方法及装置
CN101551772A (zh) 嵌入式通信设备异常信息记录方法及装置
CN1971599A (zh) 一种软件应用错误监控方法及系统
CN110543398A (zh) 一种故障信息的记录方法和系统
CN104506939B (zh) 一种信息上报方法及电视终端
CN105573872A (zh) 数据存储系统的硬盘维护方法和装置
CN102708062A (zh) 基于数据块的多媒体存储方法和装置
CN103297477A (zh) 一种数据采集上报系统及数据处理方法和代理服务器
CN102833386A (zh) 一种实现存储操作记录的方法、系统及移动终端
CN112583743A (zh) 一种分布式文件交换方法及装置
CN103516864A (zh) 在移动终端中监控预设操作的方法和装置
CN104536857A (zh) 硬盘参数获取方法
CN109669811A (zh) 一种能够可靠性访问的数据处理方法及终端
CN102761441B (zh) 一种数字电视业务监控方法、装置及系统
CN102542306B (zh) 一种移动终端应用子系统访问用户识别卡文件的方法
CN102567519A (zh) 一种用于gsm-r系统中的数据分析装置和方法
CN102045752B (zh) 用户媒体面跟踪方法及装置
US20140280618A1 (en) Dynamic alert recognition system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant