KR101527058B1 - Distributed file management apparatus and method - Google Patents

Distributed file management apparatus and method Download PDF

Info

Publication number
KR101527058B1
KR101527058B1 KR1020100073475A KR20100073475A KR101527058B1 KR 101527058 B1 KR101527058 B1 KR 101527058B1 KR 1020100073475 A KR1020100073475 A KR 1020100073475A KR 20100073475 A KR20100073475 A KR 20100073475A KR 101527058 B1 KR101527058 B1 KR 101527058B1
Authority
KR
South Korea
Prior art keywords
file
user
connection
history information
per
Prior art date
Application number
KR1020100073475A
Other languages
Korean (ko)
Other versions
KR20120011574A (en
Inventor
김승민
Original Assignee
에스케이텔레콤 주식회사
에스케이플래닛 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이텔레콤 주식회사, 에스케이플래닛 주식회사 filed Critical 에스케이텔레콤 주식회사
Priority to KR1020100073475A priority Critical patent/KR101527058B1/en
Publication of KR20120011574A publication Critical patent/KR20120011574A/en
Application granted granted Critical
Publication of KR101527058B1 publication Critical patent/KR101527058B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 분산 파일 관리 장치 및 방법에 관한 것으로서, 데이터 안정성 및 성능 향상을 위해 파일별로 복제본들을 여러 저장공간으로 분산하여 생성 및 관리하는 분산 파일 관리 장치에서 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신함으로써 누적된 접속 이력 정보를 기준으로 하여 원본 파일과 복제본 파일의 최적 분산 저장 위치를 결정할 수 있도록 하며, 사용자의 접속 위치에서 통신 거리가 가장 가까운 저장공간에 각 사용자별 또는 지역별로 많이 사용되는 데이터를 위치시켜서 빠른 데이터 전송을 지원할 수 있고, 사용자의 접속 위치에서 지리적으로 멀리 떨어져 있는 저장공간에 데이터를 보관하여 자연재해와 같은 예측하기 힘든 비상사태 등에 대비하는 높은 데이터 안정성을 보장하는 이점이 있다.The present invention relates to an apparatus and method for managing distributed files. In order to improve data stability and performance, a distributed file management apparatus for distributing replicas to a plurality of storage spaces and creating and managing them is provided. It is possible to determine the optimum distributed storage location of the original file and the replica file based on the accumulated connection history information by generating or updating the connection history information, It can support fast data transmission by locating widely used data in each region, and it is possible to store data in a storage space which is geographically far from the user's connection position, and to provide high data stability for unpredictable emergencies such as natural disasters There is an advantage to guarantee.

Description

분산 파일 관리 장치 및 방법{DISTRIBUTED FILE MANAGEMENT APPARATUS AND METHOD}[0001] DISTRIBUTED FILE MANAGEMENT APPARATUS AND METHOD [0002]

본 발명은 분산 파일 관리 장치 및 방법에 관한 것으로서, 더욱 상세하게는 데이터 안정성 및 성능 향상을 위해 파일별로 복제본들을 여러 저장공간으로 분산하여 생성 및 관리하는 분산 파일 관리 장치에서 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신함으로써 누적된 접속 이력 정보를 기준으로 하여 원본 파일과 복제본 파일의 최적 분산 저장 위치를 결정할 수 있도록 한 분산 파일 관리 장치 및 방법에 관한 것이다.The present invention relates to a distributed file management apparatus and method, and more particularly, to a distributed file management apparatus for distributing and creating replicas in a plurality of storage spaces on a file-by-file basis for improving data stability and performance, The present invention relates to a distributed file management apparatus and method capable of determining an optimum distributed storage location of an original file and a replica file based on cumulative access history information by generating or updating access history information by checking an area.

일반적으로, 범용 하드웨어 기반의 분산 파일 관리 장치에서는 데이터 안정성 및 성능 향상을 위해 파일별로 복제본(replica)들을 여러 컴퓨터에 각각 분산하여 생성 및 관리한다.Generally, in a general-purpose hardware-based distributed file management apparatus, replicas are generated and managed for each file on a plurality of computers in order to improve data stability and performance.

종래 기술에 따른 분산 파일 관리 장치에서는 데이터 읽기와 쓰기의 실행 속도, 스토리지 요구량 등을 종합적으로 검토하여 복제본의 개수를 결정하며, 전체 사용자 또는 파일에 대해 일관적인 기준에 의해 원본 파일과 복제본 파일의 분산 저장 위치를 결정하고 있다.In the distributed file management apparatus according to the related art, the number of replicas is determined by reviewing the execution speed of data reading and writing and the storage requirement in a comprehensive manner, and the distribution of the original file and the replica file The storage location is determined.

그러나, 네트워크를 통하여 가상화된 스토리지 자원을 사용자의 요구에 따라 제공하는 클라우드 스토리지(cloud storage) 등의 경우에는 다수의 사용자가 서로 다른 지리적 위치에서 통신망을 통하여 접속하므로 파일의 분산 저장 위치가 데이터의 전송 속도에 영향을 미치는데 종래에는 이에 대한 고려가 없었다. 즉 빠른 데이터 전송을 위해서는 사용자의 접속 위치에서 가장 가까운 저장공간에 각 사용자별 또는 지역별로 많이 사용되는 데이터를 위치시키는 것이 바람직하나, 일관적인 기준에 의해 파일의 분산 저장 위치를 결정하므로 주 접속 지역과 분산 저장 위치가 원거리로 이격되는 경우가 발생하며, 이 경우에는 빠른 데이터 전송을 지원하지 못하는 문제점이 있었다.However, in the case of a cloud storage or the like in which virtualized storage resources are provided according to a user's demand through a network, a plurality of users access from different geographical locations through a communication network, There is no consideration for this in the past to affect the speed. That is, it is desirable to locate frequently used data for each user or region in the storage space closest to the user's connection position for fast data transfer. However, since the distributed storage position of the file is determined by a consistent criterion, There is a case where the dispersed storage location is distant from the long distance. In this case, there is a problem that fast data transmission is not supported.

반면에, 자연재해와 같은 예측하기 힘든 비상사태 등을 감안하면 지리적으로 멀리 떨어져 있는 저장공간에 데이터를 보관하는 것이 바람직하나 종래에는 이에 대한 고려가 없었다. 즉 데이터 안정성을 보장하기 위해서는 주 접속 지역과 분산 저장 위치를 원거리로 이격시킬 필요가 있으나 일관적인 기준에 의해 파일의 분산 저장 위치를 결정하므로 주 접속 지역과 분산 저장 위치가 근거리로 근접되는 경우가 발생하며, 이 경우에는 데이터 안정성을 보장하지 못하는 문제점이 있었다.On the other hand, considering the unpredictable emergencies such as natural disasters, it is desirable to store data in a geographically remote storage space, but there has been no consideration in the past. In other words, in order to guarantee the data stability, it is necessary to separate the main access area and the distributed storage location from each other at a long distance, but the main access area and the distributed storage location are close to each other In this case, there is a problem that data stability can not be guaranteed.

본 발명은 이와 같은 종래 기술의 문제점을 해결하기 위해 데이터 안정성 및 성능 향상을 위해 파일별로 복제본들을 여러 저장공간으로 분산하여 생성 및 관리하는 분산 파일 관리 장치에서 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신함으로써 누적된 접속 이력 정보를 기준으로 하여 원본 파일과 복제본 파일의 최적 분산 저장 위치를 결정할 수 있도록 한 분산 파일 관리 장치 및 방법에 관한 것이다.In order to solve the problems of the related art, in order to improve the data stability and performance, the distributed file management apparatus distributes replicas to a plurality of storage spaces and creates and manages the replicas for each file, And more particularly, to a distributed file management apparatus and method capable of determining an optimum distributed storage location of an original file and a replica file based on cumulative access history information by generating or updating access history information.

본 발명의 제 1 관점으로서 분산 파일 관리 장치는, 원본 파일과 복제본 파일을 분산 저장하는 복수의 파일 서버와, 상기 복수의 파일 서버에 저장된 상기 원본 파일과 상기 복제본 파일에 대해 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신하는 접속 위치 확인부와, 상기 접속 위치 확인부가 생성 또는 갱신한 상기 접속 이력 정보를 사용자별 또는 파일별로 데이터베이스화하여 저장하는 접속 이력 데이터베이스와, 상기 접속 이력 데이터베이스에 누적된 상기 접속 이력 정보를 읽어 들여 기 설정된 경로를 통해 모니터링 단말 또는 시스템 관리자에게 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보를 전송하는 파일 분산 처리부와, 기 설정된 복제 기준에 따라 상기 복수의 파일 서버 중에서 적어도 2개 이상의 파일 서버를 선택하여 상기 원본 파일과 상기 복제본 파일에 대한 저장을 제어하는 제어부를 포함할 수 있다.As a first aspect of the present invention, a distributed file management apparatus includes a plurality of file servers for distributively storing an original file and a replica file, and a plurality of file servers for distributing the original file and the replica file stored in the plurality of file servers, An access history database which stores the connection history information created or updated by the connection location confirmation unit in a database for each user or each file; A file distribution processor for reading the access history information accumulated in the history database and transmitting usage environment information or usage status information for each user to the monitoring terminal or the system administrator through the set path; At least two of the file servers It can include a controller to select a file server for controlling the storage of the original file and the replica file.

여기서, 상기 기 설정된 복제 기준은, 상기 복수의 파일 서버 중에서 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 통신 거리가 가장 가까운 파일 서버를 필수로 선택하는 것일 수 있다.Here, the preset replication criterion may be such that a file server having the closest communication distance is selected as essential from the plurality of file servers in accordance with the per-user usage environment information or per-file usage status information, Lt; / RTI >

상기 기 설정된 복제 기준은, 상기 복수의 파일 서버 중에서 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 지리적으로 가장 먼 파일 서버를 필수로 선택하는 것일 수 있다.The predetermined duplication criterion may be to select a file server that is most distant from the plurality of file servers in the geographical distances from the plurality of file servers to the user access information or the file access information by file, .

상기 접속 위치 확인부는, 기 설정 시간마다 상기 접속 이력 정보를 리셋할 수 있다.The connection location confirmation unit may reset the connection history information at a preset time.

상기 접속 위치 확인부는, 상기 접속 지역을 확인하는 시간의 경과에 따라 변경된 가중치를 부여하여 주 접속 지역을 확인할 수 있다.The connection position confirmation unit may assign a weighted value to the connection area confirmation unit according to the passage of time for confirming the connection area, thereby confirming the main connection area.

본 발명의 제 2 관점으로서 분산 파일 관리 장치는, 원본 파일과 복제본 파일을 분산 저장하는 복수의 파일 서버와, 상기 복수의 파일 서버에 저장된 상기 원본 파일과 상기 복제본 파일에 대해 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신하는 접속 위치 확인부와, 상기 접속 위치 확인부가 생성 또는 갱신한 상기 접속 이력 정보를 사용자별 또는 파일별로 데이터베이스화하여 저장하는 접속 이력 데이터베이스와, 상기 접속 이력 데이터베이스에 누적된 상기 접속 이력 정보를 읽어 들여 기 설정된 경로를 통해 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보를 전송하는 파일 분산 처리부와, 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 의거해 갱신한 복제 기준에 따라 상기 복수의 파일 서버 중에서 적어도 2개 이상의 파일 서버를 선택하여 상기 원본 파일과 상기 복제본 파일에 대한 저장을 제어하는 제어부를 포함할 수 있다.As a second aspect of the present invention, a distributed file management apparatus includes a plurality of file servers for distributively storing an original file and a replica file, and a plurality of file servers for distributing the original file and the replica file stored in the plurality of file servers, An access history database which stores the connection history information created or updated by the connection location confirmation unit in a database for each user or each file; A file distribution processor for reading the access history information accumulated in the history database and transmitting usage environment information or usage status information for each file through the set path; According to the updated replication criterion, Selecting at least two or more files from the server and may comprise a control unit for controlling the storage of the original file and the replica file.

여기서, 상기 갱신한 복제 기준은, 상기 복수의 파일 서버 중에서 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 통신 거리가 가장 가까운 파일 서버를 필수로 선택하는 것일 수 있다.Here, the updated replication criterion may be such that a file server closest to the communication distance is selected as essential from the plurality of file servers in accordance with the per-user usage environment information or per-file usage status information, Lt; / RTI >

상기 갱신한 복제 기준은, 상기 복수의 파일 서버 중에서 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 지리적으로 가장 먼 파일 서버를 필수로 선택하는 것일 수 있다.The updated replication criterion may be to select a file server furthest from the plurality of file servers, which is furthest from the user's per-user or per-file primary access location according to the per-user use environment information or per-file usage status information .

상기 접속 위치 확인부는, 기 설정 시간마다 상기 접속 이력 정보를 리셋할 수 있다.The connection location confirmation unit may reset the connection history information at a preset time.

상기 접속 위치 확인부는, 상기 접속 지역을 확인하는 시간의 경과에 따라 변경된 가중치를 부여하여 주 접속 지역을 확인할 수 있다.The connection position confirmation unit may assign a weighted value to the connection area confirmation unit according to the passage of time for confirming the connection area, thereby confirming the main connection area.

본 발명의 제 3 관점으로서 분산 파일 관리 방법은, 복수의 파일 서버에 저장된 원본 파일과 복제본 파일에 대해 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신하는 단계와, 생성 또는 갱신한 상기 접속 이력 정보를 사용자별 또는 파일별로 데이터베이스화하여 저장하는 단계와, 누적된 상기 접속 이력 정보에 의거하여 기 설정된 경로를 통해 모니터링 단말 또는 시스템 관리자에게 사용자별 사용 현황 정보 또는 파일별 사용 현황 정보를 전송하는 단계와, 기 설정된 복제 기준에 따라 상기 복수의 파일 서버 중에서 적어도 2개 이상의 파일 서버를 선택하여 상기 원본 파일과 상기 복제본 파일을 분산 저장하는 단계를 포함할 수 있다.According to a third aspect of the present invention, there is provided a distributed file management method comprising the steps of: generating or updating access history information by checking connection regions for each user or each file for original files and replica files stored in a plurality of file servers; A step of storing the updated connection history information in a database for each user or each file and storing the updated connection history information in a database for each user or a file, And selecting and distributing at least two file servers among the plurality of file servers in accordance with a predetermined copy criterion to distribute and store the original file and the replica file.

여기서, 상기 분산 저장하는 단계는, 상기 복수의 파일 서버 중에서 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 통신 거리가 가장 가까운 파일 서버를 필수로 선택할 수 있다.Here, the distributed storage may be performed by selecting a file server having the closest communication distance from the plurality of file servers in accordance with the per-user usage environment information or per-file usage status information, have.

상기 분산 저장하는 단계는, 상기 복수의 파일 서버 중에서 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 지리적으로 가장 먼 파일 서버를 필수로 선택할 수 있다.The distributing and storing may be performed by selecting a file server that is most distant from the plurality of file servers in terms of the per-user usage environment information or per-file usage status information.

상기 접속 이력 정보를 생성 또는 갱신하는 단계는, 기 설정 시간마다 상기 접속 이력 정보를 리셋할 수 있다.The step of generating or updating the connection history information may reset the connection history information at each preset time.

상기 접속 이력 정보를 생성 또는 갱신하는 단계는, 상기 접속 지역을 확인하는 시간의 경과에 따라 변경된 가중치를 부여하여 주 접속 지역을 확인할 수 있다.In the step of generating or updating the connection history information, the changed connection weight can be given to the main connection area according to the passage of time for confirming the connection area.

본 발명의 제 4 관점으로서 분산 파일 관리 방법은, 복수의 파일 서버에 저장된 원본 파일과 복제본 파일에 대해 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신하는 단계와, 생성 또는 갱신한 상기 접속 이력 정보를 사용자별 또는 파일별로 데이터베이스화하여 저장하는 단계와, 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 의거해 갱신한 복제 기준에 따라 상기 복수의 파일 서버 중에서 적어도 2개 이상의 파일 서버를 선택하여 상기 원본 파일과 상기 복제본 파일을 분산 저장하는 단계를 포함할 수 있다.According to a fourth aspect of the present invention, there is provided a distributed file management method comprising the steps of: generating or updating connection history information by confirming an access area for each user or each file with respect to an original file and a replica file stored in a plurality of file servers; Storing the updated connection history information in a database for each user or each file and storing the updated connection history information in a database; and updating at least two of the plurality of file servers in accordance with a replication criterion updated based on the usage environment information or the usage- Selecting the file server and distributing the original file and the replica file in a distributed manner.

여기서, 상기 분산 저장하는 단계는, 상기 복수의 파일 서버 중에서 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 통신 거리가 가장 가까운 파일 서버를 필수로 선택할 수 있다.Here, the distributed storage may be performed by selecting a file server having the closest communication distance from the plurality of file servers in accordance with the per-user usage environment information or per-file usage status information, have.

상기 분산 저장하는 단계는, 상기 복수의 파일 서버 중에서 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 지리적으로 가장 먼 파일 서버를 필수로 선택할 수 있다.The distributing and storing may be performed by selecting a file server that is most distant from the plurality of file servers in terms of the per-user usage environment information or per-file usage status information.

상기 접속 이력 정보를 생성 또는 갱신하는 단계는, 기 설정 시간마다 상기 접속 이력 정보를 리셋할 수 있다.The step of generating or updating the connection history information may reset the connection history information at each preset time.

상기 접속 이력 정보를 생성 또는 갱신하는 단계는, 상기 접속 지역을 확인하는 시간의 경과에 따라 변경된 가중치를 부여하여 주 접속 지역을 확인할 수 있다.In the step of generating or updating the connection history information, the changed connection weight can be given to the main connection area according to the passage of time for confirming the connection area.

본 발명의 실시예에 의하면, 데이터 안정성 및 성능 향상을 위해 파일별로 복제본들을 여러 저장공간으로 분산하여 생성 및 관리하는 분산 파일 관리 장치에서 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신함으로써 누적된 접속 이력 정보를 기준으로 하여 원본 파일과 복제본 파일의 최적 분산 저장 위치를 결정할 수 있도록 하는 효과가 있다.According to an embodiment of the present invention, in order to improve data stability and performance, a distributed file management apparatus for distributing replicas to a plurality of storage spaces for each file to generate and manage the access areas is checked for each user or each file to generate access history information Or the update history of the original file and the replica file based on the accumulated access history information.

예컨대, 사용자의 접속 위치에서 통신 거리가 가장 가까운 저장공간에 각 사용자별 또는 지역별로 많이 사용되는 데이터를 위치시켜서 빠른 데이터 전송을 지원할 수 있다.For example, it is possible to support fast data transmission by locating data frequently used for each user or region in a storage space closest to the communication distance at the user's connection position.

또한, 사용자의 접속 위치에서 지리적으로 멀리 떨어져 있는 저장공간에 데이터를 보관하여 자연재해와 같은 예측하기 힘든 비상사태 등에 대비하는 높은 데이터 안정성을 보장한다.In addition, data is stored in geographically remote storage locations at the user's location to ensure high data reliability, such as unpredictable emergencies, such as natural disasters.

도 1은 본 발명의 실시예에 따른 분산 파일 관리 장치를 적용할 수 있는 분산 파일 시스템의 구성도,
도 2는 본 발명의 실시예에 따른 분산 파일 관리 장치의 세부적인 블록 구성도,
도 3은 본 발명의 실시예에 따른 분산 파일 관리 장치에 의한 분산 파일 관리 방법을 예시적으로 설명하기 위한 흐름도.
1 is a configuration diagram of a distributed file system to which a distributed file management apparatus according to an embodiment of the present invention can be applied;
2 is a detailed block diagram of a distributed file management apparatus according to an embodiment of the present invention;
FIG. 3 is a flowchart illustrating a distributed file management method according to an embodiment of the present invention. FIG.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.BRIEF DESCRIPTION OF THE DRAWINGS The advantages and features of the present invention and the manner of achieving them will become apparent with reference to the embodiments described in detail below with reference to the accompanying drawings. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. Rather, these embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the scope of the invention to those skilled in the art. To fully disclose the scope of the invention to those skilled in the art, and the invention is only defined by the scope of the claims.

본 발명의 실시예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명의 실시예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. In the following description of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear. The following terms are defined in consideration of the functions in the embodiments of the present invention, which may vary depending on the intention of the user, the intention or the custom of the operator. Therefore, the definition should be based on the contents throughout this specification.

첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다. Each block of the accompanying block diagrams and combinations of steps of the flowchart may be performed by computer program instructions. These computer program instructions may be loaded into a processor of a general purpose computer, special purpose computer, or other programmable data processing apparatus so that the instructions, which may be executed by a processor of a computer or other programmable data processing apparatus, And means for performing the functions described in each step are created. These computer program instructions may also be stored in a computer usable or computer readable memory capable of directing a computer or other programmable data processing apparatus to implement the functionality in a particular manner so that the computer usable or computer readable memory It is also possible for the instructions stored in the block diagram to produce a manufacturing item containing instruction means for performing the functions described in each block or flowchart of the block diagram. Computer program instructions may also be stored on a computer or other programmable data processing equipment so that a series of operating steps may be performed on a computer or other programmable data processing equipment to create a computer- It is also possible that the instructions that perform the processing equipment provide the steps for executing the functions described in each block of the block diagram and at each step of the flowchart.

또한, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들 또는 단계들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.Also, each block or each step may represent a module, segment, or portion of code that includes one or more executable instructions for executing the specified logical function (s). It should also be noted that in some alternative embodiments, the functions mentioned in the blocks or steps may occur out of order. For example, two blocks or steps shown in succession may in fact be performed substantially concurrently, or the blocks or steps may sometimes be performed in reverse order according to the corresponding function.

도 1은 본 발명의 실시예에 따른 분산 파일 관리 장치를 적용할 수 있는 분산 파일 시스템의 구성도이다. 도 1을 참조하면 실시예에 따른 분산 파일 시스템은 분산 파일 관리 장치(100)가 인터넷, 전용회선, 무선망 등과 같은 통신망(200)을 통해 다수의 사용자 단말기(310, 320, 330)와 연결된다. 여기서, 도 1에서는 분산 파일 관리 장치(100)가 3대의 사용자 단말기(310, 320, 330)와 연결되는 경우를 예시하였으나, 웹하드, 인터넷하드 등의 용어로 불리는 데이터 저장 서비스를 제공하는 시스템들처럼 매우 많은 사용자 단말기들과 연결될 수 있다. 따라서 사용자 단말기(310, 320, 330)와 접속하여 사용자 인증을 하고, 데이터의 저장과 관리, 비용결제 등을 처리할 수 있는 구성요소를 포함할 수 있으나, 이러한 구성요소는 본 발명의 핵심은 아니므로 이에 대한 자세한 설명은 생략한다.1 is a configuration diagram of a distributed file system to which a distributed file management apparatus according to an embodiment of the present invention can be applied. 1, a distributed file management system according to an embodiment of the present invention is connected to a plurality of user terminals 310, 320, and 330 through a communication network 200 such as the Internet, a private line, and a wireless network . 1 illustrates a case in which the distributed file management apparatus 100 is connected to three user terminals 310, 320, and 330, a system for providing a data storage service called a web hard, an internet hard, Lt; RTI ID = 0.0 > user terminals. ≪ / RTI > Accordingly, the present invention can include a component that can access the user terminals 310, 320, and 330 to perform user authentication, process data storage and management, and settle payment, but these components are not the core of the present invention A detailed description thereof will be omitted.

도 2는 본 발명의 실시예에 따른 분산 파일 관리 장치의 세부적인 블록 구성도이다. 도 2를 참조하면 실시예에 따른 분산 파일 관리 장치(100)는 파일 목록 관리부(110), 파일 목록 데이터베이스(120), 접속 위치 확인부(130), 접속 이력 데이터베이스(140), 파일 분산 처리부(150), 제어부(160), 제 1 파일 서버(170)와 제 2 파일 서버(180) 내지 제 n 파일 서버(190)로 표현할 수 있는 복수의 파일 서버 등을 포함할 수 있다. 예컨대, 제 1 파일 서버(170) 내지 제 n 파일 서버(190)는 IDC(Internet Data Center)로 구현할 수 있다.2 is a detailed block diagram of a distributed file management apparatus according to an embodiment of the present invention. 2, the distributed file management apparatus 100 includes a file list management unit 110, a file list database 120, a connection location confirmation unit 130, an access history database 140, a file distribution processing unit 150, a controller 160, a first file server 170, and a plurality of file servers 180, which can be expressed as a second file server 180 to an nth file server 190, for example. For example, the first file server 170 to the nth file server 190 may be implemented by an IDC (Internet Data Center).

파일 목록 관리부(110)는 제 1 파일 서버(170) 내지 제 n 파일 서버(190)에 저장된 파일의 목록을 생성하고, 파일 목록 데이터베이스(120)는 파일 목록 관리부(110)에서 생성한 파일 목록을 저장한다. 예컨대, 사용자 단말기(310)로부터 업로드 되어 제 1 파일 서버(170)에 저장되는 파일의 위치를 디렉토리의 형태로 표시할 수 있다. 이러한 파일 목록 관리부(110) 및 파일 목록 데이터베이스(120)는 실제로 파일을 저장하는 제 1 파일 서버(170) 내지 제 n 파일 서버(190)에 각각 설치하여 제어부(160)가 관리 및 운용할 수도 있다.The file list management unit 110 generates a list of files stored in the first file server 170 to the nth file server 190 and the file list database 120 stores a list of files generated by the file list management unit 110 . For example, the location of a file uploaded from the user terminal 310 and stored in the first file server 170 may be displayed in the form of a directory. The file list management unit 110 and the file list database 120 may be installed in the first file server 170 to the nth file server 190 that actually store files and may be managed and operated by the controller 160 .

파일 목록 관리부(110)는 주기적으로 제 1 파일 서버(170) 내지 제 n 파일 서버(190)에 저장된 파일의 목록을 갱신한다. 예컨대, 파일 목록 관리부(110)는 최종적으로 제 1 파일 서버(170) 내지 제 n 파일 서버(190)와의 동기화를 맞출 수 있다.The file list management unit 110 periodically updates the list of files stored in the first file server 170 to the nth file server 190. For example, the file list management unit 110 may finally synchronize with the first file server 170 to the nth file server 190.

제 1 파일 서버(170)는 저장할 파일을 기록하는 제 1 파일 관리부(171)와 파일을 실제로 저장하는 제 1 파일 데이터베이스(173)를 포함할 수 있으며, 제 2 파일 서버(180)는 저장할 파일을 기록하는 제 2 파일 관리부(181)와 파일을 실제로 저장하는 제 2 파일 데이터베이스(183)를 포함할 수 있고, 마찬가지로 제 n 파일 서버(190)는 저장할 파일을 기록하는 제 n 파일 관리부(191)와 파일을 실제로 저장하는 제 n 파일 데이터베이스(194)를 포함할 수 있다.The first file server 170 may include a first file management unit 171 for storing a file to be stored and a first file database 173 for actually storing the file. The second file server 180 may include a file And a second file database 183 for actually storing the file. Similarly, the n-th file server 190 may include an n-th file management unit 191 for recording a file to be stored, And a control file database 194 that actually stores the file.

이처럼 제 1 파일 서버(170), 제 2 파일 서버(180) 내지 제 n 파일 서버(190)로 표현할 수 있는 복수의 파일 서버의 개수는 저장 용량, 사용자의 수, 시스템의 상태 등에 따라 다양하게 변화될 수 있다.The number of file servers that can be represented by the first file server 170, the second file server 180, and the nth file server 190 can be variously changed according to the storage capacity, the number of users, .

접속 위치 확인부(130)는 제 1 파일 서버(170) 내지 제 n 파일 서버(190)에 저장된 파일에 대해 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신한다. 예컨대, 제 1 파일 서버(170) 내지 제 n 파일 서버(190)의 설치 지역을 기준으로 하여 각 사용자별 또는 파일별로 주 접속 지역을 확인할 수 있다. 여기서, 접속 위치 확인부(130)는 기 설정 시간마다 접속 이력 정보를 리셋하여 삭제함으로써 비교적 최근에 발생한 파일 접속 상황이 접속 이력 정보에 반영되도록 할 수 있다. 아울러, 기 설정된 시간이 경과한 파일 접속 상황보다 비교적 최근에 발생한 파일 접속 상황에 가중치를 부여하여 비교적 최근에 발생한 파일 접속 상황이 더 많은 비중으로 접속 이력 정보에 반영되도록 할 수도 있다. 예컨대, 접속 지역을 확인하는 시간의 경과에 따라 변경된 가중치를 부여하여 주 접속 지역을 확인할 수 있다.The connection location confirmation unit 130 generates or updates the connection history information by checking connection areas for each user or each file with respect to the files stored in the first file server 170 to the nth file server 190. For example, the main access area can be identified for each user or each file based on an installation area of the first file server 170 to the nth file server 190. Here, the connection location confirmation unit 130 may reset and delete the connection history information at the preset time so that the relatively recent file connection situation may be reflected in the connection history information. In addition, it is possible to assign a weight to a file access situation that occurred relatively recently than a file access state that has passed a predetermined time, so that a relatively recent file access situation may be reflected in the connection history information with a larger weight. For example, it is possible to identify the main access area by assigning changed weights according to the passage of time for confirming the access area.

접속 이력 데이터베이스(140)는 접속 위치 확인부(130)가 생성 또는 갱신한 접속 이력 정보를 사용자별 또는 파일별로 데이터베이스화하여 저장한다.The connection history database 140 stores the connection history information created or updated by the connection location confirmation unit 130 in a database for each user or each file.

파일 분산 처리부(150)는 접속 이력 데이터베이스(140)에 누적된 접속 이력 정보를 읽어 들여 기 설정된 경로를 통해 모니터링 단말(미도시), 시스템 관리자 또는 제어부(160)에게 사용자별 사용 현황 정보 또는 파일별 사용 현황 정보를 전송하거나 알려서 사용자별 또는 파일별로 누적된 접속 이력을 기준으로 하여 원본 파일과 복제본 파일의 분산 저장 위치를 결정할 수 있도록 한다.The file distribution processing unit 150 reads the connection history information accumulated in the connection history database 140 and transmits the usage history information per user or the file to the monitoring terminal (not shown), the system administrator or the control unit 160 through the set path It is possible to determine the distributed storage location of the original file and the replica file based on the access history accumulated per user or file by transmitting or notifying the usage information.

제어부(160)는 분산 파일 관리 장치(100)에 포함된 각종 구성요소를 제어하며, 제 1 파일 서버(170) 내지 제 n 파일 서버(190) 중에서 시스템 관리자에 의해 기 설정된 복제 기준에 따라 파일 서버를 선택하여 원본 파일과 복제본 파일에 대한 저장을 제어하거나 파일 분산 처리부(150)로부터 전달받은 사용자별 사용 현황 정보 또는 파일별 사용 현황 정보에 의거해 복제 기준을 갱신하여 제 1 파일 서버(170) 내지 제 n 파일 서버(190) 중에서 선택한 적어도 2개 이상의 파일 서버를 대상으로 하여 원본 파일과 복제본 파일에 대한 저장을 제어한다. 예컨대, 제 1 파일 서버(170) 내지 제 n 파일 서버(190) 중에서 사용자별 또는 파일별 주 접속 위치에서 통신 거리가 가장 가까운 파일 서버를 원본 파일과 복제본 파일을 중에서 어느 하나의 파일을 저장할 공간으로 선택하며, 사용자별 또는 파일별 주 접속 위치에서 지리적으로 가장 먼 파일 서버를 원본 파일과 복제본 파일을 중에서 나머지 하나의 파일을 저장할 공간으로 선택할 수 있다.The control unit 160 controls various components included in the distributed file management apparatus 100. The control unit 160 manages various components included in the distributed file management apparatus 100 from among the first file server 170 to the nth file server 190, And controls the storage of the original file and the replica file, or updates the replica basis on the basis of the per-user usage information or the per-file usage information received from the file distribution processing unit 150, And controls the storage of the original file and the replica file on at least two or more file servers selected from the n-th file server (190). For example, a file server having the closest communication distance from the first file server 170 to the nth file server 190 at the main access location for each user or each file may be referred to as a space for storing any one of the original file and the replica file The user can select the file server which is the geographically farthest from the user or the main access point of the file as the space for storing the other file among the original file and the replica file.

도 3은 본 발명의 실시예에 따른 분산 파일 관리 장치에 의한 분산 파일 관리 방법을 예시적으로 설명하기 위한 흐름도이다. 도 3을 통해 본 발명의 두 가지 실시예를 살펴볼 수 있다.3 is a flowchart illustrating an exemplary distributed file management method by the distributed file management apparatus according to an embodiment of the present invention. Referring to FIG. 3, two embodiments of the present invention can be considered.

첫 번째 실시예에 따른 분산 파일 관리 방법은, 복수의 파일 서버에 저장된 원본 파일과 복제본 파일에 대해 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신하고, 생성 또는 갱신한 접속 이력 정보를 사용자별 또는 파일별로 데이터베이스화하여 저장하는 단계(S401 내지 S405)와, 누적된 접속 이력 정보에 의거하여 기 설정된 경로를 통해 모니터링 단말 또는 시스템 관리자에게 사용자별 사용 현황 정보 또는 파일별 사용 현황 정보를 전송하는 단계(도시 생략함)와, 기 설정된 복제 기준에 따라 복수의 파일 서버 중에서 적어도 2개 이상의 파일 서버를 선택하여 원본 파일과 복제본 파일을 분산 저장하는 단계(S411) 등을 포함한다.The distributed file management method according to the first embodiment is a method for managing connection information by checking connection regions for each user or each file with respect to an original file and a replica file stored in a plurality of file servers to generate or update connection history information, (S401 to S405) of storing the history information in a database for each user or for each file, and a step (S401 to S405) for storing the usage information for each user or the usage status for each file (Step S411) of selecting at least two file servers among a plurality of file servers in accordance with a predetermined copy criterion and distributing the original files and the replica files in a distributed manner.

두 번째 실시예에 따른 분산 파일 관리 방법은, 복수의 파일 서버에 저장된 원본 파일과 복제본 파일에 대해 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신하고, 생성 또는 갱신한 접속 이력 정보를 사용자별 또는 파일별로 데이터베이스화하여 저장하는 단계(S401 내지 S405)와, 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 의거해 갱신한 복제 기준에 따라 복수의 파일 서버 중에서 적어도 2개 이상의 파일 서버를 선택하여 원본 파일과 복제본 파일을 분산 저장하는 단계(S407 내지 S411) 등을 포함한다.The distributed file management method according to the second embodiment is a method for managing connection files by checking connection areas for each user or each file with respect to an original file and a replica file stored in a plurality of file servers to generate or update connection history information, (S401 to S405) of storing the history information in a database for each user or each file and storing the history information in a database by at least two or more Selecting a file server to distributively store the original file and the replica file (S407 to S411), and the like.

이하에서는 도 1 내지 도 3을 참조하여 본 발명의 실시예에 따른 파일 분산 장치에 의한 분산 파일 관리 과정에 대해 예시적으로 살펴보기로 한다.Hereinafter, a process of managing a distributed file by a file distributing apparatus according to an embodiment of the present invention will be described with reference to FIG. 1 to FIG.

먼저, 제어부(160)는 제 1 파일 서버(170) 내지 제 n 파일 서버(190) 중에서 초기 복제 기준에 따라 파일 서버를 선택하여 원본 파일과 복제본 파일에 대한 저장을 제어하며, 제 1 파일 서버(170) 내지 제 n 파일 서버(190) 중에서 해당 파일 서버는 제어부(160)의 제어에 따라 기 설정된 개수만큼의 복제본 파일과 원본 파일을 분산 저장한다(S401).First, the controller 160 selects a file server according to an initial replication criterion among the first to nth file servers 170 to 190, controls the storage of the original file and the replica file, 170 to n-th file server 190 distributes and stores a predetermined number of replica files and original files under the control of the controller 160 (S401).

접속 위치 확인부(130)는 제 1 파일 서버(170) 내지 제 n 파일 서버(190)에 저장된 원본 파일과 복제본 파일에 대해 각 사용자별 또는 파일별로 접속 지역을 확인(S403)하여 접속 이력 정보를 생성 또는 갱신한다. 예컨대, 제 1 파일 서버(170) 내지 제 n 파일 서버(190)의 설치 지역을 기준으로 하여 각 사용자별 또는 파일별로 주 접속 지역을 확인할 수 있다. 여기서, 접속 위치 확인부(130)는 기 설정 시간마다 접속 이력 정보를 리셋하여 삭제함으로써 비교적 최근에 발생한 파일 접속 상황이 접속 이력 정보에 반영되도록 할 수 있다. 아울러, 기 설정된 시간이 경과한 파일 접속 상황보다 비교적 최근에 발생한 파일 접속 상황에 가중치를 부여하여 비교적 최근에 발생한 파일 접속 상황이 더 많은 비중으로 접속 이력 정보에 반영되도록 할 수도 있다. 예컨대, 접속 지역을 확인하는 시간의 경과에 따라 변경된 가중치를 부여하여 주 접속 지역을 확인할 수 있다.The connection location confirmation unit 130 confirms the access area for each user or each file with respect to the original file and the replica file stored in the first file server 170 to the nth file server 190 at step S403, Create or update. For example, the main access area can be identified for each user or each file based on an installation area of the first file server 170 to the nth file server 190. Here, the connection location confirmation unit 130 may reset and delete the connection history information at the preset time so that the relatively recent file connection situation may be reflected in the connection history information. In addition, it is possible to assign a weight to a file access situation that occurred relatively recently than a file access state that has passed a predetermined time, so that a relatively recent file access situation may be reflected in the connection history information with a larger weight. For example, it is possible to identify the main access area by assigning changed weights according to the passage of time for confirming the access area.

그리고, 접속 이력 데이터베이스(140)는 접속 위치 확인부(130)가 생성 또는 갱신한 접속 이력 정보를 사용자별 또는 파일별로 데이터베이스화하여 저장한다(S405).Then, the connection history database 140 stores the connection history information created or updated by the connection location confirmation unit 130 in a database for each user or each file (S405).

이후, 파일 분산 처리부(150)는 기 설정된 복제 기준 갱신 조건이 만족(S407)할 경우, 예컨대 기 설정된 복제 기준 갱신을 위한 시간 주기가 도래한 경우에 접속 이력 데이터베이스(140)에 누적된 접속 이력 정보를 읽어 들여 기 설정된 경로를 통해 모니터링 단말, 시스템 관리자 또는 제어부(160)에게 사용자별 또는 파일별 사용 현황 정보를 전송한다. 예컨대, 파일에 대한 접근 횟수가 적거나 없는 심야 시간을 미리 설정하여 매일 설정된 시간이 도래하였을 때에 복제 기준 갱신 조건이 만족하는 것을 판정할 수 있다. 이로써, 시스템 관리자는 각 사용자별 또는 파일별로 사용 현황을 파악할 수 있으며, 이에 근거하여 원본 파일과 복제본 파일을 분산하여 저장하기 위한 복제 기준을 변경할 수 있다. 이러한 복제 기준의 수동 설정 과정은 도 3의 예시에서 도시를 생략하였다.When the predetermined replication reference update condition is satisfied (S407), the file distribution processing unit 150 updates the connection history information accumulated in the connection history database 140, for example, And transmits the usage status information for each user or file to the monitoring terminal, the system administrator or the control unit 160 through the predetermined path. For example, it is possible to determine that the replication criterion update condition is satisfied when a daytime time set in advance is set by setting a nighttime time in which the number of times of access to the file is small or not. As a result, the system administrator can grasp the usage status for each user or each file, and based on this, the replication standard for distributing and storing the original file and the replica file can be changed. The process of manually setting the copy criteria is omitted from the illustration of FIG.

그러면, 제어부(160)는 제 1 파일 서버(170) 내지 제 n 파일 서버(190) 중에서 시스템 관리자에 의해 기 설정된 복제 기준에 따라 파일 서버를 선택하여 원본 파일과 복제본 파일에 대한 저장을 제어한다.Then, the control unit 160 selects a file server among the first file server 170 to the nth file server 190 according to a replication criterion preset by the system administrator, and controls the storage of the original file and the replica file.

또는, 제어부(160)는 파일 분산 처리부(150)로부터 전달받은 사용자별 사용 현황 정보 또는 파일별 사용 현황 정보에 의거해 복제 기준을 갱신(S409)하여 제 1 파일 서버(170) 내지 제 n 파일 서버(190) 중에서 선택한 적어도 2개 이상의 파일 서버를 대상으로 하여 원본 파일과 복제본 파일에 대한 저장을 제어한다.Alternatively, the control unit 160 may update the copy criteria based on the usage status information or the usage status information for each file received from the file distribution processing unit 150 (S409) (190), and controls the storage of the original file and the replica file.

끝으로, 제 1 파일 서버(170) 내지 제 n 파일 서버(190) 중에서 해당 파일 서버는 제어부(160)의 제어에 따라 원본 파일 또는 복제본 파일을 분산 저장한다(S411). 예컨대, 제 1 파일 서버(170) 내지 제 n 파일 서버(190) 중에서 사용자별 또는 파일별 주 접속 위치에서 통신 거리가 가장 가까운 파일 서버를 원본 파일과 복제본 파일을 중에서 어느 하나의 파일을 저장하며, 사용자별 또는 파일별 주 접속 위치에서 지리적으로 가장 먼 파일 서버를 원본 파일과 복제본 파일을 중에서 나머지 하나의 파일을 저장할 수 있다.Finally, the file server among the first file server 170 to the nth file server 190 distributes the original file or the replica file under the control of the controller 160 (S411). For example, a file server having the closest communication distance from the first file server 170 to the nth file server 190 at the main access location for each user or each file may be stored as either an original file or a duplicate file, The file server that is most distant from the main access point by user or file can store the original file and the other one of the replicated files.

본 발명의 실시예는, 웹하드와 인터넷하드 등의 용어로 불리는 데이터 저장 서비스 서버와 이를 이용한 서비스 시스템 및 그 운용 방법, 네트워크를 통하여 가상화된 스토리지 자원을 사용자의 요구에 따라 제공하는 클라우드 스토리지 서버 와 이를 이용한 서비스 시스템 및 그 운용 방법, 복수의 IDC를 운영하는 것이 보편적인 유선 통신 또는 무선 통신 서비스 시스템과 그 서비스 방법 등과 같이 데이터 안정성 및 성능 향상을 위해 파일별로 복제본들을 여러 저장공간으로 분산하여 생성 및 관리하는 기술 분야에 이용할 수 있다.Embodiments of the present invention can be applied to a data storage service server called a web hard and an internet hard, a service system using the same, a cloud storage server that provides virtualized storage resources according to a user's demand, In order to improve data stability and performance such as general wired communication or wireless communication service system and its service method in which a plurality of IDCs are operated by using the service system and its operation method using the same, And can be used in the technical field to be managed.

100 : 분산 파일 관리 장치 110 : 파일 목록 관리부
120 : 파일 목록 데이터베이스 130 : 접속 위치 획인부
140 : 접속 이력 데이터베이스 150 : 파일 분산 처리부
160 : 제어부 170 : 제 1 파일 서버
171 : 제 1 파일 관리부 173 : 제 1 파일 데이터베이스
180 : 제 2 파일 서버 181 : 제 2 파일 관리부
183 : 제 2 파일 데이터베이스 190 : 제 n 파일 서버
191 : 제 n 파일 관리부 193 : 제 n 파일 데이터베이스
100: Distributed file management apparatus 110: File list management unit
120: file list database 130: connection location routine
140: connection history database 150: file distribution processor
160: control unit 170: first file server
171: First file management unit 173: First file database
180: second file server 181: second file manager
183: second file database 190: control file server
191: control file manager 193: control file database

Claims (20)

원본 파일과 복제본 파일을 분산 저장하는 복수의 파일 서버와,
상기 복수의 파일 서버에 저장된 상기 원본 파일과 상기 복제본 파일에 대해 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신하는 접속 위치 확인부와,
상기 접속 위치 확인부가 생성 또는 갱신한 상기 접속 이력 정보를 사용자별 또는 파일별로 데이터베이스화하여 기 설정 시간 동안 누적하여 저장하는 접속 이력 데이터베이스와,
상기 접속 이력 데이터베이스에 누적된 상기 접속 이력 정보를 읽어 들여 기 설정된 경로를 통해 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보를 전송하는 파일 분산 처리부와,
상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 의거해 설정된 복제 기준에 따라 상기 복수의 파일 서버 중에서 제1 파일 서버를 선택하여 원본 파일과 복제본 파일 중 어느 하나를 저장하며, 상기 제1 파일 서버와 지리적으로 가장 먼 제2 파일 서버를 선택하여 상기 나머지 하나를 저장하는 것을 제어하는 제어부를 포함하는
분산 파일 관리 장치.
A plurality of file servers for distributively storing original files and replica files,
A connection location confirmation unit for generating or updating the connection history information by checking the connection area for each user or each file with respect to the original file and the replica file stored in the plurality of file servers,
An access history database for storing the connection history information generated or updated by the connection location confirmation unit in a database for each user or each file,
A file distribution processing unit for reading the connection history information accumulated in the connection history database and transmitting usage environment information or usage status information for each user through the set path,
Selecting one of the plurality of file servers from among the plurality of file servers according to the copy criteria set based on the per-user use environment information or per-file usage status information to store either the original file or the replica file, And a controller for controlling the storage of the remaining one by selecting a second file server farthest from the first file server
Distributed file management device.
제 1 항에 있어서,
상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 통신 거리가 가장 가까운 파일 서버를 제1 파일 서버로 선택하는 분산 파일 관리 장치.
The method according to claim 1,
And selects a file server having the closest communication distance as a first file server at a user-specific or file-by-file primary access location according to the per-user usage environment information or per-file usage status information.
제 1 항에 있어서,
상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 지리적으로 가장 먼 파일 서버를 제1 파일 서버로 선택하는 분산 파일 관리 장치.
The method according to claim 1,
And selects a file server which is furthest from the geographical location of the user or the main access point by file according to the user environment information or the file usage information by file as the first file server.
제 1 항에 있어서,
상기 접속 위치 확인부는, 기 설정 시간마다 상기 접속 이력 정보를 리셋하는
분산 파일 관리 장치.
The method according to claim 1,
The connection location confirmation unit resets the connection history information every predetermined time
Distributed file management device.
제 1 항에 있어서,
상기 접속 위치 확인부는, 상기 접속 지역을 확인하는 시간의 경과에 따라 변경된 가중치를 부여하여 주 접속 지역을 확인하는
분산 파일 관리 장치.
The method according to claim 1,
The connection position confirmation unit may assign a changed weight to the main connection area according to an elapse of time for confirming the connection area
Distributed file management device.
삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 복수의 파일 서버에 저장된 원본 파일과 복제본 파일에 대해 각 사용자별 또는 파일별로 접속 지역을 확인하여 접속 이력 정보를 생성 또는 갱신하는 단계와,
생성 또는 갱신한 상기 접속 이력 정보를 사용자별 또는 파일별로 데이터베이스화하여 기 설정 시간 동안 누적하여 저장하는 단계와,
누적된 상기 접속 이력 정보를 읽어 들여 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보를 생성하는 단계와,
상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 의거해 설정된 복제 기준에 따라 상기 복수의 파일 서버 중에서 제1 파일 서버를 선택하여 원본 파일과 복제본 파일 중 어느 하나를 저장하며, 상기 제1 파일 서버와 지리적으로 거리가 가장 먼 제2 파일 서버를 선택하여 상기 나머지 하나를 저장하는 단계를 포함하는
분산 파일 관리 방법.
Generating or updating connection history information by checking connection regions for each user or each file with respect to original files and replica files stored in a plurality of file servers,
Accumulating and storing the connection history information created or updated in a database for each user or each file for a predetermined period of time;
Reading the accumulated connection history information to generate usage environment information for each user or usage status information for each file;
Selecting one of the plurality of file servers from among the plurality of file servers according to the copy criteria set based on the per-user use environment information or per-file usage status information to store either the original file or the replica file, And selecting the second file server that is the closest to the geographically distant one and storing the remaining one
How to manage distributed files.
제 16 항에 있어서,
상기 저장하는 단계에서, 상기 복수의 파일 서버 중에서 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 통신 거리가 가장 가까운 파일 서버를 제1 파일 서버로 선택하여 상기 원본 파일과 복제본 파일 중 어느 하나를 저장하는 분산 파일 관리 방법.
17. The method of claim 16,
Wherein the file server having the closest communication distance is selected as the first file server from the plurality of file servers according to the per-user usage environment information or the per-file usage status information, And storing the original file and the replica file.
제 16 항에 있어서,
상기 저장하는 단계에서, 상기 복수의 파일 서버 중에서 상기 사용자별 사용 환경 정보 또는 파일별 사용 현황 정보에 따른 사용자별 또는 파일별 주 접속 위치에서 지리적으로 가장 먼 파일 서버를 제1 파일 서버로 선택하여 상기 원본 파일과 복제본 파일 중 어느 하나를 저장하는 분산 파일 관리 방법.
17. The method of claim 16,
Selecting a first file server as a first file server which is furthest from the plurality of file servers in a user-specific or main access point for each file according to the per-user usage environment information or per-file usage status information, A distributed file management method for storing either a source file or a replica file.
제 16 항에 있어서,
상기 접속 이력 정보를 생성 또는 갱신하는 단계는, 기 설정 시간마다 상기 접속 이력 정보를 리셋하는
분산 파일 관리 방법.
17. The method of claim 16,
Wherein the step of generating or updating the connection history information comprises the steps of:
How to manage distributed files.
제 16 항에 있어서,
상기 접속 이력 정보를 생성 또는 갱신하는 단계는, 상기 접속 지역을 확인하는 시간의 경과에 따라 변경된 가중치를 부여하여 주 접속 지역을 확인하는
분산 파일 관리 방법.
17. The method of claim 16,
The step of generating or updating the connection history information may further include the step of assigning a changed weight to the main connection area according to an elapse of time for confirming the connection area
How to manage distributed files.
KR1020100073475A 2010-07-29 2010-07-29 Distributed file management apparatus and method KR101527058B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100073475A KR101527058B1 (en) 2010-07-29 2010-07-29 Distributed file management apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100073475A KR101527058B1 (en) 2010-07-29 2010-07-29 Distributed file management apparatus and method

Publications (2)

Publication Number Publication Date
KR20120011574A KR20120011574A (en) 2012-02-08
KR101527058B1 true KR101527058B1 (en) 2015-06-09

Family

ID=45835772

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100073475A KR101527058B1 (en) 2010-07-29 2010-07-29 Distributed file management apparatus and method

Country Status (1)

Country Link
KR (1) KR101527058B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102267132B1 (en) * 2013-09-13 2021-06-21 유니콤 시스템스, 인코포레이티드. Distributed data system with document management and access control
US20170140358A1 (en) * 2015-11-18 2017-05-18 Andrew Orrock Network Bridge for Local Transaction Authorization
CN109087107B (en) * 2018-07-04 2020-11-17 恒生电子股份有限公司 Real-time monitoring method and system based on distributed memory database and electronic equipment

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090061517A (en) * 2007-12-11 2009-06-16 한국전자통신연구원 System and method for updating file
KR20100072770A (en) * 2008-12-22 2010-07-01 한국전자통신연구원 Hot data management based on hit counter from data servers in parallelism

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090061517A (en) * 2007-12-11 2009-06-16 한국전자통신연구원 System and method for updating file
KR20100072770A (en) * 2008-12-22 2010-07-01 한국전자통신연구원 Hot data management based on hit counter from data servers in parallelism

Also Published As

Publication number Publication date
KR20120011574A (en) 2012-02-08

Similar Documents

Publication Publication Date Title
US9697091B2 (en) System and method for datacenters disaster recovery
CN108287669B (en) Date storage method, device and storage medium
US8832234B1 (en) Distributed data storage controller
US8918392B1 (en) Data storage mapping and management
US11314444B1 (en) Environment-sensitive distributed data management
JP4265245B2 (en) Computer system
US8930364B1 (en) Intelligent data integration
US20130290361A1 (en) Multi-geography cloud storage
WO2018201103A1 (en) Iterative object scanning for information lifecycle management
AU2015221548A1 (en) A computer implemented method for dynamic sharding
KR20120116774A (en) Replication server apparatus and method for creating replica in distribution storage system
CN102938784A (en) Method and system used for data storage and used in distributed storage system
KR20120116773A (en) Replication server apparatus and method for creating replica of chunk in distribution storage system
CN103607424A (en) Server connection method and server system
CN103475721A (en) System for updating digital assets and method thereof
KR101662173B1 (en) Distributed file management apparatus and method
KR101527058B1 (en) Distributed file management apparatus and method
JP7347007B2 (en) Information processing device, information processing system, and information processing program
KR101666064B1 (en) Apparatus for managing data by using url information in a distributed file system and method thereof
CN108200169A (en) A kind of first Placement Strategy control method of the copy of cloud storage system
EP3635529B1 (en) Deduplicating distributed erasure coded objects
CN108363727A (en) A kind of date storage method and device based on ZFS file system
CN109558082B (en) Distributed file system
US9626377B1 (en) Cluster file system with metadata server for controlling movement of data between storage tiers
US10884648B2 (en) Temporary relocation of data within local storage of a dispersed storage network

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180530

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190521

Year of fee payment: 5