KR20210083007A - Cloud storage system and method of generating contents metadata in the cloud storage system - Google Patents

Cloud storage system and method of generating contents metadata in the cloud storage system Download PDF

Info

Publication number
KR20210083007A
KR20210083007A KR1020190175558A KR20190175558A KR20210083007A KR 20210083007 A KR20210083007 A KR 20210083007A KR 1020190175558 A KR1020190175558 A KR 1020190175558A KR 20190175558 A KR20190175558 A KR 20190175558A KR 20210083007 A KR20210083007 A KR 20210083007A
Authority
KR
South Korea
Prior art keywords
file
metadata
information
server
relay server
Prior art date
Application number
KR1020190175558A
Other languages
Korean (ko)
Inventor
정태윤
박판종
김태형
박종수
Original Assignee
강릉원주대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 강릉원주대학교산학협력단 filed Critical 강릉원주대학교산학협력단
Priority to KR1020190175558A priority Critical patent/KR20210083007A/en
Publication of KR20210083007A publication Critical patent/KR20210083007A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/113Details of archiving
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/188Virtual file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to a cloud storage system. The cloud storage system includes: a relay server, when a file is uploaded from an external client terminal, requesting a virtual file system to create an index for the uploaded file; the virtual file system generating and storing first metadata which is file attribute information about the uploaded file in accordance with the request from the relay server, and extracting index information which is unique file identification information from the first metadata to transmit the same to the relay server; a file storage server including a cloud file storage to store the file provided from the relay server in the cloud file storage, providing storage position information to the relay server, and extracting second metadata which is content attribute information about the stored file to provide the same to the relay server; and a metadata server receiving, storing, and managing the index information about the file and the second metadata from the relay server. Therefore, the present invention is capable of enabling a search for an unstructured file as well as a structured file.

Description

클라우드 스토리지 시스템 및 상기 시스템에서의 비정형 데이터에 대한 메타데이터 생성 방법{Cloud storage system and method of generating contents metadata in the cloud storage system}Cloud storage system and method of generating contents metadata in the cloud storage system

본 발명은 클라우드 스토리지 시스템 및 상기 시스템에서의 비정형 데이터에 대한 메타데이터 생성 방법에 관한 것으로서, 더욱 구체적으로는 클라우드 스토리지 시스템에 저장되는 정형 데이터 파일뿐 만 아니라 비정형 데이터 파일들의 컨텐츠에 대한 메타데이터를 생성하여 제공함으로써 컨텐츠에 대한 다양한 검색을 가능하도록 하는 클라우드 스토리지 시스템 및 메타데이터 생성 방법에 관한 것이다. The present invention relates to a cloud storage system and a method for generating metadata for unstructured data in the system, and more particularly, to a structured data file stored in a cloud storage system as well as metadata for content of unstructured data files. to a cloud storage system and a method for generating metadata that enable various searches for content by providing

IoT 기술이 발달하고 디바이스의 종류가 다양해짐에 따라 각 디바이스로부터 발생되는 데이터의 종류도 다양해지고 있는 실정이며, 이러한 데이터를 처리하는데 있어서, 각 데이터에 대한 메타데이터(metadata)는 중요한 지표가 되고 있다. As IoT technology develops and types of devices become diversified, the types of data generated from each device are also diversifying, and in processing such data, metadata for each data is an important indicator. .

속성 정보라고도 불리우는 메타데이터는 대량으로 존재하고 있는 정보들 사이에서 찾고자 하는 정보를 효율적으로 찾아내기 위해서, 일정한 규칙에 의거하여 컨텐츠에 부여해주는 데이터이다. 이렇게 부여되는 메타데이터로는 컨텐츠를 작성하는 작성자, 이용조건, 이용내력, 권리조건, 컨텐츠의 위치와 내용 등이 포함된다. Metadata, also called attribute information, is data that is given to content according to a certain rule in order to efficiently find information to be found among information that exists in a large amount. The metadata provided in this way includes the creator of the content, conditions of use, history of use, rights conditions, location and content of the content, and the like.

한편, 일반적인 파일들은 각 파일 속성에 따라 설정된 메타데이터들을 가지고 있기는 하지만, 그 속성들이 상이하고 메타데이터들이 충분하지 못한 경우가 많이 발생한다. 특히, 비정형 파일들은 파일 속성이 명확하지 않기 때문에, 메타데이터들을 충분하게 제공하지 못하게 된다. On the other hand, although general files have metadata set according to each file property, the properties are different and the metadata is insufficient in many cases. In particular, unstructured files do not sufficiently provide metadata because file attributes are not clear.

한국공개특허공보 제 10-2015-0048260호Korean Patent Publication No. 10-2015-0048260 한국공개특허공보 제 10-2009-0037704호Korean Patent Laid-Open Publication No. 10-2009-0037704 한국등록특허공보 제 10-1285654호Korean Patent Publication No. 10-1285654

전술한 문제점을 해결하기 위한 본 발명의 목적은, 클라우드 스토리지 상에 업로드된 비정형 데이터 파일들에 대한 컨텐츠를 분석하여 컨텐츠 기반의 메타데이터를 생성하고 관리할 수 있도록 하는 컨텐츠 기반의 메타데이터를 생성 및 관리하는 클라우드 스토리지 시스템을 제공하는 것이다. SUMMARY OF THE INVENTION An object of the present invention for solving the above-described problems is to generate and manage content-based metadata by analyzing content for unstructured data files uploaded to cloud storage to create and manage content-based metadata. To provide a managed cloud storage system.

또한 본 발명의 다른 목적은, 비정형 데이터에 대하여 컨텐츠 기반의 메타데이터를 생성할 수 있도록 하는 메타데이터 생성 방법을 제공하는 것이다. Another object of the present invention is to provide a metadata generating method that enables content-based metadata to be generated with respect to unstructured data.

전술한 기술적 과제를 달성하기 위한 본 발명의 제1 특징에 따른 클라우드 스토리지 시스템은, 외부의 클라이언트 단말기로부터 파일이 업로드되면, 가상 파일 시스템으로 상기 업로드된 파일에 대한 인덱스 생성을 요청하는 중계 서버; 상기 중계 서버로부터의 요청에 따라 상기 업로드된 파일에 대한 파일 속성 정보인 제1 메타데이터를 생성하여 저장하고, 제1 메타데이터로부터 파일 고유 식별 정보인 인덱스 정보를 추출하여 상기 중계 서버에게 전송하는 가상 파일 시스템; 클라우드 파일 저장소를 구비하여 상기 중계 서버로부터 제공된 파일을 상기 클라우드 파일 저장소에 저장하고, 저장 위치 정보를 상기 중계 서버로 제공하며, 저장된 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 추출하여 상기 중계 서버로 제공하는 파일 저장 서버; 및 상기 중계 서버로부터 파일에 대한 인덱스 정보 및 제2 메타데이터를 제공받아 저장 및 관리하는 메타데이터 서버;를 구비하고, According to a first aspect of the present invention, there is provided a cloud storage system, comprising: a relay server that requests index creation for the uploaded file to a virtual file system when a file is uploaded from an external client terminal; In response to a request from the relay server, first metadata that is file attribute information for the uploaded file is generated and stored, and index information that is file unique identification information is extracted from the first metadata and transmitted to the relay server. file system; A cloud file storage is provided to store the file provided from the relay server in the cloud file storage, the storage location information is provided to the relay server, and second metadata that is content attribute information for the stored file is extracted to the relay server. File storage server provided by; and a metadata server that receives, stores, and manages index information and second metadata on a file from the relay server;

상기 중계 서버는, 가상 파일 시스템으로부터 파일에 대한 인덱스 정보를 제공받고, 상기 인덱스 정보와 함께 해당 파일을 상기 파일 저장 서버로 제공하여 저장하고, 파일 저장 서버로부터 파일에 대한 파일 저장 위치 정보 및 제2 메타데이터를 제공받고, 파일에 대한 인덱스 정보 및 제2 메타데이터를 상기 메타데이터 서버에 제공하여 저장 및 관리한다. The relay server receives index information on a file from the virtual file system, provides and stores the file together with the index information to the file storage server, and stores the file storage location information and the second information on the file from the file storage server. The metadata is provided, and index information and second metadata for the file are provided to the metadata server, and stored and managed.

본 발명의 제1 특징에 따른 클라우드 스토리지 시스템에 있어서, 상기 파일 저장 서버는 제2 메타데이터 생성부를 더 구비하고, In the cloud storage system according to the first aspect of the present invention, the file storage server further comprises a second metadata generator,

상기 제2 메타데이터 생성부는, 상기 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)로부터 파일 시그너처(File Signature)를 추출하고, 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 추출하고, 상기 파일의 카테고리에 따라 사전 설정된 방법에 따라 제2 메타데이터를 획득하여 상기 중계 서버로 제공하는 것이 바람직하다. The second metadata generating unit extracts a file signature from a binary file for a file stored in the cloud file storage, extracts information about a file category from the file signature, and the file Preferably, the second metadata is obtained according to a preset method according to the category of , and provided to the relay server.

본 발명의 제1 특징에 따른 클라우드 스토리지 시스템에 있어서, 상기 제2 메타데이터 생성부는, 상기 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)을 판독하여 파일 시그너처(File Signature)를 추출하고, 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 검출하는 파일 카테고리 검출 모듈; 및 파일의 카테코리에 대한 정보에 따라 사전 설정된 모듈을 이용하여 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 획득하고, 획득된 제2 메타데이터를 저장하고 상기 중계 서버로 제공하는 제2 메타데이터 획득 모듈;을 구비하고, In the cloud storage system according to the first aspect of the present invention, the second metadata generator reads a binary file for a file stored in the cloud file storage and extracts a file signature, a file category detection module for detecting information on a category of a file from the file signature; and acquiring second metadata, which is content attribute information for the file, using a preset module according to the information on the category of the file, storing the obtained second metadata, and providing second metadata to the relay server module; and

상기 제2 메타데이터 획득 모듈은, 이미지 파일에 대한 제2 메타 데이터를 획득하여 제공하는 이미지 인식 모듈; 텍스트 파일에 대한 제2 메타 데이터를 획득하여 제공하는 텍스트 인식 모듈; 의료 데이터 파일에 대한 제2 메타 데이터를 획득하여 제공하는 의료 데이터 인식 모듈; 파일의 형식을 정상적으로 인식할 수 없는 파일에 대하여 데이터 구조 형식을 분석하여 제2 메타 데이터를 획득하여 제공하는 범용 인식 모듈;을 구비하는 것이 바람직하다. The second metadata acquisition module may include: an image recognition module for acquiring and providing second metadata for an image file; a text recognition module that obtains and provides second metadata for the text file; a medical data recognition module that obtains and provides second metadata for the medical data file; It is preferable to include a general-purpose recognition module that obtains and provides second metadata by analyzing a data structure format for a file whose format cannot be recognized normally.

본 발명의 제1 특징에 따른 클라우드 스토리지 시스템에 있어서, 상기 이미지 인식 모듈은 CNN(Convolution Neural Network) 알고리즘을 기반으로 학습하여 구성된 모듈로서, 상기 이미지 인식 모듈에 의한 제2 메타데이터는 적어도 이미지 파일에 포함된 오브젝트에 대한 정보를 포함하는 것이 바람직하다. In the cloud storage system according to the first aspect of the present invention, the image recognition module is a module configured by learning based on a CNN (Convolution Neural Network) algorithm, and the second metadata by the image recognition module is at least in an image file. It is desirable to include information about the included object.

본 발명의 제1 특징에 따른 클라우드 스토리지 시스템에 있어서, 상기 텍스트 인식 모듈은 적어도 텍스트 파일에 포함된 단어 및 문장 정보를 검출하여 제2 메타데이터로 제공하는 것이 바람직하다. In the cloud storage system according to the first aspect of the present invention, it is preferable that the text recognition module detects at least word and sentence information included in a text file and provides it as second metadata.

본 발명의 제1 특징에 따른 클라우드 스토리지 시스템에 있어서, 상기 중계 서버는, 상기 클라이언트 단말로부터 검색 조건 정보가 입력되고 검색이 요청되면, In the cloud storage system according to the first aspect of the present invention, in the relay server, when search condition information is input from the client terminal and a search is requested,

상기 입력된 검색 조건 정보를 분석하고, 상기 검색 조건 정보가 파일의 속성 정보인 제1 메타 데이터에 관한 것이면, VFS로 검색 요청하고, 상기 검색 조건 정보가 파일의 컨텐츠 속성 정보인 제2 메타데이터에 관한 것이면, 메타데이터 서버로 검색 요청하고, 검색 요청에 따라 인덱스 정보를 포함하는 결과 정보가 수신되면, 해당 인덱스 정보에 대응되는 파일을 파일 저장 서버로부터 제공받아 클라이언트 단말로 제공하는 것이 바람직하다. The input search condition information is analyzed, and if the search condition information relates to first metadata that is attribute information of a file, a VFS search is requested, and the search condition information is added to the second metadata that is content attribute information of the file. In this case, it is preferable that a search request is made to the metadata server, and when result information including index information is received according to the search request, a file corresponding to the index information is provided from the file storage server and provided to the client terminal.

본 발명의 제2 특징에 따른 메타데이터 생성 방법은, 중계 서버, 가상 파일 시스템, 파일 저장 서버 및 메타데이터 서버를 포함하는 클라우드 스토리지 시스템에 있어서의 파일 저장 서버에 의한 메타데이터 생성 방법에 관한 것으로서, (a) 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)을 판독하여 파일 시그너처(File Signature)를 추출하는 단계; (b) 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 검출하는 단계; (c) 파일의 카테코리에 대한 정보에 따라 사전 설정된 모듈을 이용하여 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 획득하는 단계; 및 (d) 상기 획득된 제2 메타데이터를 저장하고 상기 중계 서버로 제공하는 단계;를 구비하여, 클라우드 파일 저장소에 저장된 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 생성하여 제공한다. A method for generating metadata according to a second aspect of the present invention relates to a method for generating metadata by a file storage server in a cloud storage system including a relay server, a virtual file system, a file storage server, and a metadata server, (a) extracting a file signature (File Signature) by reading a binary file (Binary File) for a file stored in the cloud file storage; (b) detecting information on a category of a file from the file signature; (c) acquiring second metadata, which is content attribute information for the file, using a preset module according to the information on the category of the file; and (d) storing the obtained second metadata and providing the obtained second metadata to the relay server.

본 발명의 제2 특징에 따른 메타데이터 생성 방법에 있어서, 상기 (c) 단계는, 파일의 카테고리가 이미지 파일이면, 이미지에 포함된 오브젝트의 종류를 판별하고 적어도 오브젝트에 대한 정보를 제2 메타데이터로 제공하며, 파일의 카테고리가 텍스트 파일이면, 텍스트 파일에 포함된 단어 및 문장을 추출하고, 적어도 단어 및 문장에 대한 정보를 제2 메타데이터로 제공하며, 파일의 카테고리가 의료 데이터이면, 의료 데이터에 포함된 촬영 정보 및 환자 정보를 추출하고 적어도 환자 정보를 제2 메타데이터로 제공하는 것이 바람직하다. In the method of generating metadata according to the second aspect of the present invention, in step (c), if the category of the file is an image file, the type of object included in the image is determined and at least information about the object is included in the second metadata and, if the category of the file is a text file, extracts words and sentences included in the text file, and provides at least information about the words and sentences as second metadata, and if the category of the file is medical data, medical data It is preferable to extract the imaging information and the patient information included in the , and provide at least the patient information as the second metadata.

본 발명에 따른 클라우드 스토리지 시스템은 파일에 대한 파일 속성 정보인 제1 메타데이터 및 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 생성하여 제공함으로써, 정형 파일뿐만 아니라 비정형 파일에 대한 검색도 가능할 수 있게 된다. The cloud storage system according to the present invention generates and provides first metadata, which is file attribute information for a file, and second metadata, which is content attribute information for a file, so that not only regular files but also non-standard files can be searched. do.

또한, 본 발명에 따른 클라우드 스토리지 시스템은 파일 시그너처 추출을 통해 파일의 카테고리를 파악하고, 파일의 카테고리에 대응되는 방법을 이용하여 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 생성하여 제공함으로써, 파일의 컨텐츠 속성 정보를 정확하게 추출할 수 있게 된다.In addition, the cloud storage system according to the present invention identifies a category of a file through file signature extraction, and generates and provides second metadata that is content attribute information for a file using a method corresponding to the category of the file, thereby providing a file. It is possible to accurately extract the content attribute information of

도 1은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템을 전체적으로 도시한 구성도이다.
도 2는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 가상 파일 시스템의 파일시스템 데이터베이스를 도시한 구성도이다.
도 3은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일 저장 서버의 구성을 개략적으로 도시한 블록도이다.
도 4은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 메타데이터 서버(40)에 저장되는 파일의 컨텐츠에 대한 제2 메타데이터들을 예시적으로 도시한 도표이다.
도 5는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일에 대한 이진 데이터 파일을 예시적으로 도시한 것이다.
도 6는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 이미지 인식 모듈을 개략적으로 도시한 구성도이다.
도 7은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 텍스트 인식 모듈을 개략적으로 도시한 구성도이다.
도 8은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 의료 데이터 인식 모듈을 개략적으로 도시한 구성도이다.
도 9은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 의료 영상 데이터 파일(DICOM FILE) 및 이로부터 획득될 수 있는 제2 메타데이터들을 예시적으로 도시한 것이다.
도 10는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 범용 인식 모듈을 개략적으로 도시한 구성도이다.
도 11은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일 검색 및 다운로드 과정을 순차적으로 도시한 시스템 흐름도이다.
1 is a configuration diagram illustrating a cloud storage system according to a preferred embodiment of the present invention as a whole.
2 is a block diagram illustrating a file system database of a virtual file system in a cloud storage system according to a preferred embodiment of the present invention.
3 is a block diagram schematically illustrating a configuration of a file storage server in a cloud storage system according to a preferred embodiment of the present invention.
4 is a diagram exemplarily showing second metadata for the contents of a file stored in the metadata server 40 in the cloud storage system according to the preferred embodiment of the present invention.
5 exemplarily shows a binary data file for a file in a cloud storage system according to a preferred embodiment of the present invention.
6 is a configuration diagram schematically illustrating an image recognition module in a cloud storage system according to a preferred embodiment of the present invention.
7 is a configuration diagram schematically illustrating a text recognition module in a cloud storage system according to a preferred embodiment of the present invention.
8 is a configuration diagram schematically illustrating a medical data recognition module in a cloud storage system according to a preferred embodiment of the present invention.
9 exemplarily illustrates a medical image data file (DICOM FILE) and second metadata obtainable therefrom in a cloud storage system according to a preferred embodiment of the present invention.
10 is a configuration diagram schematically illustrating a general-purpose recognition module in a cloud storage system according to a preferred embodiment of the present invention.
11 is a system flow diagram sequentially illustrating a file search and download process in a cloud storage system according to a preferred embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 따른 파일 및 파일의 컨텐츠에 대한 메타 데이터들을 생성 및 관리할 수 있도록 하는 클라우드 스토리지 시스템의 구조 및 상기 시스템에서의 제1 및 제2 메타 데이터 생성 및 관리 방법에 대하여 구체적으로 설명한다. Hereinafter, with reference to the accompanying drawings, a structure of a cloud storage system for generating and managing metadata for files and file contents according to a preferred embodiment of the present invention and first and second metadata in the system The creation and management method will be described in detail.

도 1은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템을 전체적으로 도시한 구성도이다. 도 1을 참조하면, 본 발명에 따른 클라우드 스토리지 시스템(1)은, 중계 서버(Resource Broker ; 'RB', 10), 가상 파일 시스템(Virtual File System; 'VFS', 20), 파일 저장 서버(Storage Element; 'SE', 30) 및 메타데이터 서버(Metadata Server; 'MS', 40)를 구비하며, 외부의 클라이언트 단말(2)로부터 파일이 업로드되면 권한 등을 체크하여 클라우드 파일 저장소(32)에 저장 및 관리하고, 클라이언트 단말(2)로부터 특정 파일이 요청되면 해당 파일을 검색하여 클라이언트 단말에게 제공할 뿐만 아니라, 외부의 클라이언트 단말들에게 다양한 검색 서비스를 제공한다. 이하, 전술한 본 발명에 따른 클라우드 스토리지 시스템을 구성하는 각 구성 요소들에 대하여 보다 구체적으로 설명한다. 1 is a configuration diagram illustrating a cloud storage system according to a preferred embodiment of the present invention as a whole. 1, the cloud storage system 1 according to the present invention, a relay server (Resource Broker; 'RB', 10), a virtual file system (Virtual File System; 'VFS', 20), a file storage server ( Storage Element; 'SE', 30) and a metadata server (Metadata Server; 'MS', 40), and when a file is uploaded from an external client terminal 2, permission is checked and the cloud file storage 32 is stored and managed in the , and when a specific file is requested from the client terminal 2, the file is retrieved and provided to the client terminal, and various search services are provided to external client terminals. Hereinafter, each component constituting the cloud storage system according to the present invention will be described in more detail.

상기 중계 서버(10)는 상기 가상 파일 시스템(20), 상기 파일 저장 서버(30) 및 상기 메타데이터 서버(40)를 서로 연결하는 창구 역할을 하는 서버로서, 외부의 클라이언트 단말로부터의 요청을 직접 전달받고 VFS, 파일 저장 서버, 메타데이터 서버들과의 통신을 통해 클라이언트 단말의 요청들에 응답하도록 구성된다. 본 발명에 따른 각 서버들과 단말들은 기본적인 통신 프로토콜인 HTTP(Hyper Text Transfer Protocol)을 사용하는 API(Application Programming Interface)로 설계되는 것이 바람직하다. The relay server 10 is a server serving as a window for connecting the virtual file system 20, the file storage server 30, and the metadata server 40 to each other, and directly receives a request from an external client terminal. It is configured to receive and respond to requests from client terminals through communication with VFS, file storage servers, and metadata servers. Each of the servers and terminals according to the present invention is preferably designed as an API (Application Programming Interface) using HTTP (Hyper Text Transfer Protocol), which is a basic communication protocol.

본 발명에 따른 클라우드 스토리지 시스템은, 상기 중계 서버를 통해, 클라이언트 단말들에게 파일 업로드 기능, 파일 검색 기능 및 파일 다운로드 기능을 제공하게 된다. 상기 파일 업로드 기능은, 클라이언트 단말로부터 상기 중계 서버로 파일이 업로드되면, 업로드된 파일의 속성 정보들을 포함하는 제1 메타데이터가 생성되어 상기 VFS에 저장되고, 상기 업로드된 파일은 파일 저장 서버의 클라우드 파일 저장소에 저장되고, 상기 업로드된 파일의 컨텐츠에 대한 정보들을 포함하는 제2 메타데이터는 상기 메타데이터 서버에 저장된다. 상기 파일 다운로드 기능은, 상기 중계 서버로 클라이언트 단말로부터 특정 파일의 다운로드가 요청되면, VFS의 제1 메타데이터 및 인덱스 정보를 확인하고, 상기 파일 저장 서버의 클라우드 파일 저장소로부터 해당 파일을 획득하여 클라이언트 단말로 다운로드시키게 된다. 상기 파일 검색 기능은, 클라이언트 단말로부터 입력된 검색 정보를 분석하여, 제1 메타 데이터 및 제2 메타데이터를 검색하여 검색 결과 정보를 제공하게 된다. 이들 각 기능에 대한 구체적인 설명은 후술한다. The cloud storage system according to the present invention provides a file upload function, a file search function, and a file download function to client terminals through the relay server. In the file upload function, when a file is uploaded from the client terminal to the relay server, first metadata including attribute information of the uploaded file is generated and stored in the VFS, and the uploaded file is stored in the cloud of the file storage server. The second metadata stored in the file storage and including information on the contents of the uploaded file is stored in the metadata server. The file download function, when a download of a specific file is requested from the client terminal to the relay server, checks the first metadata and index information of the VFS, and obtains the file from the cloud file storage of the file storage server to the client terminal will be downloaded to The file search function analyzes search information input from the client terminal, searches the first metadata and the second metadata, and provides search result information. A detailed description of each of these functions will be described later.

상기 가상 파일 시스템(Virtual File System; 'VFS', 20)은, 상기 중계 서버로부터의 요청에 따라 상기 업로드된 파일에 대한 제1 메타데이터를 생성하여 파일시스템 데이터베이스(File System Database)에 저장하고, 상기 제1 메타 데이터들 중 파일 식별 정보인 인덱스 정보를 상기 중계 서버로 제공한다. 상기 제1 메타데이터는 UUID(Universally Unique IDentifier), 파일 이름, 경로, 업로드를 시도하는 사용자 정보, 접근 권한 정보, 그룹 접근 권한 정보, 파일 생성일자 정보, 파일 크기 정보를 포함한다. 도 2는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 가상 파일 시스템의 파일시스템 데이터베이스를 도시한 구성도이다. 도 2를 참조하면, 상기 VFS의 파일시스템 데이터베이스에는 각 파일들에 대하여 UUID를 기준으로 하여 해당 파일에 대한 속성 정보인 제1 메타데이터들이 저장된다. 한편, 상기 인덱스 정보는 파일을 식별할 수 있는 정보로서, 제1 메타데이터들 중 PID, ID 및 UUID로 이루어진다. 여기서, ID는 가상 파일 시스템에서 유일하게 존재하는 식별자로서, 절대 중복되지 않는 해당 가상 파일 폴더에 대한 고유의 식별자이다. PID는 Parent ID로서, 상위 상관관계를 갖는 ID이며, PID 값이 null이 있는 경우는 최상위 경로를 제외하면 존재하지 않는다. UUID는 실제 파일 데이터에 대한 유일한 식별자로서, 동일한 파일을 여러 번 업로드하더라도 같지 않으며 업로드하는 순간에 생성되며, 업로드하는 순간 해당 파일에 대한 유일한 식별자로 실제로 파일이 저장되는 스토리지에 해당 UUID로 파일이 저장된다. The virtual file system (Virtual File System; 'VFS', 20) generates first metadata for the uploaded file according to a request from the relay server and stores it in a file system database, Index information that is file identification information among the first meta data is provided to the relay server. The first metadata includes a Universally Unique IDentifier (UUID), a file name, a path, user information attempting to upload, access right information, group access right information, file creation date information, and file size information. 2 is a block diagram illustrating a file system database of a virtual file system in a cloud storage system according to a preferred embodiment of the present invention. Referring to FIG. 2 , in the file system database of the VFS, first metadata, which is attribute information for each file, is stored on the basis of a UUID for each file. Meanwhile, the index information is information for identifying a file, and includes a PID, an ID, and a UUID among the first metadata. Here, the ID is a unique identifier in the virtual file system, and is a unique identifier for the virtual file folder that is never duplicated. The PID is a Parent ID, which is an ID having a higher correlation. If the PID value is null, it does not exist except for the top-level path. UUID is a unique identifier for the actual file data, even if the same file is uploaded multiple times, it is not the same and is created at the moment of upload. do.

도 3은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일 저장 서버의 구성을 개략적으로 도시한 블록도이다. 도 3을 참조하면, 상기 파일 저장 서버(30)는 클라우드 파일 저장소(32)를 구비하여 상기 중계 서버로부터 제공된 파일을 인덱스 정보와 함께 상기 클라우드 파일 저장소에 저장하고, 해당 파일에 대한 저장 위치 정보를 상기 중계 서버로 제공한다. 또한, 상기 파일 저장 서버(30)는 제2 메타데이터 생성부(34)를 더 구비하며, 상기 제2 메타데이터 생성부(34)는, 클라우드 파일 저장소에 저장된 파일에 대한 컨텐츠를 분석하여 파일의 컨텐츠에 대한 제2 메타데이터를 추출하고, 파일에 대한 인덱스 정보와 함께 상기 제2 메타데이터를 상기 중계 서버로 제공한다. 한편, 상기 중계 서버는 파일 저장 서버로부터 파일에 대한 인덱스 정보와 제2 메타데이터가 수신되면, 메타데이터 서버(40)로 제공하여 제2 메타데이터들을 갱신하게 된다. 3 is a block diagram schematically illustrating a configuration of a file storage server in a cloud storage system according to a preferred embodiment of the present invention. Referring to FIG. 3 , the file storage server 30 includes a cloud file storage 32 to store a file provided from the relay server together with index information in the cloud file storage, and store location information for the file. provided to the relay server. In addition, the file storage server 30 further includes a second metadata generation unit 34, and the second metadata generation unit 34 analyzes the contents of the files stored in the cloud file storage to The second metadata for the content is extracted, and the second metadata together with the index information for the file is provided to the relay server. On the other hand, when the relay server receives index information and second metadata for a file from the file storage server, the relay server updates the second metadata by providing it to the metadata server 40 .

상기 메타데이터 서버(40)는 상기 중계 서버로부터 파일에 대한 인덱스 정보와 제2 메타데이터를 제공받아 저장 및 관리한다. 도 4은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 메타데이터 서버(40)에 저장되는 파일의 컨텐츠에 대한 제2 메타데이터들을 예시적으로 도시한 도표이다. 도 4을 참조하면, 제2 메타데이터는 파일의 컨텐츠에 대한 속성 정보들로써, 파일의 카테고리에 따라 다양하게 설정될 수 있다. The metadata server 40 receives, stores and manages the index information and second metadata on the file from the relay server. 4 is a diagram exemplarily showing second metadata for the contents of a file stored in the metadata server 40 in the cloud storage system according to the preferred embodiment of the present invention. Referring to FIG. 4 , the second metadata is attribute information on the contents of a file, and may be set in various ways according to the category of the file.

도 3을 참조하면, 상기 파일 저장 서버의 상기 제2 메타데이터 생성부는, 파일 카테고리 검출 모듈(340) 및 제2 메타데이터 획득 모듈(350)을 구비한다. 상기 파일 카테고리 검출 모듈(340)은, 상기 클라우드 파일 저장소에 저장된 파일에 대한 이진 데이터 파일(Binary File)로부터 파일 시그너처(File Signature)를 추출하고, 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 검출한다. 도 5는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일에 대한 이진 데이터 파일을 예시적으로 도시한 것이다. 도 5에 있어서, (a)는 PDF 파일에 대한 이진 데이터 파일의 헤더(Header)의 일부이며, (b)는 의료데이터파일인 DCM 파일에 대한 이진 데이터 파일의 헤더(Header)의 일부이다. 도 5를 참조하면, 이진 데이터 파일의 헤더로부터, 각 파일의 카테고리를 판단할 수 있는 파일 시그너처를 각각 추출할 수 있게 된다. Referring to FIG. 3 , the second metadata generator of the file storage server includes a file category detection module 340 and a second metadata acquisition module 350 . The file category detection module 340 extracts a file signature from a binary data file (Binary File) for a file stored in the cloud file storage, and detects information about a file category from the file signature. . 5 exemplarily shows a binary data file for a file in a cloud storage system according to a preferred embodiment of the present invention. In FIG. 5, (a) is a part of a header of a binary data file for a PDF file, and (b) is a part of a header (Header) of a binary data file for a DCM file, which is a medical data file. Referring to FIG. 5 , from the header of the binary data file, it is possible to extract file signatures for determining the category of each file, respectively.

상기 제2 메타데이터 획득 모듈(350)은 상기 파일의 카테고리에 따라 사전 설정된 방법에 따라 파일의 컨텐츠에 대한 제2 메타데이터를 획득하여 상기 중계 서버로 제공한다. 상기 제2 메타데이터 획득 모듈(350)은, 파일의 카테고리에 따라 적용되는 이미지 인식 모듈(352), 텍스트 인식 모듈(354), 의료 데이터 인식 모듈(356) 및 범용 인식 모듈(358)을 구비한다. The second metadata obtaining module 350 obtains second metadata for the content of the file according to a method preset according to the category of the file and provides it to the relay server. The second metadata acquisition module 350 includes an image recognition module 352 , a text recognition module 354 , a medical data recognition module 356 , and a general-purpose recognition module 358 that are applied according to the category of the file. .

상기 이미지 인식 모듈(352)은, 이미지 파일에 대한 제2 메타 데이터를 획득하여 제공하는 모듈이다. 도 6는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 이미지 인식 모듈을 개략적으로 도시한 구성도이다. 도 6에 있어서, (a)는 학습 과정에 의한 제2 메타데이터 추출 모델을 생성하는 과정을 도시한 것이며, (b)는 추출 모델을 이용하여 임의의 이미지에 대하여 제2 메타데이터를 정의하는 과정을 도시한 것이다. 도 6를 참조하면, 본 발명에 따른 상기 이미지 인식 모듈은, (a)에 도시된 바와 같이 딥러닝 기술을 이용하여 학습용 이미지들을 사전 학습하여 이미지들로부터 제2 메타데이터를 생성해 낼 수 있는 모델을 생성하며, (b)에 도시된 바와 같이, 상기 이미지 파일을 상기 학습에 의해 생성된 모델에 적용함으로써, 해당 이미지 파일에 대한 제2 메타데이터들을 정의하여 출력하게 된다. 전술한 이미지 인식 기술은 이미 딥러닝 기술을 이용하여 널리 활용되고 있는 기술로서, 학습 과정을 통해 각 이미지들에 대하여 이미지로부터 오브젝트(Object)를 검출하고, 검출된 오브젝트들이 포함된 영역을 구획화(Segmentation)하고, 해당 오브젝트의 클래스를 분류하는 과정들이 포함된다. 따라서, 상기 이미지 인식 모듈(352)은 이미지에 포함된 오브젝트(Object)에 대한 종류, 특성, 속성, 색상 정보 등과 배경에 대한 정보 등을 추출하여 제2 메타데이터로 제공하게 된다. The image recognition module 352 is a module that obtains and provides second metadata for an image file. 6 is a configuration diagram schematically illustrating an image recognition module in a cloud storage system according to a preferred embodiment of the present invention. 6 , (a) shows a process of generating a second metadata extraction model by a learning process, and (b) is a process of defining second metadata for an arbitrary image using the extraction model will show Referring to FIG. 6 , the image recognition module according to the present invention is a model capable of generating second metadata from images by pre-learning images for training using deep learning technology as shown in (a). and, as shown in (b), by applying the image file to the model generated by the training, second metadata for the image file is defined and output. The above-described image recognition technology is a technology that has already been widely used using deep learning technology. Through a learning process, an object is detected from an image for each image, and the region including the detected objects is segmented (Segmentation). ) and classifying the object class is included. Accordingly, the image recognition module 352 extracts information on the type, characteristic, attribute, color, and background of an object included in the image and provides it as second metadata.

상기 텍스트 인식 모듈(354)은 파일에 대한 제2 메타 데이터를 획득하여 제공하는 모듈이다. 도 7은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 텍스트 인식 모듈을 개략적으로 도시한 구성도이다. 도 7을 참조하면, 텍스트 인식 모듈은 텍스트 파일에 포함된 특정 문장에서 각 키워드를 추출하고, 문장 내에서 키워드가 등장하는 빈도와 유사도를 검출하고, 상기 빈도와 유사도를 이용하여 랭크(rank)를 계산하고, 이러한 랭크를 이용하여 텍스트 요약까지 생성하며, 이렇게 생성된 정보들을 제2 메타데이터로 획득하게 된다. 따라서, 텍스트 인식 모듈(354)은 텍스트 파일에 포함된 다양한 키워드들과 요약 등을 추출하여 제2 메타데이터로 제공하게 된다. The text recognition module 354 is a module that obtains and provides second meta data for a file. 7 is a configuration diagram schematically illustrating a text recognition module in a cloud storage system according to a preferred embodiment of the present invention. Referring to FIG. 7 , the text recognition module extracts each keyword from a specific sentence included in a text file, detects the frequency and similarity of keywords in the sentence, and determines a rank using the frequency and similarity. calculation, and even a text summary is generated using this rank, and the generated information is acquired as second metadata. Accordingly, the text recognition module 354 extracts various keywords and summaries included in the text file and provides them as second metadata.

상기 의료 데이터 인식 모듈(356)은, 의료 데이터 파일에 대한 제2 메타 데이터를 획득하여 제공하는 모듈이다. 도 8은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 의료 데이터 인식 모듈을 개략적으로 도시한 구성도이다. 도 8을 참조하면, 의료 영상 데이터 파일인 DCM File로부터 표준 태그를 추출하고, 표준 태그들을 제2 메타데이터로 정의하여 획득하게 된다. 일반적으로 상기 의료 데이터 파일은 의료 영상 데이터(DICOM File 및 DCM File)를 포함하며, 이러한 DCM 파일들은 의료 영상 데이터 표준으로서 관련 태그, 즉 메타데이터들이 이미 표준으로 정의되어 있다. 따라서, 의료 데이터 인식 모듈은 의료 영상 데이터 파일에 포함된 표준 태그들을 추출하고 일부 선별하여 제2 메타데이터로 사용할 수 있다. The medical data recognition module 356 is a module that obtains and provides second metadata for a medical data file. 8 is a configuration diagram schematically illustrating a medical data recognition module in a cloud storage system according to a preferred embodiment of the present invention. Referring to FIG. 8 , standard tags are extracted from a DCM file, which is a medical image data file, and standard tags are defined and obtained as second metadata. In general, the medical data file includes medical image data (DICOM File and DCM File), and related tags, ie, metadata, are already defined as standards for these DCM files as medical image data standards. Accordingly, the medical data recognition module may extract standard tags included in the medical image data file, select some and use them as second metadata.

도 9은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 의료 영상 데이터 파일(DICOM FILE) 및 이로부터 획득될 수 있는 제2 메타데이터들을 예시적으로 도시한 것이다. 도 9을 참조하면, 의료 영상 데이터에는 이미지(Image) 영역과 태그(Tags) 영역이 있으며, 이들로부터 제2 메타데이터들을 선별하여 추출할 수 있게 된다. 의료 영상 데이터로부터 추출할 수 있는 제2 메타데이터로는 측정일, 측정시, 환자 정보 등이 포함될 수 있다. 9 exemplarily illustrates a medical image data file (DICOM FILE) and second metadata obtainable therefrom in a cloud storage system according to a preferred embodiment of the present invention. Referring to FIG. 9 , there are an image area and a tag area in medical image data, and second metadata can be selected and extracted from them. The second metadata that can be extracted from the medical image data may include a measurement date, measurement time, patient information, and the like.

상기 범용 인식 모듈(358)은, 파일의 형식을 정상적으로 인식할 수 없는 파일에 대하여 데이터 구조 형식을 분석하여 제2 메타 데이터를 획득하여 제공하는 모듈이다. 클라우드 파일 저장소에 저장된 파일이 앞서 설명한 이미지 파일, 텍스트 파일, 의료 데이터 파일이 아닌 경우, 상기 범용 인식 모듈(358)을 이용하여 해당 파일의 컨텐츠에 대한 제2 메타데이터를 추출하게 된다. 도 10는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 범용 인식 모듈을 개략적으로 도시한 구성도이다. JSON 파일은 key value(키 값)이 맵핑된 자료형으로서, 텍스트 기반의 데이터 포맷으로 이루어진다. 도 10를 참조하면, 범용 인식 모듈은 JSON FILE에 대하여 키와 키 값을 추출하고, 키 및 키 값으로부터 정보를 추출하여 제2 메타데이터로 정의하게 된다. 또한, 해당 파일에 포함된 키(Key)가 텍스트(Text)인 경우에는 텍스트 랭크(Text Rank) 기법을 적용하여 제2 메타데이터를 추출할 수도 있다. The general-purpose recognition module 358 is a module that obtains and provides second metadata by analyzing a data structure format for a file whose format cannot be recognized normally. When the file stored in the cloud file storage is not the image file, text file, or medical data file described above, the second metadata for the contents of the file is extracted using the universal recognition module 358 . 10 is a configuration diagram schematically illustrating a general-purpose recognition module in a cloud storage system according to a preferred embodiment of the present invention. A JSON file is a data type in which key values are mapped, and is formed in a text-based data format. Referring to FIG. 10 , the general-purpose recognition module extracts a key and a key value from the JSON FILE, extracts information from the key and the key value, and defines it as second metadata. In addition, when the key included in the file is text, the second metadata may be extracted by applying the text rank technique.

이하, 도 10를 참조하여 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에서의 파일 업로드 과정에 대하여 구체적으로 설명한다. Hereinafter, a file upload process in the cloud storage system according to a preferred embodiment of the present invention will be described in detail with reference to FIG. 10 .

도 10는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일 업로드 및 데이터 갱신 과정을 순차적으로 도시한 시스템 흐름도이다. 10 is a system flowchart sequentially illustrating a file upload and data update process in a cloud storage system according to a preferred embodiment of the present invention.

도 10를 참조하면, 먼저, 사용자가 외부의 클라이언트 단말을 통해 중계 서버에 임의의 파일을 업로드한다(단계 500). 이때, 파일 이름, 파일이 업로드될 경로 정보, 파일 사이즈, 업로드를 시도하는 사용자 정보가 함께 업로드된다. Referring to FIG. 10 , first, a user uploads an arbitrary file to the relay server through an external client terminal (step 500). At this time, the file name, the path information to which the file is to be uploaded, the file size, and information about the user attempting to upload are uploaded together.

상기 중계 서버는, 클라이언트 단말로부터 파일이 업로드되면, 가상 파일 시스템으로 권한 체크, 인덱스 검증 및 생성을 요청하게 된다(단계 510). When a file is uploaded from the client terminal, the relay server requests permission check, index verification, and creation from the virtual file system (step 510).

상기 요청에 따라, 상기 가상 파일 시스템은 해당 경로에 대하여 파일을 쓸 권한이 있는지 여부를 확인한다. 이때, 상기 가상 파일 시스템은 권한 확인을 위하여, 해당 경로의 소유자인지 여부, 해당 그룹에 포함되어 있는지 여부 및 소유 권한없이 파일을 기록할 수 있는지 여부를 판단한다. 다음, 가상 파일 시스템은 인덱스 검증을 위하여 파일을 업로드할 경로가 존재하는지 여부 및 해당 경로에 파일을 기록할 공간이 존재하는지 여부를 판단한다. 다음, 가상 파일 시스템은 무작위(random)로 128bit의 UUID를 중복되지 않도록 생성하고, 파일로부터 정형화된 파일의 속성 정보들인 제1 메타데이터를 추출하여 저장한다(단계 512). 상기 제1 메타데이터는 파일 이름, 파일 사이즈, 사용자 정보, 그룹 정보, 생성일시, 권한, 디렉토리 여부, UUID 등을 포함한다. In response to the request, the virtual file system checks whether or not there is an authority to write a file to the corresponding path. In this case, the virtual file system determines whether the user is the owner of the corresponding path, whether it is included in the corresponding group, and whether the file can be recorded without the ownership right, in order to check the authority. Next, for index verification, the virtual file system determines whether a path to upload a file exists and whether a space to record a file exists in the path. Next, the virtual file system randomly generates 128-bit UUIDs so that they are not duplicated, and extracts and stores first metadata, which is standardized file attribute information, from the file (step 512). The first metadata includes a file name, file size, user information, group information, creation date and time, authority, directory status, UUID, and the like.

또한, 상기 가상 파일 시스템은 중계 서버의 요청에 따라 상기 제1 메타데이터로부터 인덱스 정보를 추출하여 중계 서버로 전송한다(단계 520). 상기 인덱스 정보는 각 파일을 식별할 수 있는 정보로서, 각 파일에 대한 ID, PID, UUID 를 포함한다. Also, the virtual file system extracts index information from the first metadata according to the request of the relay server and transmits the extracted index information to the relay server (step 520). The index information is information for identifying each file, and includes an ID, PID, and UUID for each file.

상기 중계 서버는 VFS로부터 인덱스 정보가 전달되면, 파일 저장 서버의 클라우드 파일 저장소에 인덱스 정보와 함께 상기 파일을 저장하고(단계 530), 상기 가상 파일 시스템의 파일 저장소 정보를 업데이트하고(단계 532), 클라이언트 단말로 파일 업로드가 완료되었음을 통지한다(단계 534). 만약, 전술한 단계 530의 파일 저장시 에러가 발생되면, 파일 저장소 정보를 업데이트하지 않고, 단계 512에서 생성된 제1 메타데이터는 삭제되며, 파일 업로드 과정은 종료한다. When the index information is transmitted from the VFS, the relay server stores the file together with the index information in the cloud file storage of the file storage server (step 530), and updates the file storage information of the virtual file system (step 532), Notifies the client terminal that the file upload has been completed (step 534). If an error occurs when storing the file in step 530, the first metadata generated in step 512 is deleted without updating the file storage information, and the file upload process is terminated.

한편, 상기 파일 저장 서버는 클라우드 파일 저장소에 저장된 파일에 대하여 파일의 컨텐츠의 속성 정보인 제2 메타데이터를 생성하고(단계 540), 생성된 제2 메타데이터를 해당 파일의 인덱스 정보와 함께 중계 서버로 전송한다(단계 542). 여기서, 상기 파일 저장 서버의 제2 메타데이터 생성은 전술한 파일 저장 서버의 제2 메타데이터 생성부에 의해 구현될 수 있다. On the other hand, the file storage server generates second metadata that is attribute information of the contents of the file with respect to the file stored in the cloud file storage (step 540), and transmits the generated second metadata together with the index information of the file to the relay server to (step 542). Here, the second metadata generation of the file storage server may be implemented by the above-described second metadata generation unit of the file storage server.

파일의 인덱스 정보 및 해당 파일에 대한 제2 메타데이터를 제공받은 중계 서버는 인덱스 정보와 제2 메타데이터 정보를 메타데이터 서버로 전송하여 저장함으로써, 메타데이터 서버를 업데이트시킨다(단계 550).The relay server receiving the index information of the file and the second metadata for the file transmits and stores the index information and the second metadata information to the metadata server, thereby updating the metadata server (step 550).

이하, 도 11을 참조하여 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서의 파일 검색 및 다운로드 과정을 구체적으로 설명한다. Hereinafter, a file search and download process in the cloud storage system according to a preferred embodiment of the present invention will be described in detail with reference to FIG. 11 .

도 11은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일 검색 및 다운로드 과정을 순차적으로 도시한 시스템 흐름도이다. 도 11을 참조하면, 클라이언트 단말로부터 검색 조건 정보의 입력과 함께 검색이 요청되면(단계 600), 상기 중계 서버는 입력된 검색 조건 정보를 확인하고, 상기 검색 조건 정보가 파일 속성 정보인 제1 메타데이터와 컨텐츠 속성 정보인 제2 메타데이터 중 어느 것에 해당되는지 여부를 판별한다(단계 610). 11 is a system flow diagram sequentially illustrating a file search and download process in a cloud storage system according to a preferred embodiment of the present invention. Referring to FIG. 11 , when a search is requested along with input of search condition information from the client terminal (step 600), the relay server checks the input search condition information, and the search condition information is a first meta information that is file attribute information. It is determined whether the data corresponds to any of the data and the second metadata that is content attribute information (step 610).

만약 검색 조건 정보가 파일 속성 정보인 제1 메타데이터에 관한 것인 경우, 가상 파일 시스템의 제1 메타데이터를 검색하고, 검색된 파일에 대한 권한을 체크한다(단계 620). 다음, VFS는 검색 결과에 따라 검색된 파일에 대한 인덱스 정보 및 해당 파일에 대한 클라우드 파일 저장소의 저장 위치 정보를 중계서버로 전송한다(단계 622). If the search condition information relates to the first metadata that is the file attribute information, the first metadata of the virtual file system is searched and the authority for the searched file is checked (step 620). Next, the VFS transmits the index information on the file searched according to the search result and the storage location information of the cloud file storage for the file to the relay server (step 622).

만약 검색 조건 정보가 컨텐츠 속성 정보인 제2 메타데이터에 관한 것인 경우, 메타데이터 서버의 제2 메타데이터를 검색하고(단계 624), 메타데이터 서버는 검색 결과 정보인 매칭 데이터를 중계서버로 전송한다(단계 626). 메타데이터 서버로부터 매칭 데이터를 전달받은 상기 중계서버는 매칭 데이터를 기반으로 하여 가상 파일 시스템으로 조회 및 권한 체크를 요청하고(단계 628), 상기 가상 파일 시스템은 조회 및 권한 체크후 매칭 데이터에 대응하는 인덱스 정보 및 클라우드 파일 저장소의 저장 위치 정보를 중계 서버로 전달한다(단계 629). If the search condition information relates to the second metadata that is the content attribute information, the second metadata of the metadata server is searched (step 624), and the metadata server transmits matching data, which is the search result information, to the relay server. do (step 626). After receiving the matching data from the metadata server, the relay server requests an inquiry and permission check to the virtual file system based on the matching data (step 628), and the virtual file system responds to the matching data after the inquiry and permission check. The index information and the storage location information of the cloud file storage are transmitted to the relay server (step 629).

다음, 상기 중계 서버는 가상 파일 시스템으로부터 전달받은 인덱스 정보 및 파일 저장 위치 정보를 토대로 하여 파일 저장 서버로 해당 파일을 요청하고(단계 630), 이에 따라 파일 저장 서버는 해당 파일을 중계 서버로 제공하며(단계 640), 중계 서버는 해당 파일을 클라이언트 단말에게 다운로드시킨다(단계 650). Next, the relay server requests the file to the file storage server based on the index information and the file storage location information received from the virtual file system (step 630), and accordingly, the file storage server provides the file to the relay server, (Step 640), the relay server downloads the file to the client terminal (Step 650).

이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나, 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 그리고, 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다. In the above, the present invention has been described with respect to the preferred embodiment thereof, but this is merely an example and does not limit the present invention, and those of ordinary skill in the art to which the present invention pertains without departing from the essential characteristics of the present invention. It will be appreciated that various modifications and applications not exemplified above in the scope are possible. In addition, differences related to such modifications and applications should be construed as being included in the scope of the present invention defined in the appended claims.

1 : 클라우드 스토리지 시스템
10 : 중계 서버(Resource Broker ; 'RB')
20 : 가상 파일 시스템(Virtual File System; 'VFS')
30 : 파일 저장 서버(Storage Element ; 'SE' )
32 : 클라우드 파일 저장소
34 : 제2 메타데이터 생성부
340 : 파일 카테고리 검출 모듈
350 : 제2 메타데이터 획득 모듈
40 : 메타데이터 서버( Metadata Server ; 'MS' )
1: Cloud storage system
10: Relay Server (Resource Broker ; 'RB')
20: Virtual File System ('VFS')
30: File storage server (Storage Element; 'SE')
32 : Cloud File Storage
34: second metadata generating unit
340: file category detection module
350: second metadata acquisition module
40: Metadata Server ( Metadata Server ; 'MS')

Claims (8)

외부의 클라이언트 단말기로부터 파일이 업로드되면, 가상 파일 시스템으로 상기 업로드된 파일에 대한 인덱스 생성을 요청하는 중계 서버;
상기 중계 서버로부터의 요청에 따라 상기 업로드된 파일에 대한 파일 속성 정보인 제1 메타데이터를 생성하여 저장하고, 제1 메타데이터로부터 파일 고유 식별 정보인 인덱스 정보를 추출하여 상기 중계 서버에게 전송하는 가상 파일 시스템;
클라우드 파일 저장소를 구비하여 상기 중계 서버로부터 제공된 파일을 상기 클라우드 파일 저장소에 저장하고, 저장 위치 정보를 상기 중계 서버로 제공하며, 저장된 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 추출하여 상기 중계 서버로 제공하는 파일 저장 서버;
상기 중계 서버로부터 파일에 대한 인덱스 정보 및 제2 메타데이터를 제공받아 저장 및 관리하는 메타데이터 서버;
를 구비하고, 상기 중계 서버는,
가상 파일 시스템으로부터 파일에 대한 인덱스 정보를 제공받고,
상기 인덱스 정보와 함께 해당 파일을 상기 파일 저장 서버로 제공하여 저장하고, 파일 저장 서버로부터 파일에 대한 파일 저장 위치 정보 및 제2 메타데이터를 제공받고,
파일에 대한 인덱스 정보 및 제2 메타데이터를 상기 메타데이터 서버에 제공하여 저장 및 관리하는 것을 특징으로 하는 것을 특징으로 하는 클라우드 스토리지 시스템.
When a file is uploaded from an external client terminal, a relay server for requesting creation of an index for the uploaded file to the virtual file system;
Virtual data for generating and storing first metadata that is file attribute information for the uploaded file according to a request from the relay server, extracting index information that is file unique identification information from the first metadata and transmitting it to the relay server file system;
A cloud file storage is provided to store the file provided from the relay server in the cloud file storage, the storage location information is provided to the relay server, and second metadata that is content attribute information for the stored file is extracted to the relay server. File storage server provided by;
a metadata server that receives, stores, and manages index information and second metadata on a file from the relay server;
comprising, the relay server,
Receive index information about the file from the virtual file system,
Provide and store the file together with the index information to the file storage server, and receive file storage location information and second metadata for the file from the file storage server,
A cloud storage system, characterized in that it stores and manages by providing index information and second metadata on the file to the metadata server.
제1항에 있어서, 상기 파일 저장 서버는 제2 메타데이터 생성부를 더 구비하고,
상기 제2 메타데이터 생성부는,
상기 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)로부터 파일 시그너처(File Signature)를 추출하고, 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 추출하고, 상기 파일의 카테고리에 따라 사전 설정된 방법에 따라 제2 메타데이터를 획득하여 상기 중계 서버로 제공하는 것을 특징으로 하는 클라우드 스토리지 시스템.
The method of claim 1, wherein the file storage server further comprises a second metadata generator,
The second metadata generation unit,
Extracting a file signature from a binary file for a file stored in the cloud file storage, extracting information about a category of a file from the file signature, and a method preset according to the category of the file The cloud storage system according to claim 1, wherein the second metadata is obtained and provided to the relay server.
제2항에 있어서, 상기 제2 메타데이터 생성부는,
상기 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)을 판독하여 파일 시그너처(File Signature)를 추출하고, 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 검출하는 파일 카테고리 검출 모듈; 및
파일의 카테코리에 대한 정보에 따라 사전 설정된 모듈을 이용하여 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 획득하고, 획득된 제2 메타데이터를 저장하고 상기 중계 서버로 제공하는 제2 메타데이터 획득 모듈;을 구비하고,
상기 제2 메타데이터 획득 모듈은,
이미지 파일에 대한 제2 메타 데이터를 획득하여 제공하는 이미지 인식 모듈;
텍스트 파일에 대한 제2 메타 데이터를 획득하여 제공하는 텍스트 인식 모듈;
의료 데이터 파일에 대한 제2 메타 데이터를 획득하여 제공하는 의료 데이터 인식 모듈;
파일의 형식을 정상적으로 인식할 수 없는 파일에 대하여 데이터 구조 형식을 분석하여 제2 메타 데이터를 획득하여 제공하는 범용 인식 모듈;
을 구비하는 것을 특징으로 하는 클라우드 스토리지 시스템.
The method of claim 2, wherein the second metadata generator comprises:
a file category detection module that reads a binary file for a file stored in the cloud file storage, extracts a file signature, and detects information about a file category from the file signature; and
A second metadata acquisition module for acquiring second metadata that is content attribute information for a file using a preset module according to information on a category of a file, and storing the acquired second metadata and providing it to the relay server ; and
The second metadata acquisition module includes:
an image recognition module that obtains and provides second metadata for the image file;
a text recognition module that obtains and provides second metadata for the text file;
a medical data recognition module that obtains and provides second metadata for the medical data file;
a general-purpose recognition module for obtaining and providing second metadata by analyzing a data structure format for a file whose format cannot be recognized normally;
A cloud storage system comprising a.
제3항에 있어서, 상기 이미지 인식 모듈은
CNN(Convolution Neural Network) 알고리즘을 기반으로 학습하여 구성된 모듈로서, 상기 이미지 인식 모듈에 의한 제2 메타데이터는 이미지 파일에 포함된 오브젝트에 대한 정보를 포함하는 것을 특징으로 하는 클라우드 스토리지 시스템.
The method of claim 3, wherein the image recognition module
A module configured by learning based on a Convolution Neural Network (CNN) algorithm, wherein the second metadata by the image recognition module includes information about an object included in an image file.
제3항에 있어서, 상기 텍스트 인식 모듈은
텍스트 파일에 포함된 단어 및 문장 정보를 검출하여 제2 메타데이터로 제공하는 것을 특징으로 하는 클라우드 스토리지 시스템.
The method of claim 3, wherein the text recognition module
A cloud storage system, comprising detecting word and sentence information included in a text file and providing it as second metadata.
제1항에 있어서, 상기 중계 서버는,
상기 클라이언트 단말로부터 검색 조건 정보가 입력되고 검색이 요청되면,
상기 입력된 검색 조건 정보를 분석하고,
상기 검색 조건 정보가 파일의 속성 정보인 제1 메타 데이터에 관한 것이면, VFS로 검색 요청하고, 상기 검색 조건 정보가 파일의 컨텐츠 속성 정보인 제2 메타데이터에 관한 것이면, 메타데이터 서버로 검색 요청하고,
검색 요청에 따라 인덱스 정보를 포함하는 결과 정보가 수신되면, 해당 인덱스 정보에 대응되는 파일을 파일 저장 서버로부터 제공받아 클라이언트 단말로 제공하는 것을 특징으로 하는 클라우드 스토리지 시스템.
According to claim 1, wherein the relay server,
When search condition information is input from the client terminal and a search is requested,
Analyze the input search condition information,
If the search condition information relates to first metadata that is attribute information of a file, a VFS search is requested, and if the search condition information relates to second metadata that is content attribute information of a file, a search is requested to a metadata server, ,
When result information including index information is received according to a search request, a file corresponding to the index information is provided from the file storage server and provided to the client terminal.
중계 서버, 가상 파일 시스템, 파일 저장 서버 및 메타데이터 서버를 포함하는 클라우드 스토리지 시스템에 있어서의 파일 저장 서버에 의한 메타데이터 생성 방법에 있어서,
(a) 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)을 판독하여 파일 시그너처(File Signature)를 추출하는 단계;
(b) 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 검출하는 단계;
(c) 파일의 카테코리에 대한 정보에 따라 사전 설정된 모듈을 이용하여 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 획득하는 단계; 및
(d) 상기 획득된 제2 메타데이터를 저장하고 상기 중계 서버로 제공하는 단계;
를 구비하여, 클라우드 파일 저장소에 저장된 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 생성하여 제공하는 것을 특징으로 하는 클라우드 스토리지 시스템에서의 메타데이터 생성 방법.
A method for generating metadata by a file storage server in a cloud storage system including a relay server, a virtual file system, a file storage server, and a metadata server, the method comprising:
(a) extracting a file signature (File Signature) by reading a binary file (Binary File) for a file stored in the cloud file storage;
(b) detecting information on a category of a file from the file signature;
(c) acquiring second metadata, which is content attribute information for the file, using a preset module according to the information on the category of the file; and
(d) storing the obtained second metadata and providing it to the relay server;
A method for generating metadata in a cloud storage system, comprising: generating and providing second metadata that is content attribute information for a file stored in the cloud file storage.
제7항에 있어서, 상기 (c) 단계는,
파일의 카테고리가 이미지 파일이면, 이미지에 포함된 오브젝트의 종류를 판별하고 적어도 오브젝트에 대한 정보를 제2 메타데이터로 제공하며,
파일의 카테고리가 텍스트 파일이면, 텍스트 파일에 포함된 단어 및 문장을 추출하고, 적어도 단어 및 문장에 대한 정보를 제2 메타데이터로 제공하며,
파일의 카테고리가 의료 데이터이면, 의료 데이터에 포함된 촬영 정보 및 환자 정보를 추출하고 적어도 환자 정보를 제2 메타데이터로 제공하는 것을 특징으로 하는 클라우드 스토리지 시스템에서의 메타데이터 생성 방법.


The method of claim 7, wherein the step (c) comprises:
If the category of the file is an image file, the type of object included in the image is determined and at least information about the object is provided as second metadata,
If the category of the file is a text file, extracts words and sentences included in the text file, and provides at least information about the words and sentences as second metadata;
If the category of the file is medical data, the method for generating metadata in a cloud storage system, comprising extracting photographing information and patient information included in the medical data, and providing at least patient information as second metadata.


KR1020190175558A 2019-12-26 2019-12-26 Cloud storage system and method of generating contents metadata in the cloud storage system KR20210083007A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190175558A KR20210083007A (en) 2019-12-26 2019-12-26 Cloud storage system and method of generating contents metadata in the cloud storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190175558A KR20210083007A (en) 2019-12-26 2019-12-26 Cloud storage system and method of generating contents metadata in the cloud storage system

Publications (1)

Publication Number Publication Date
KR20210083007A true KR20210083007A (en) 2021-07-06

Family

ID=76860889

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190175558A KR20210083007A (en) 2019-12-26 2019-12-26 Cloud storage system and method of generating contents metadata in the cloud storage system

Country Status (1)

Country Link
KR (1) KR20210083007A (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090037704A (en) 2007-10-12 2009-04-16 차병래 Meta data generation method for intutive image search
KR101285654B1 (en) 2011-07-06 2013-08-14 주식회사 씬멀티미디어 Realtime transcoding device for progressive downloading of which meta data and media data saperated
KR20150048260A (en) 2013-10-24 2015-05-07 에스케이플래닛 주식회사 Method for sharing contents based on cloud computing, system and service apparatus thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090037704A (en) 2007-10-12 2009-04-16 차병래 Meta data generation method for intutive image search
KR101285654B1 (en) 2011-07-06 2013-08-14 주식회사 씬멀티미디어 Realtime transcoding device for progressive downloading of which meta data and media data saperated
KR20150048260A (en) 2013-10-24 2015-05-07 에스케이플래닛 주식회사 Method for sharing contents based on cloud computing, system and service apparatus thereof

Similar Documents

Publication Publication Date Title
US10868827B2 (en) Browser extension for contemporaneous in-browser tagging and harvesting of internet content
US9489401B1 (en) Methods and systems for object recognition
AU2014384636B2 (en) Systems and methods for ephemeral eventing
EP2973013B1 (en) Associating metadata with images in a personal image collection
US8897508B2 (en) Method and apparatus to incorporate automatic face recognition in digital image collections
US20090164502A1 (en) Systems and methods of universal resource locator normalization
CN101986292B (en) Method and system for processing forms based on an image
KR20130102549A (en) Automatic media sharing via shutter click
US10977677B2 (en) Contact importer
US20150169207A1 (en) Systems and methods for generating personalized account reconfiguration interfaces
US20220272096A1 (en) Media data based user profiles
CN110532529A (en) A kind of recognition methods of file type and device
US20140006351A1 (en) Method, a server, a system and a computer program product for copying data from a source server to a target server
US11797617B2 (en) Method and apparatus for collecting information regarding dark web
Raghavan et al. Eliciting file relationships using metadata based associations for digital forensics
CN111403011A (en) Registered department pushing method, device and system, electronic equipment and storage medium
KR20210083007A (en) Cloud storage system and method of generating contents metadata in the cloud storage system
JP2017224158A (en) Information processing device, data retrieval method, program, data structure and data processing system
KR102639645B1 (en) System and method for searching digital asset using nft
US11880392B2 (en) Systems and methods for associating data with a non-material concept
US20240119170A1 (en) Machine learning (ml) model pipeline with obfuscation to protect sensitive data therein
KR102347028B1 (en) System and method for providing rmi of shared images rights
US20240169195A1 (en) Machine learning-based systems and methods for identifying and resolving content anomalies in a target digital artifact
CN114385710A (en) Data analysis method and device, electronic equipment and storage medium
Hussein et al. Criminals Identification System (Cids) Using Face Recognition

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application