KR20210083007A - Cloud storage system and method of generating contents metadata in the cloud storage system - Google Patents
Cloud storage system and method of generating contents metadata in the cloud storage system Download PDFInfo
- Publication number
- KR20210083007A KR20210083007A KR1020190175558A KR20190175558A KR20210083007A KR 20210083007 A KR20210083007 A KR 20210083007A KR 1020190175558 A KR1020190175558 A KR 1020190175558A KR 20190175558 A KR20190175558 A KR 20190175558A KR 20210083007 A KR20210083007 A KR 20210083007A
- Authority
- KR
- South Korea
- Prior art keywords
- file
- metadata
- information
- server
- relay server
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 31
- 239000000284 extract Substances 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/164—File meta data generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/188—Virtual file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 클라우드 스토리지 시스템 및 상기 시스템에서의 비정형 데이터에 대한 메타데이터 생성 방법에 관한 것으로서, 더욱 구체적으로는 클라우드 스토리지 시스템에 저장되는 정형 데이터 파일뿐 만 아니라 비정형 데이터 파일들의 컨텐츠에 대한 메타데이터를 생성하여 제공함으로써 컨텐츠에 대한 다양한 검색을 가능하도록 하는 클라우드 스토리지 시스템 및 메타데이터 생성 방법에 관한 것이다. The present invention relates to a cloud storage system and a method for generating metadata for unstructured data in the system, and more particularly, to a structured data file stored in a cloud storage system as well as metadata for content of unstructured data files. to a cloud storage system and a method for generating metadata that enable various searches for content by providing
IoT 기술이 발달하고 디바이스의 종류가 다양해짐에 따라 각 디바이스로부터 발생되는 데이터의 종류도 다양해지고 있는 실정이며, 이러한 데이터를 처리하는데 있어서, 각 데이터에 대한 메타데이터(metadata)는 중요한 지표가 되고 있다. As IoT technology develops and types of devices become diversified, the types of data generated from each device are also diversifying, and in processing such data, metadata for each data is an important indicator. .
속성 정보라고도 불리우는 메타데이터는 대량으로 존재하고 있는 정보들 사이에서 찾고자 하는 정보를 효율적으로 찾아내기 위해서, 일정한 규칙에 의거하여 컨텐츠에 부여해주는 데이터이다. 이렇게 부여되는 메타데이터로는 컨텐츠를 작성하는 작성자, 이용조건, 이용내력, 권리조건, 컨텐츠의 위치와 내용 등이 포함된다. Metadata, also called attribute information, is data that is given to content according to a certain rule in order to efficiently find information to be found among information that exists in a large amount. The metadata provided in this way includes the creator of the content, conditions of use, history of use, rights conditions, location and content of the content, and the like.
한편, 일반적인 파일들은 각 파일 속성에 따라 설정된 메타데이터들을 가지고 있기는 하지만, 그 속성들이 상이하고 메타데이터들이 충분하지 못한 경우가 많이 발생한다. 특히, 비정형 파일들은 파일 속성이 명확하지 않기 때문에, 메타데이터들을 충분하게 제공하지 못하게 된다. On the other hand, although general files have metadata set according to each file property, the properties are different and the metadata is insufficient in many cases. In particular, unstructured files do not sufficiently provide metadata because file attributes are not clear.
전술한 문제점을 해결하기 위한 본 발명의 목적은, 클라우드 스토리지 상에 업로드된 비정형 데이터 파일들에 대한 컨텐츠를 분석하여 컨텐츠 기반의 메타데이터를 생성하고 관리할 수 있도록 하는 컨텐츠 기반의 메타데이터를 생성 및 관리하는 클라우드 스토리지 시스템을 제공하는 것이다. SUMMARY OF THE INVENTION An object of the present invention for solving the above-described problems is to generate and manage content-based metadata by analyzing content for unstructured data files uploaded to cloud storage to create and manage content-based metadata. To provide a managed cloud storage system.
또한 본 발명의 다른 목적은, 비정형 데이터에 대하여 컨텐츠 기반의 메타데이터를 생성할 수 있도록 하는 메타데이터 생성 방법을 제공하는 것이다. Another object of the present invention is to provide a metadata generating method that enables content-based metadata to be generated with respect to unstructured data.
전술한 기술적 과제를 달성하기 위한 본 발명의 제1 특징에 따른 클라우드 스토리지 시스템은, 외부의 클라이언트 단말기로부터 파일이 업로드되면, 가상 파일 시스템으로 상기 업로드된 파일에 대한 인덱스 생성을 요청하는 중계 서버; 상기 중계 서버로부터의 요청에 따라 상기 업로드된 파일에 대한 파일 속성 정보인 제1 메타데이터를 생성하여 저장하고, 제1 메타데이터로부터 파일 고유 식별 정보인 인덱스 정보를 추출하여 상기 중계 서버에게 전송하는 가상 파일 시스템; 클라우드 파일 저장소를 구비하여 상기 중계 서버로부터 제공된 파일을 상기 클라우드 파일 저장소에 저장하고, 저장 위치 정보를 상기 중계 서버로 제공하며, 저장된 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 추출하여 상기 중계 서버로 제공하는 파일 저장 서버; 및 상기 중계 서버로부터 파일에 대한 인덱스 정보 및 제2 메타데이터를 제공받아 저장 및 관리하는 메타데이터 서버;를 구비하고, According to a first aspect of the present invention, there is provided a cloud storage system, comprising: a relay server that requests index creation for the uploaded file to a virtual file system when a file is uploaded from an external client terminal; In response to a request from the relay server, first metadata that is file attribute information for the uploaded file is generated and stored, and index information that is file unique identification information is extracted from the first metadata and transmitted to the relay server. file system; A cloud file storage is provided to store the file provided from the relay server in the cloud file storage, the storage location information is provided to the relay server, and second metadata that is content attribute information for the stored file is extracted to the relay server. File storage server provided by; and a metadata server that receives, stores, and manages index information and second metadata on a file from the relay server;
상기 중계 서버는, 가상 파일 시스템으로부터 파일에 대한 인덱스 정보를 제공받고, 상기 인덱스 정보와 함께 해당 파일을 상기 파일 저장 서버로 제공하여 저장하고, 파일 저장 서버로부터 파일에 대한 파일 저장 위치 정보 및 제2 메타데이터를 제공받고, 파일에 대한 인덱스 정보 및 제2 메타데이터를 상기 메타데이터 서버에 제공하여 저장 및 관리한다. The relay server receives index information on a file from the virtual file system, provides and stores the file together with the index information to the file storage server, and stores the file storage location information and the second information on the file from the file storage server. The metadata is provided, and index information and second metadata for the file are provided to the metadata server, and stored and managed.
본 발명의 제1 특징에 따른 클라우드 스토리지 시스템에 있어서, 상기 파일 저장 서버는 제2 메타데이터 생성부를 더 구비하고, In the cloud storage system according to the first aspect of the present invention, the file storage server further comprises a second metadata generator,
상기 제2 메타데이터 생성부는, 상기 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)로부터 파일 시그너처(File Signature)를 추출하고, 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 추출하고, 상기 파일의 카테고리에 따라 사전 설정된 방법에 따라 제2 메타데이터를 획득하여 상기 중계 서버로 제공하는 것이 바람직하다. The second metadata generating unit extracts a file signature from a binary file for a file stored in the cloud file storage, extracts information about a file category from the file signature, and the file Preferably, the second metadata is obtained according to a preset method according to the category of , and provided to the relay server.
본 발명의 제1 특징에 따른 클라우드 스토리지 시스템에 있어서, 상기 제2 메타데이터 생성부는, 상기 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)을 판독하여 파일 시그너처(File Signature)를 추출하고, 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 검출하는 파일 카테고리 검출 모듈; 및 파일의 카테코리에 대한 정보에 따라 사전 설정된 모듈을 이용하여 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 획득하고, 획득된 제2 메타데이터를 저장하고 상기 중계 서버로 제공하는 제2 메타데이터 획득 모듈;을 구비하고, In the cloud storage system according to the first aspect of the present invention, the second metadata generator reads a binary file for a file stored in the cloud file storage and extracts a file signature, a file category detection module for detecting information on a category of a file from the file signature; and acquiring second metadata, which is content attribute information for the file, using a preset module according to the information on the category of the file, storing the obtained second metadata, and providing second metadata to the relay server module; and
상기 제2 메타데이터 획득 모듈은, 이미지 파일에 대한 제2 메타 데이터를 획득하여 제공하는 이미지 인식 모듈; 텍스트 파일에 대한 제2 메타 데이터를 획득하여 제공하는 텍스트 인식 모듈; 의료 데이터 파일에 대한 제2 메타 데이터를 획득하여 제공하는 의료 데이터 인식 모듈; 파일의 형식을 정상적으로 인식할 수 없는 파일에 대하여 데이터 구조 형식을 분석하여 제2 메타 데이터를 획득하여 제공하는 범용 인식 모듈;을 구비하는 것이 바람직하다. The second metadata acquisition module may include: an image recognition module for acquiring and providing second metadata for an image file; a text recognition module that obtains and provides second metadata for the text file; a medical data recognition module that obtains and provides second metadata for the medical data file; It is preferable to include a general-purpose recognition module that obtains and provides second metadata by analyzing a data structure format for a file whose format cannot be recognized normally.
본 발명의 제1 특징에 따른 클라우드 스토리지 시스템에 있어서, 상기 이미지 인식 모듈은 CNN(Convolution Neural Network) 알고리즘을 기반으로 학습하여 구성된 모듈로서, 상기 이미지 인식 모듈에 의한 제2 메타데이터는 적어도 이미지 파일에 포함된 오브젝트에 대한 정보를 포함하는 것이 바람직하다. In the cloud storage system according to the first aspect of the present invention, the image recognition module is a module configured by learning based on a CNN (Convolution Neural Network) algorithm, and the second metadata by the image recognition module is at least in an image file. It is desirable to include information about the included object.
본 발명의 제1 특징에 따른 클라우드 스토리지 시스템에 있어서, 상기 텍스트 인식 모듈은 적어도 텍스트 파일에 포함된 단어 및 문장 정보를 검출하여 제2 메타데이터로 제공하는 것이 바람직하다. In the cloud storage system according to the first aspect of the present invention, it is preferable that the text recognition module detects at least word and sentence information included in a text file and provides it as second metadata.
본 발명의 제1 특징에 따른 클라우드 스토리지 시스템에 있어서, 상기 중계 서버는, 상기 클라이언트 단말로부터 검색 조건 정보가 입력되고 검색이 요청되면, In the cloud storage system according to the first aspect of the present invention, in the relay server, when search condition information is input from the client terminal and a search is requested,
상기 입력된 검색 조건 정보를 분석하고, 상기 검색 조건 정보가 파일의 속성 정보인 제1 메타 데이터에 관한 것이면, VFS로 검색 요청하고, 상기 검색 조건 정보가 파일의 컨텐츠 속성 정보인 제2 메타데이터에 관한 것이면, 메타데이터 서버로 검색 요청하고, 검색 요청에 따라 인덱스 정보를 포함하는 결과 정보가 수신되면, 해당 인덱스 정보에 대응되는 파일을 파일 저장 서버로부터 제공받아 클라이언트 단말로 제공하는 것이 바람직하다. The input search condition information is analyzed, and if the search condition information relates to first metadata that is attribute information of a file, a VFS search is requested, and the search condition information is added to the second metadata that is content attribute information of the file. In this case, it is preferable that a search request is made to the metadata server, and when result information including index information is received according to the search request, a file corresponding to the index information is provided from the file storage server and provided to the client terminal.
본 발명의 제2 특징에 따른 메타데이터 생성 방법은, 중계 서버, 가상 파일 시스템, 파일 저장 서버 및 메타데이터 서버를 포함하는 클라우드 스토리지 시스템에 있어서의 파일 저장 서버에 의한 메타데이터 생성 방법에 관한 것으로서, (a) 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)을 판독하여 파일 시그너처(File Signature)를 추출하는 단계; (b) 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 검출하는 단계; (c) 파일의 카테코리에 대한 정보에 따라 사전 설정된 모듈을 이용하여 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 획득하는 단계; 및 (d) 상기 획득된 제2 메타데이터를 저장하고 상기 중계 서버로 제공하는 단계;를 구비하여, 클라우드 파일 저장소에 저장된 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 생성하여 제공한다. A method for generating metadata according to a second aspect of the present invention relates to a method for generating metadata by a file storage server in a cloud storage system including a relay server, a virtual file system, a file storage server, and a metadata server, (a) extracting a file signature (File Signature) by reading a binary file (Binary File) for a file stored in the cloud file storage; (b) detecting information on a category of a file from the file signature; (c) acquiring second metadata, which is content attribute information for the file, using a preset module according to the information on the category of the file; and (d) storing the obtained second metadata and providing the obtained second metadata to the relay server.
본 발명의 제2 특징에 따른 메타데이터 생성 방법에 있어서, 상기 (c) 단계는, 파일의 카테고리가 이미지 파일이면, 이미지에 포함된 오브젝트의 종류를 판별하고 적어도 오브젝트에 대한 정보를 제2 메타데이터로 제공하며, 파일의 카테고리가 텍스트 파일이면, 텍스트 파일에 포함된 단어 및 문장을 추출하고, 적어도 단어 및 문장에 대한 정보를 제2 메타데이터로 제공하며, 파일의 카테고리가 의료 데이터이면, 의료 데이터에 포함된 촬영 정보 및 환자 정보를 추출하고 적어도 환자 정보를 제2 메타데이터로 제공하는 것이 바람직하다. In the method of generating metadata according to the second aspect of the present invention, in step (c), if the category of the file is an image file, the type of object included in the image is determined and at least information about the object is included in the second metadata and, if the category of the file is a text file, extracts words and sentences included in the text file, and provides at least information about the words and sentences as second metadata, and if the category of the file is medical data, medical data It is preferable to extract the imaging information and the patient information included in the , and provide at least the patient information as the second metadata.
본 발명에 따른 클라우드 스토리지 시스템은 파일에 대한 파일 속성 정보인 제1 메타데이터 및 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 생성하여 제공함으로써, 정형 파일뿐만 아니라 비정형 파일에 대한 검색도 가능할 수 있게 된다. The cloud storage system according to the present invention generates and provides first metadata, which is file attribute information for a file, and second metadata, which is content attribute information for a file, so that not only regular files but also non-standard files can be searched. do.
또한, 본 발명에 따른 클라우드 스토리지 시스템은 파일 시그너처 추출을 통해 파일의 카테고리를 파악하고, 파일의 카테고리에 대응되는 방법을 이용하여 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 생성하여 제공함으로써, 파일의 컨텐츠 속성 정보를 정확하게 추출할 수 있게 된다.In addition, the cloud storage system according to the present invention identifies a category of a file through file signature extraction, and generates and provides second metadata that is content attribute information for a file using a method corresponding to the category of the file, thereby providing a file. It is possible to accurately extract the content attribute information of
도 1은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템을 전체적으로 도시한 구성도이다.
도 2는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 가상 파일 시스템의 파일시스템 데이터베이스를 도시한 구성도이다.
도 3은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일 저장 서버의 구성을 개략적으로 도시한 블록도이다.
도 4은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 메타데이터 서버(40)에 저장되는 파일의 컨텐츠에 대한 제2 메타데이터들을 예시적으로 도시한 도표이다.
도 5는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일에 대한 이진 데이터 파일을 예시적으로 도시한 것이다.
도 6는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 이미지 인식 모듈을 개략적으로 도시한 구성도이다.
도 7은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 텍스트 인식 모듈을 개략적으로 도시한 구성도이다.
도 8은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 의료 데이터 인식 모듈을 개략적으로 도시한 구성도이다.
도 9은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 의료 영상 데이터 파일(DICOM FILE) 및 이로부터 획득될 수 있는 제2 메타데이터들을 예시적으로 도시한 것이다.
도 10는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 범용 인식 모듈을 개략적으로 도시한 구성도이다.
도 11은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일 검색 및 다운로드 과정을 순차적으로 도시한 시스템 흐름도이다.1 is a configuration diagram illustrating a cloud storage system according to a preferred embodiment of the present invention as a whole.
2 is a block diagram illustrating a file system database of a virtual file system in a cloud storage system according to a preferred embodiment of the present invention.
3 is a block diagram schematically illustrating a configuration of a file storage server in a cloud storage system according to a preferred embodiment of the present invention.
4 is a diagram exemplarily showing second metadata for the contents of a file stored in the
5 exemplarily shows a binary data file for a file in a cloud storage system according to a preferred embodiment of the present invention.
6 is a configuration diagram schematically illustrating an image recognition module in a cloud storage system according to a preferred embodiment of the present invention.
7 is a configuration diagram schematically illustrating a text recognition module in a cloud storage system according to a preferred embodiment of the present invention.
8 is a configuration diagram schematically illustrating a medical data recognition module in a cloud storage system according to a preferred embodiment of the present invention.
9 exemplarily illustrates a medical image data file (DICOM FILE) and second metadata obtainable therefrom in a cloud storage system according to a preferred embodiment of the present invention.
10 is a configuration diagram schematically illustrating a general-purpose recognition module in a cloud storage system according to a preferred embodiment of the present invention.
11 is a system flow diagram sequentially illustrating a file search and download process in a cloud storage system according to a preferred embodiment of the present invention.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 따른 파일 및 파일의 컨텐츠에 대한 메타 데이터들을 생성 및 관리할 수 있도록 하는 클라우드 스토리지 시스템의 구조 및 상기 시스템에서의 제1 및 제2 메타 데이터 생성 및 관리 방법에 대하여 구체적으로 설명한다. Hereinafter, with reference to the accompanying drawings, a structure of a cloud storage system for generating and managing metadata for files and file contents according to a preferred embodiment of the present invention and first and second metadata in the system The creation and management method will be described in detail.
도 1은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템을 전체적으로 도시한 구성도이다. 도 1을 참조하면, 본 발명에 따른 클라우드 스토리지 시스템(1)은, 중계 서버(Resource Broker ; 'RB', 10), 가상 파일 시스템(Virtual File System; 'VFS', 20), 파일 저장 서버(Storage Element; 'SE', 30) 및 메타데이터 서버(Metadata Server; 'MS', 40)를 구비하며, 외부의 클라이언트 단말(2)로부터 파일이 업로드되면 권한 등을 체크하여 클라우드 파일 저장소(32)에 저장 및 관리하고, 클라이언트 단말(2)로부터 특정 파일이 요청되면 해당 파일을 검색하여 클라이언트 단말에게 제공할 뿐만 아니라, 외부의 클라이언트 단말들에게 다양한 검색 서비스를 제공한다. 이하, 전술한 본 발명에 따른 클라우드 스토리지 시스템을 구성하는 각 구성 요소들에 대하여 보다 구체적으로 설명한다. 1 is a configuration diagram illustrating a cloud storage system according to a preferred embodiment of the present invention as a whole. 1, the
상기 중계 서버(10)는 상기 가상 파일 시스템(20), 상기 파일 저장 서버(30) 및 상기 메타데이터 서버(40)를 서로 연결하는 창구 역할을 하는 서버로서, 외부의 클라이언트 단말로부터의 요청을 직접 전달받고 VFS, 파일 저장 서버, 메타데이터 서버들과의 통신을 통해 클라이언트 단말의 요청들에 응답하도록 구성된다. 본 발명에 따른 각 서버들과 단말들은 기본적인 통신 프로토콜인 HTTP(Hyper Text Transfer Protocol)을 사용하는 API(Application Programming Interface)로 설계되는 것이 바람직하다. The
본 발명에 따른 클라우드 스토리지 시스템은, 상기 중계 서버를 통해, 클라이언트 단말들에게 파일 업로드 기능, 파일 검색 기능 및 파일 다운로드 기능을 제공하게 된다. 상기 파일 업로드 기능은, 클라이언트 단말로부터 상기 중계 서버로 파일이 업로드되면, 업로드된 파일의 속성 정보들을 포함하는 제1 메타데이터가 생성되어 상기 VFS에 저장되고, 상기 업로드된 파일은 파일 저장 서버의 클라우드 파일 저장소에 저장되고, 상기 업로드된 파일의 컨텐츠에 대한 정보들을 포함하는 제2 메타데이터는 상기 메타데이터 서버에 저장된다. 상기 파일 다운로드 기능은, 상기 중계 서버로 클라이언트 단말로부터 특정 파일의 다운로드가 요청되면, VFS의 제1 메타데이터 및 인덱스 정보를 확인하고, 상기 파일 저장 서버의 클라우드 파일 저장소로부터 해당 파일을 획득하여 클라이언트 단말로 다운로드시키게 된다. 상기 파일 검색 기능은, 클라이언트 단말로부터 입력된 검색 정보를 분석하여, 제1 메타 데이터 및 제2 메타데이터를 검색하여 검색 결과 정보를 제공하게 된다. 이들 각 기능에 대한 구체적인 설명은 후술한다. The cloud storage system according to the present invention provides a file upload function, a file search function, and a file download function to client terminals through the relay server. In the file upload function, when a file is uploaded from the client terminal to the relay server, first metadata including attribute information of the uploaded file is generated and stored in the VFS, and the uploaded file is stored in the cloud of the file storage server. The second metadata stored in the file storage and including information on the contents of the uploaded file is stored in the metadata server. The file download function, when a download of a specific file is requested from the client terminal to the relay server, checks the first metadata and index information of the VFS, and obtains the file from the cloud file storage of the file storage server to the client terminal will be downloaded to The file search function analyzes search information input from the client terminal, searches the first metadata and the second metadata, and provides search result information. A detailed description of each of these functions will be described later.
상기 가상 파일 시스템(Virtual File System; 'VFS', 20)은, 상기 중계 서버로부터의 요청에 따라 상기 업로드된 파일에 대한 제1 메타데이터를 생성하여 파일시스템 데이터베이스(File System Database)에 저장하고, 상기 제1 메타 데이터들 중 파일 식별 정보인 인덱스 정보를 상기 중계 서버로 제공한다. 상기 제1 메타데이터는 UUID(Universally Unique IDentifier), 파일 이름, 경로, 업로드를 시도하는 사용자 정보, 접근 권한 정보, 그룹 접근 권한 정보, 파일 생성일자 정보, 파일 크기 정보를 포함한다. 도 2는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 가상 파일 시스템의 파일시스템 데이터베이스를 도시한 구성도이다. 도 2를 참조하면, 상기 VFS의 파일시스템 데이터베이스에는 각 파일들에 대하여 UUID를 기준으로 하여 해당 파일에 대한 속성 정보인 제1 메타데이터들이 저장된다. 한편, 상기 인덱스 정보는 파일을 식별할 수 있는 정보로서, 제1 메타데이터들 중 PID, ID 및 UUID로 이루어진다. 여기서, ID는 가상 파일 시스템에서 유일하게 존재하는 식별자로서, 절대 중복되지 않는 해당 가상 파일 폴더에 대한 고유의 식별자이다. PID는 Parent ID로서, 상위 상관관계를 갖는 ID이며, PID 값이 null이 있는 경우는 최상위 경로를 제외하면 존재하지 않는다. UUID는 실제 파일 데이터에 대한 유일한 식별자로서, 동일한 파일을 여러 번 업로드하더라도 같지 않으며 업로드하는 순간에 생성되며, 업로드하는 순간 해당 파일에 대한 유일한 식별자로 실제로 파일이 저장되는 스토리지에 해당 UUID로 파일이 저장된다. The virtual file system (Virtual File System; 'VFS', 20) generates first metadata for the uploaded file according to a request from the relay server and stores it in a file system database, Index information that is file identification information among the first meta data is provided to the relay server. The first metadata includes a Universally Unique IDentifier (UUID), a file name, a path, user information attempting to upload, access right information, group access right information, file creation date information, and file size information. 2 is a block diagram illustrating a file system database of a virtual file system in a cloud storage system according to a preferred embodiment of the present invention. Referring to FIG. 2 , in the file system database of the VFS, first metadata, which is attribute information for each file, is stored on the basis of a UUID for each file. Meanwhile, the index information is information for identifying a file, and includes a PID, an ID, and a UUID among the first metadata. Here, the ID is a unique identifier in the virtual file system, and is a unique identifier for the virtual file folder that is never duplicated. The PID is a Parent ID, which is an ID having a higher correlation. If the PID value is null, it does not exist except for the top-level path. UUID is a unique identifier for the actual file data, even if the same file is uploaded multiple times, it is not the same and is created at the moment of upload. do.
도 3은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일 저장 서버의 구성을 개략적으로 도시한 블록도이다. 도 3을 참조하면, 상기 파일 저장 서버(30)는 클라우드 파일 저장소(32)를 구비하여 상기 중계 서버로부터 제공된 파일을 인덱스 정보와 함께 상기 클라우드 파일 저장소에 저장하고, 해당 파일에 대한 저장 위치 정보를 상기 중계 서버로 제공한다. 또한, 상기 파일 저장 서버(30)는 제2 메타데이터 생성부(34)를 더 구비하며, 상기 제2 메타데이터 생성부(34)는, 클라우드 파일 저장소에 저장된 파일에 대한 컨텐츠를 분석하여 파일의 컨텐츠에 대한 제2 메타데이터를 추출하고, 파일에 대한 인덱스 정보와 함께 상기 제2 메타데이터를 상기 중계 서버로 제공한다. 한편, 상기 중계 서버는 파일 저장 서버로부터 파일에 대한 인덱스 정보와 제2 메타데이터가 수신되면, 메타데이터 서버(40)로 제공하여 제2 메타데이터들을 갱신하게 된다. 3 is a block diagram schematically illustrating a configuration of a file storage server in a cloud storage system according to a preferred embodiment of the present invention. Referring to FIG. 3 , the
상기 메타데이터 서버(40)는 상기 중계 서버로부터 파일에 대한 인덱스 정보와 제2 메타데이터를 제공받아 저장 및 관리한다. 도 4은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 메타데이터 서버(40)에 저장되는 파일의 컨텐츠에 대한 제2 메타데이터들을 예시적으로 도시한 도표이다. 도 4을 참조하면, 제2 메타데이터는 파일의 컨텐츠에 대한 속성 정보들로써, 파일의 카테고리에 따라 다양하게 설정될 수 있다. The
도 3을 참조하면, 상기 파일 저장 서버의 상기 제2 메타데이터 생성부는, 파일 카테고리 검출 모듈(340) 및 제2 메타데이터 획득 모듈(350)을 구비한다. 상기 파일 카테고리 검출 모듈(340)은, 상기 클라우드 파일 저장소에 저장된 파일에 대한 이진 데이터 파일(Binary File)로부터 파일 시그너처(File Signature)를 추출하고, 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 검출한다. 도 5는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일에 대한 이진 데이터 파일을 예시적으로 도시한 것이다. 도 5에 있어서, (a)는 PDF 파일에 대한 이진 데이터 파일의 헤더(Header)의 일부이며, (b)는 의료데이터파일인 DCM 파일에 대한 이진 데이터 파일의 헤더(Header)의 일부이다. 도 5를 참조하면, 이진 데이터 파일의 헤더로부터, 각 파일의 카테고리를 판단할 수 있는 파일 시그너처를 각각 추출할 수 있게 된다. Referring to FIG. 3 , the second metadata generator of the file storage server includes a file
상기 제2 메타데이터 획득 모듈(350)은 상기 파일의 카테고리에 따라 사전 설정된 방법에 따라 파일의 컨텐츠에 대한 제2 메타데이터를 획득하여 상기 중계 서버로 제공한다. 상기 제2 메타데이터 획득 모듈(350)은, 파일의 카테고리에 따라 적용되는 이미지 인식 모듈(352), 텍스트 인식 모듈(354), 의료 데이터 인식 모듈(356) 및 범용 인식 모듈(358)을 구비한다. The second
상기 이미지 인식 모듈(352)은, 이미지 파일에 대한 제2 메타 데이터를 획득하여 제공하는 모듈이다. 도 6는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 이미지 인식 모듈을 개략적으로 도시한 구성도이다. 도 6에 있어서, (a)는 학습 과정에 의한 제2 메타데이터 추출 모델을 생성하는 과정을 도시한 것이며, (b)는 추출 모델을 이용하여 임의의 이미지에 대하여 제2 메타데이터를 정의하는 과정을 도시한 것이다. 도 6를 참조하면, 본 발명에 따른 상기 이미지 인식 모듈은, (a)에 도시된 바와 같이 딥러닝 기술을 이용하여 학습용 이미지들을 사전 학습하여 이미지들로부터 제2 메타데이터를 생성해 낼 수 있는 모델을 생성하며, (b)에 도시된 바와 같이, 상기 이미지 파일을 상기 학습에 의해 생성된 모델에 적용함으로써, 해당 이미지 파일에 대한 제2 메타데이터들을 정의하여 출력하게 된다. 전술한 이미지 인식 기술은 이미 딥러닝 기술을 이용하여 널리 활용되고 있는 기술로서, 학습 과정을 통해 각 이미지들에 대하여 이미지로부터 오브젝트(Object)를 검출하고, 검출된 오브젝트들이 포함된 영역을 구획화(Segmentation)하고, 해당 오브젝트의 클래스를 분류하는 과정들이 포함된다. 따라서, 상기 이미지 인식 모듈(352)은 이미지에 포함된 오브젝트(Object)에 대한 종류, 특성, 속성, 색상 정보 등과 배경에 대한 정보 등을 추출하여 제2 메타데이터로 제공하게 된다. The
상기 텍스트 인식 모듈(354)은 파일에 대한 제2 메타 데이터를 획득하여 제공하는 모듈이다. 도 7은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 텍스트 인식 모듈을 개략적으로 도시한 구성도이다. 도 7을 참조하면, 텍스트 인식 모듈은 텍스트 파일에 포함된 특정 문장에서 각 키워드를 추출하고, 문장 내에서 키워드가 등장하는 빈도와 유사도를 검출하고, 상기 빈도와 유사도를 이용하여 랭크(rank)를 계산하고, 이러한 랭크를 이용하여 텍스트 요약까지 생성하며, 이렇게 생성된 정보들을 제2 메타데이터로 획득하게 된다. 따라서, 텍스트 인식 모듈(354)은 텍스트 파일에 포함된 다양한 키워드들과 요약 등을 추출하여 제2 메타데이터로 제공하게 된다. The
상기 의료 데이터 인식 모듈(356)은, 의료 데이터 파일에 대한 제2 메타 데이터를 획득하여 제공하는 모듈이다. 도 8은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 의료 데이터 인식 모듈을 개략적으로 도시한 구성도이다. 도 8을 참조하면, 의료 영상 데이터 파일인 DCM File로부터 표준 태그를 추출하고, 표준 태그들을 제2 메타데이터로 정의하여 획득하게 된다. 일반적으로 상기 의료 데이터 파일은 의료 영상 데이터(DICOM File 및 DCM File)를 포함하며, 이러한 DCM 파일들은 의료 영상 데이터 표준으로서 관련 태그, 즉 메타데이터들이 이미 표준으로 정의되어 있다. 따라서, 의료 데이터 인식 모듈은 의료 영상 데이터 파일에 포함된 표준 태그들을 추출하고 일부 선별하여 제2 메타데이터로 사용할 수 있다. The medical
도 9은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 의료 영상 데이터 파일(DICOM FILE) 및 이로부터 획득될 수 있는 제2 메타데이터들을 예시적으로 도시한 것이다. 도 9을 참조하면, 의료 영상 데이터에는 이미지(Image) 영역과 태그(Tags) 영역이 있으며, 이들로부터 제2 메타데이터들을 선별하여 추출할 수 있게 된다. 의료 영상 데이터로부터 추출할 수 있는 제2 메타데이터로는 측정일, 측정시, 환자 정보 등이 포함될 수 있다. 9 exemplarily illustrates a medical image data file (DICOM FILE) and second metadata obtainable therefrom in a cloud storage system according to a preferred embodiment of the present invention. Referring to FIG. 9 , there are an image area and a tag area in medical image data, and second metadata can be selected and extracted from them. The second metadata that can be extracted from the medical image data may include a measurement date, measurement time, patient information, and the like.
상기 범용 인식 모듈(358)은, 파일의 형식을 정상적으로 인식할 수 없는 파일에 대하여 데이터 구조 형식을 분석하여 제2 메타 데이터를 획득하여 제공하는 모듈이다. 클라우드 파일 저장소에 저장된 파일이 앞서 설명한 이미지 파일, 텍스트 파일, 의료 데이터 파일이 아닌 경우, 상기 범용 인식 모듈(358)을 이용하여 해당 파일의 컨텐츠에 대한 제2 메타데이터를 추출하게 된다. 도 10는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 범용 인식 모듈을 개략적으로 도시한 구성도이다. JSON 파일은 key value(키 값)이 맵핑된 자료형으로서, 텍스트 기반의 데이터 포맷으로 이루어진다. 도 10를 참조하면, 범용 인식 모듈은 JSON FILE에 대하여 키와 키 값을 추출하고, 키 및 키 값으로부터 정보를 추출하여 제2 메타데이터로 정의하게 된다. 또한, 해당 파일에 포함된 키(Key)가 텍스트(Text)인 경우에는 텍스트 랭크(Text Rank) 기법을 적용하여 제2 메타데이터를 추출할 수도 있다. The general-
이하, 도 10를 참조하여 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에서의 파일 업로드 과정에 대하여 구체적으로 설명한다. Hereinafter, a file upload process in the cloud storage system according to a preferred embodiment of the present invention will be described in detail with reference to FIG. 10 .
도 10는 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일 업로드 및 데이터 갱신 과정을 순차적으로 도시한 시스템 흐름도이다. 10 is a system flowchart sequentially illustrating a file upload and data update process in a cloud storage system according to a preferred embodiment of the present invention.
도 10를 참조하면, 먼저, 사용자가 외부의 클라이언트 단말을 통해 중계 서버에 임의의 파일을 업로드한다(단계 500). 이때, 파일 이름, 파일이 업로드될 경로 정보, 파일 사이즈, 업로드를 시도하는 사용자 정보가 함께 업로드된다. Referring to FIG. 10 , first, a user uploads an arbitrary file to the relay server through an external client terminal (step 500). At this time, the file name, the path information to which the file is to be uploaded, the file size, and information about the user attempting to upload are uploaded together.
상기 중계 서버는, 클라이언트 단말로부터 파일이 업로드되면, 가상 파일 시스템으로 권한 체크, 인덱스 검증 및 생성을 요청하게 된다(단계 510). When a file is uploaded from the client terminal, the relay server requests permission check, index verification, and creation from the virtual file system (step 510).
상기 요청에 따라, 상기 가상 파일 시스템은 해당 경로에 대하여 파일을 쓸 권한이 있는지 여부를 확인한다. 이때, 상기 가상 파일 시스템은 권한 확인을 위하여, 해당 경로의 소유자인지 여부, 해당 그룹에 포함되어 있는지 여부 및 소유 권한없이 파일을 기록할 수 있는지 여부를 판단한다. 다음, 가상 파일 시스템은 인덱스 검증을 위하여 파일을 업로드할 경로가 존재하는지 여부 및 해당 경로에 파일을 기록할 공간이 존재하는지 여부를 판단한다. 다음, 가상 파일 시스템은 무작위(random)로 128bit의 UUID를 중복되지 않도록 생성하고, 파일로부터 정형화된 파일의 속성 정보들인 제1 메타데이터를 추출하여 저장한다(단계 512). 상기 제1 메타데이터는 파일 이름, 파일 사이즈, 사용자 정보, 그룹 정보, 생성일시, 권한, 디렉토리 여부, UUID 등을 포함한다. In response to the request, the virtual file system checks whether or not there is an authority to write a file to the corresponding path. In this case, the virtual file system determines whether the user is the owner of the corresponding path, whether it is included in the corresponding group, and whether the file can be recorded without the ownership right, in order to check the authority. Next, for index verification, the virtual file system determines whether a path to upload a file exists and whether a space to record a file exists in the path. Next, the virtual file system randomly generates 128-bit UUIDs so that they are not duplicated, and extracts and stores first metadata, which is standardized file attribute information, from the file (step 512). The first metadata includes a file name, file size, user information, group information, creation date and time, authority, directory status, UUID, and the like.
또한, 상기 가상 파일 시스템은 중계 서버의 요청에 따라 상기 제1 메타데이터로부터 인덱스 정보를 추출하여 중계 서버로 전송한다(단계 520). 상기 인덱스 정보는 각 파일을 식별할 수 있는 정보로서, 각 파일에 대한 ID, PID, UUID 를 포함한다. Also, the virtual file system extracts index information from the first metadata according to the request of the relay server and transmits the extracted index information to the relay server (step 520). The index information is information for identifying each file, and includes an ID, PID, and UUID for each file.
상기 중계 서버는 VFS로부터 인덱스 정보가 전달되면, 파일 저장 서버의 클라우드 파일 저장소에 인덱스 정보와 함께 상기 파일을 저장하고(단계 530), 상기 가상 파일 시스템의 파일 저장소 정보를 업데이트하고(단계 532), 클라이언트 단말로 파일 업로드가 완료되었음을 통지한다(단계 534). 만약, 전술한 단계 530의 파일 저장시 에러가 발생되면, 파일 저장소 정보를 업데이트하지 않고, 단계 512에서 생성된 제1 메타데이터는 삭제되며, 파일 업로드 과정은 종료한다. When the index information is transmitted from the VFS, the relay server stores the file together with the index information in the cloud file storage of the file storage server (step 530), and updates the file storage information of the virtual file system (step 532), Notifies the client terminal that the file upload has been completed (step 534). If an error occurs when storing the file in step 530, the first metadata generated in step 512 is deleted without updating the file storage information, and the file upload process is terminated.
한편, 상기 파일 저장 서버는 클라우드 파일 저장소에 저장된 파일에 대하여 파일의 컨텐츠의 속성 정보인 제2 메타데이터를 생성하고(단계 540), 생성된 제2 메타데이터를 해당 파일의 인덱스 정보와 함께 중계 서버로 전송한다(단계 542). 여기서, 상기 파일 저장 서버의 제2 메타데이터 생성은 전술한 파일 저장 서버의 제2 메타데이터 생성부에 의해 구현될 수 있다. On the other hand, the file storage server generates second metadata that is attribute information of the contents of the file with respect to the file stored in the cloud file storage (step 540), and transmits the generated second metadata together with the index information of the file to the relay server to (step 542). Here, the second metadata generation of the file storage server may be implemented by the above-described second metadata generation unit of the file storage server.
파일의 인덱스 정보 및 해당 파일에 대한 제2 메타데이터를 제공받은 중계 서버는 인덱스 정보와 제2 메타데이터 정보를 메타데이터 서버로 전송하여 저장함으로써, 메타데이터 서버를 업데이트시킨다(단계 550).The relay server receiving the index information of the file and the second metadata for the file transmits and stores the index information and the second metadata information to the metadata server, thereby updating the metadata server (step 550).
이하, 도 11을 참조하여 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서의 파일 검색 및 다운로드 과정을 구체적으로 설명한다. Hereinafter, a file search and download process in the cloud storage system according to a preferred embodiment of the present invention will be described in detail with reference to FIG. 11 .
도 11은 본 발명의 바람직한 실시예에 따른 클라우드 스토리지 시스템에 있어서, 파일 검색 및 다운로드 과정을 순차적으로 도시한 시스템 흐름도이다. 도 11을 참조하면, 클라이언트 단말로부터 검색 조건 정보의 입력과 함께 검색이 요청되면(단계 600), 상기 중계 서버는 입력된 검색 조건 정보를 확인하고, 상기 검색 조건 정보가 파일 속성 정보인 제1 메타데이터와 컨텐츠 속성 정보인 제2 메타데이터 중 어느 것에 해당되는지 여부를 판별한다(단계 610). 11 is a system flow diagram sequentially illustrating a file search and download process in a cloud storage system according to a preferred embodiment of the present invention. Referring to FIG. 11 , when a search is requested along with input of search condition information from the client terminal (step 600), the relay server checks the input search condition information, and the search condition information is a first meta information that is file attribute information. It is determined whether the data corresponds to any of the data and the second metadata that is content attribute information (step 610).
만약 검색 조건 정보가 파일 속성 정보인 제1 메타데이터에 관한 것인 경우, 가상 파일 시스템의 제1 메타데이터를 검색하고, 검색된 파일에 대한 권한을 체크한다(단계 620). 다음, VFS는 검색 결과에 따라 검색된 파일에 대한 인덱스 정보 및 해당 파일에 대한 클라우드 파일 저장소의 저장 위치 정보를 중계서버로 전송한다(단계 622). If the search condition information relates to the first metadata that is the file attribute information, the first metadata of the virtual file system is searched and the authority for the searched file is checked (step 620). Next, the VFS transmits the index information on the file searched according to the search result and the storage location information of the cloud file storage for the file to the relay server (step 622).
만약 검색 조건 정보가 컨텐츠 속성 정보인 제2 메타데이터에 관한 것인 경우, 메타데이터 서버의 제2 메타데이터를 검색하고(단계 624), 메타데이터 서버는 검색 결과 정보인 매칭 데이터를 중계서버로 전송한다(단계 626). 메타데이터 서버로부터 매칭 데이터를 전달받은 상기 중계서버는 매칭 데이터를 기반으로 하여 가상 파일 시스템으로 조회 및 권한 체크를 요청하고(단계 628), 상기 가상 파일 시스템은 조회 및 권한 체크후 매칭 데이터에 대응하는 인덱스 정보 및 클라우드 파일 저장소의 저장 위치 정보를 중계 서버로 전달한다(단계 629). If the search condition information relates to the second metadata that is the content attribute information, the second metadata of the metadata server is searched (step 624), and the metadata server transmits matching data, which is the search result information, to the relay server. do (step 626). After receiving the matching data from the metadata server, the relay server requests an inquiry and permission check to the virtual file system based on the matching data (step 628), and the virtual file system responds to the matching data after the inquiry and permission check. The index information and the storage location information of the cloud file storage are transmitted to the relay server (step 629).
다음, 상기 중계 서버는 가상 파일 시스템으로부터 전달받은 인덱스 정보 및 파일 저장 위치 정보를 토대로 하여 파일 저장 서버로 해당 파일을 요청하고(단계 630), 이에 따라 파일 저장 서버는 해당 파일을 중계 서버로 제공하며(단계 640), 중계 서버는 해당 파일을 클라이언트 단말에게 다운로드시킨다(단계 650). Next, the relay server requests the file to the file storage server based on the index information and the file storage location information received from the virtual file system (step 630), and accordingly, the file storage server provides the file to the relay server, (Step 640), the relay server downloads the file to the client terminal (Step 650).
이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나, 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 그리고, 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다. In the above, the present invention has been described with respect to the preferred embodiment thereof, but this is merely an example and does not limit the present invention, and those of ordinary skill in the art to which the present invention pertains without departing from the essential characteristics of the present invention. It will be appreciated that various modifications and applications not exemplified above in the scope are possible. In addition, differences related to such modifications and applications should be construed as being included in the scope of the present invention defined in the appended claims.
1 : 클라우드 스토리지 시스템
10 : 중계 서버(Resource Broker ; 'RB')
20 : 가상 파일 시스템(Virtual File System; 'VFS')
30 : 파일 저장 서버(Storage Element ; 'SE' )
32 : 클라우드 파일 저장소
34 : 제2 메타데이터 생성부
340 : 파일 카테고리 검출 모듈
350 : 제2 메타데이터 획득 모듈
40 : 메타데이터 서버( Metadata Server ; 'MS' )1: Cloud storage system
10: Relay Server (Resource Broker ; 'RB')
20: Virtual File System ('VFS')
30: File storage server (Storage Element; 'SE')
32 : Cloud File Storage
34: second metadata generating unit
340: file category detection module
350: second metadata acquisition module
40: Metadata Server ( Metadata Server ; 'MS')
Claims (8)
상기 중계 서버로부터의 요청에 따라 상기 업로드된 파일에 대한 파일 속성 정보인 제1 메타데이터를 생성하여 저장하고, 제1 메타데이터로부터 파일 고유 식별 정보인 인덱스 정보를 추출하여 상기 중계 서버에게 전송하는 가상 파일 시스템;
클라우드 파일 저장소를 구비하여 상기 중계 서버로부터 제공된 파일을 상기 클라우드 파일 저장소에 저장하고, 저장 위치 정보를 상기 중계 서버로 제공하며, 저장된 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 추출하여 상기 중계 서버로 제공하는 파일 저장 서버;
상기 중계 서버로부터 파일에 대한 인덱스 정보 및 제2 메타데이터를 제공받아 저장 및 관리하는 메타데이터 서버;
를 구비하고, 상기 중계 서버는,
가상 파일 시스템으로부터 파일에 대한 인덱스 정보를 제공받고,
상기 인덱스 정보와 함께 해당 파일을 상기 파일 저장 서버로 제공하여 저장하고, 파일 저장 서버로부터 파일에 대한 파일 저장 위치 정보 및 제2 메타데이터를 제공받고,
파일에 대한 인덱스 정보 및 제2 메타데이터를 상기 메타데이터 서버에 제공하여 저장 및 관리하는 것을 특징으로 하는 것을 특징으로 하는 클라우드 스토리지 시스템.When a file is uploaded from an external client terminal, a relay server for requesting creation of an index for the uploaded file to the virtual file system;
Virtual data for generating and storing first metadata that is file attribute information for the uploaded file according to a request from the relay server, extracting index information that is file unique identification information from the first metadata and transmitting it to the relay server file system;
A cloud file storage is provided to store the file provided from the relay server in the cloud file storage, the storage location information is provided to the relay server, and second metadata that is content attribute information for the stored file is extracted to the relay server. File storage server provided by;
a metadata server that receives, stores, and manages index information and second metadata on a file from the relay server;
comprising, the relay server,
Receive index information about the file from the virtual file system,
Provide and store the file together with the index information to the file storage server, and receive file storage location information and second metadata for the file from the file storage server,
A cloud storage system, characterized in that it stores and manages by providing index information and second metadata on the file to the metadata server.
상기 제2 메타데이터 생성부는,
상기 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)로부터 파일 시그너처(File Signature)를 추출하고, 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 추출하고, 상기 파일의 카테고리에 따라 사전 설정된 방법에 따라 제2 메타데이터를 획득하여 상기 중계 서버로 제공하는 것을 특징으로 하는 클라우드 스토리지 시스템.The method of claim 1, wherein the file storage server further comprises a second metadata generator,
The second metadata generation unit,
Extracting a file signature from a binary file for a file stored in the cloud file storage, extracting information about a category of a file from the file signature, and a method preset according to the category of the file The cloud storage system according to claim 1, wherein the second metadata is obtained and provided to the relay server.
상기 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)을 판독하여 파일 시그너처(File Signature)를 추출하고, 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 검출하는 파일 카테고리 검출 모듈; 및
파일의 카테코리에 대한 정보에 따라 사전 설정된 모듈을 이용하여 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 획득하고, 획득된 제2 메타데이터를 저장하고 상기 중계 서버로 제공하는 제2 메타데이터 획득 모듈;을 구비하고,
상기 제2 메타데이터 획득 모듈은,
이미지 파일에 대한 제2 메타 데이터를 획득하여 제공하는 이미지 인식 모듈;
텍스트 파일에 대한 제2 메타 데이터를 획득하여 제공하는 텍스트 인식 모듈;
의료 데이터 파일에 대한 제2 메타 데이터를 획득하여 제공하는 의료 데이터 인식 모듈;
파일의 형식을 정상적으로 인식할 수 없는 파일에 대하여 데이터 구조 형식을 분석하여 제2 메타 데이터를 획득하여 제공하는 범용 인식 모듈;
을 구비하는 것을 특징으로 하는 클라우드 스토리지 시스템.The method of claim 2, wherein the second metadata generator comprises:
a file category detection module that reads a binary file for a file stored in the cloud file storage, extracts a file signature, and detects information about a file category from the file signature; and
A second metadata acquisition module for acquiring second metadata that is content attribute information for a file using a preset module according to information on a category of a file, and storing the acquired second metadata and providing it to the relay server ; and
The second metadata acquisition module includes:
an image recognition module that obtains and provides second metadata for the image file;
a text recognition module that obtains and provides second metadata for the text file;
a medical data recognition module that obtains and provides second metadata for the medical data file;
a general-purpose recognition module for obtaining and providing second metadata by analyzing a data structure format for a file whose format cannot be recognized normally;
A cloud storage system comprising a.
CNN(Convolution Neural Network) 알고리즘을 기반으로 학습하여 구성된 모듈로서, 상기 이미지 인식 모듈에 의한 제2 메타데이터는 이미지 파일에 포함된 오브젝트에 대한 정보를 포함하는 것을 특징으로 하는 클라우드 스토리지 시스템.The method of claim 3, wherein the image recognition module
A module configured by learning based on a Convolution Neural Network (CNN) algorithm, wherein the second metadata by the image recognition module includes information about an object included in an image file.
텍스트 파일에 포함된 단어 및 문장 정보를 검출하여 제2 메타데이터로 제공하는 것을 특징으로 하는 클라우드 스토리지 시스템.The method of claim 3, wherein the text recognition module
A cloud storage system, comprising detecting word and sentence information included in a text file and providing it as second metadata.
상기 클라이언트 단말로부터 검색 조건 정보가 입력되고 검색이 요청되면,
상기 입력된 검색 조건 정보를 분석하고,
상기 검색 조건 정보가 파일의 속성 정보인 제1 메타 데이터에 관한 것이면, VFS로 검색 요청하고, 상기 검색 조건 정보가 파일의 컨텐츠 속성 정보인 제2 메타데이터에 관한 것이면, 메타데이터 서버로 검색 요청하고,
검색 요청에 따라 인덱스 정보를 포함하는 결과 정보가 수신되면, 해당 인덱스 정보에 대응되는 파일을 파일 저장 서버로부터 제공받아 클라이언트 단말로 제공하는 것을 특징으로 하는 클라우드 스토리지 시스템.According to claim 1, wherein the relay server,
When search condition information is input from the client terminal and a search is requested,
Analyze the input search condition information,
If the search condition information relates to first metadata that is attribute information of a file, a VFS search is requested, and if the search condition information relates to second metadata that is content attribute information of a file, a search is requested to a metadata server, ,
When result information including index information is received according to a search request, a file corresponding to the index information is provided from the file storage server and provided to the client terminal.
(a) 클라우드 파일 저장소에 저장된 파일에 대한 이진 파일(Binary File)을 판독하여 파일 시그너처(File Signature)를 추출하는 단계;
(b) 상기 파일 시그너처로부터 파일의 카테고리에 대한 정보를 검출하는 단계;
(c) 파일의 카테코리에 대한 정보에 따라 사전 설정된 모듈을 이용하여 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 획득하는 단계; 및
(d) 상기 획득된 제2 메타데이터를 저장하고 상기 중계 서버로 제공하는 단계;
를 구비하여, 클라우드 파일 저장소에 저장된 파일에 대한 컨텐츠 속성 정보인 제2 메타데이터를 생성하여 제공하는 것을 특징으로 하는 클라우드 스토리지 시스템에서의 메타데이터 생성 방법. A method for generating metadata by a file storage server in a cloud storage system including a relay server, a virtual file system, a file storage server, and a metadata server, the method comprising:
(a) extracting a file signature (File Signature) by reading a binary file (Binary File) for a file stored in the cloud file storage;
(b) detecting information on a category of a file from the file signature;
(c) acquiring second metadata, which is content attribute information for the file, using a preset module according to the information on the category of the file; and
(d) storing the obtained second metadata and providing it to the relay server;
A method for generating metadata in a cloud storage system, comprising: generating and providing second metadata that is content attribute information for a file stored in the cloud file storage.
파일의 카테고리가 이미지 파일이면, 이미지에 포함된 오브젝트의 종류를 판별하고 적어도 오브젝트에 대한 정보를 제2 메타데이터로 제공하며,
파일의 카테고리가 텍스트 파일이면, 텍스트 파일에 포함된 단어 및 문장을 추출하고, 적어도 단어 및 문장에 대한 정보를 제2 메타데이터로 제공하며,
파일의 카테고리가 의료 데이터이면, 의료 데이터에 포함된 촬영 정보 및 환자 정보를 추출하고 적어도 환자 정보를 제2 메타데이터로 제공하는 것을 특징으로 하는 클라우드 스토리지 시스템에서의 메타데이터 생성 방법.
The method of claim 7, wherein the step (c) comprises:
If the category of the file is an image file, the type of object included in the image is determined and at least information about the object is provided as second metadata,
If the category of the file is a text file, extracts words and sentences included in the text file, and provides at least information about the words and sentences as second metadata;
If the category of the file is medical data, the method for generating metadata in a cloud storage system, comprising extracting photographing information and patient information included in the medical data, and providing at least patient information as second metadata.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190175558A KR20210083007A (en) | 2019-12-26 | 2019-12-26 | Cloud storage system and method of generating contents metadata in the cloud storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190175558A KR20210083007A (en) | 2019-12-26 | 2019-12-26 | Cloud storage system and method of generating contents metadata in the cloud storage system |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210083007A true KR20210083007A (en) | 2021-07-06 |
Family
ID=76860889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190175558A KR20210083007A (en) | 2019-12-26 | 2019-12-26 | Cloud storage system and method of generating contents metadata in the cloud storage system |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20210083007A (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090037704A (en) | 2007-10-12 | 2009-04-16 | 차병래 | Meta data generation method for intutive image search |
KR101285654B1 (en) | 2011-07-06 | 2013-08-14 | 주식회사 씬멀티미디어 | Realtime transcoding device for progressive downloading of which meta data and media data saperated |
KR20150048260A (en) | 2013-10-24 | 2015-05-07 | 에스케이플래닛 주식회사 | Method for sharing contents based on cloud computing, system and service apparatus thereof |
-
2019
- 2019-12-26 KR KR1020190175558A patent/KR20210083007A/en not_active Application Discontinuation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090037704A (en) | 2007-10-12 | 2009-04-16 | 차병래 | Meta data generation method for intutive image search |
KR101285654B1 (en) | 2011-07-06 | 2013-08-14 | 주식회사 씬멀티미디어 | Realtime transcoding device for progressive downloading of which meta data and media data saperated |
KR20150048260A (en) | 2013-10-24 | 2015-05-07 | 에스케이플래닛 주식회사 | Method for sharing contents based on cloud computing, system and service apparatus thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10868827B2 (en) | Browser extension for contemporaneous in-browser tagging and harvesting of internet content | |
US9489401B1 (en) | Methods and systems for object recognition | |
AU2014384636B2 (en) | Systems and methods for ephemeral eventing | |
EP2973013B1 (en) | Associating metadata with images in a personal image collection | |
US8897508B2 (en) | Method and apparatus to incorporate automatic face recognition in digital image collections | |
US20090164502A1 (en) | Systems and methods of universal resource locator normalization | |
CN101986292B (en) | Method and system for processing forms based on an image | |
KR20130102549A (en) | Automatic media sharing via shutter click | |
US10977677B2 (en) | Contact importer | |
US20150169207A1 (en) | Systems and methods for generating personalized account reconfiguration interfaces | |
US20220272096A1 (en) | Media data based user profiles | |
CN110532529A (en) | A kind of recognition methods of file type and device | |
US20140006351A1 (en) | Method, a server, a system and a computer program product for copying data from a source server to a target server | |
US11797617B2 (en) | Method and apparatus for collecting information regarding dark web | |
Raghavan et al. | Eliciting file relationships using metadata based associations for digital forensics | |
CN111403011A (en) | Registered department pushing method, device and system, electronic equipment and storage medium | |
KR20210083007A (en) | Cloud storage system and method of generating contents metadata in the cloud storage system | |
JP2017224158A (en) | Information processing device, data retrieval method, program, data structure and data processing system | |
KR102639645B1 (en) | System and method for searching digital asset using nft | |
US11880392B2 (en) | Systems and methods for associating data with a non-material concept | |
US20240119170A1 (en) | Machine learning (ml) model pipeline with obfuscation to protect sensitive data therein | |
KR102347028B1 (en) | System and method for providing rmi of shared images rights | |
US20240169195A1 (en) | Machine learning-based systems and methods for identifying and resolving content anomalies in a target digital artifact | |
CN114385710A (en) | Data analysis method and device, electronic equipment and storage medium | |
Hussein et al. | Criminals Identification System (Cids) Using Face Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |