WO2023146237A1 - Intelligent data management and storage device, and intelligent data management and storage method using same - Google Patents

Intelligent data management and storage device, and intelligent data management and storage method using same Download PDF

Info

Publication number
WO2023146237A1
WO2023146237A1 PCT/KR2023/001051 KR2023001051W WO2023146237A1 WO 2023146237 A1 WO2023146237 A1 WO 2023146237A1 KR 2023001051 W KR2023001051 W KR 2023001051W WO 2023146237 A1 WO2023146237 A1 WO 2023146237A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
file
storage
files
management
Prior art date
Application number
PCT/KR2023/001051
Other languages
French (fr)
Korean (ko)
Inventor
박성원
정철영
정진홍
Original Assignee
(주)한국소프트웨어아이엔씨
주식회사 비에이치에이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020220070617A external-priority patent/KR102616356B1/en
Application filed by (주)한국소프트웨어아이엔씨, 주식회사 비에이치에이 filed Critical (주)한국소프트웨어아이엔씨
Publication of WO2023146237A1 publication Critical patent/WO2023146237A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/188Virtual file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers

Definitions

  • the present specification relates to an intelligent data management and storage device and an intelligent data management and storage method using the same.
  • Data storage technology is a technology that stores data in a data storage (storage medium) to secure data stability and smoothly support business.
  • Existing data storage technology uses a method of reading original data and storing a copy of the read data as it is in a data storage, or compressing and storing the read data in a data storage to reduce data storage space.
  • the method may include collecting file information on a management target file; analyzing and classifying the management target file for each category based on the collected file information; optimizing the classified files according to a first preset criterion; and selecting and storing the optimized file in a data storage according to a second preset criterion.
  • the intelligent data management and storage method and other embodiments may include the following features.
  • the step of classifying the management target files for each category based on the collected file information is the step of classifying the management target files according to usage time slots based on usage time information of the collected files, and , Optimizing the classified files according to a first preset criterion may include compressing files of a specific time period among the classified files.
  • the step of classifying the management target files for each category based on the collected file information is the step of classifying the management target files for each file type based on the file type information of the collected files.
  • Optimizing the classified files according to a first preset criterion may include compressing the classified files using different compression methods for each file type.
  • the step of selecting and storing the optimized file in a data store according to a second preset criterion may include analyzing a use cost of each of a plurality of data stores; and storing the optimized file in a data storage having a minimum usage cost among the plurality of data storages.
  • the usage cost may be determined by at least one of a type of storage medium of the data store, an installation location of the data store, an owner of the data store, and a purpose of the data store.
  • the usage cost is determined by a 1 TB storage cost index (T), and the 1 TB storage cost index (T) sets the price (S) of a 1 TB storage space provision service of a data storage provider to 1
  • the storage cost per TB (C) may be calculated as a result of dividing the cost of storage per TB by the total number of TBs.
  • the categories are divided into classifications including file size, file characteristics, and file use frequency, and classifying the management target files by category based on the collected file information includes the collected files. Based on the information, the management target files may be classified according to file size ranges, file characteristics, or file usage frequency ranges.
  • the method may further include providing data information on the management target file by virtualizing the management target file.
  • the computer program may be a computer program stored in a computer readable recording medium in order to execute each step included in the intelligent data management and storage method according to any one of the above steps by being combined with computer hardware.
  • the device includes a memory for storing one or more instructions; and a processor for executing the instruction, wherein when the instruction is executed, the processor collects file information about a file to be managed, and classifies the file to be managed by category based on the collected file information. and optimize the classified file according to a first preset criterion, and select and store the optimized file in a data storage according to a second preset criterion.
  • FIG 1 shows an example of an intelligent data management and storage system including an intelligent data management and storage device according to an embodiment.
  • FIG. 2 is a block diagram illustrating the configuration of an intelligent data management and storage device according to an embodiment.
  • FIG. 3 is a diagram illustrating an intelligent data management and storage method using an intelligent data management and storage device according to an embodiment.
  • FIG. 4 illustrates an example of visualizing data analysis results applied based on usage time among time indexes.
  • FIG 5 shows an example of visualizing data analysis results according to file types.
  • 6 is a diagram explaining procedures of data analysis and data optimization according to time and file type.
  • FIG. 7 is a diagram illustrating a system configuration for implementing a backup using an intelligent data management and storage method according to an embodiment.
  • FIG. 8 is a diagram illustrating in detail the functions of data analysis, data management, and data storage performed by the intelligent data management and storage method according to the above-described embodiment as a table.
  • FIG. 9 is a block diagram of an AI device according to an embodiment of the present invention.
  • the technology disclosed herein can be applied to data management and storage technology.
  • the technology disclosed in this specification is not limited thereto, and may be applied to all devices and methods to which the technical spirit of the technology may be applied.
  • first and second used herein may be used to describe various components, but the components should not be limited by the terms. These terms are only used for the purpose of distinguishing one component from another. For example, a first element may be termed a second element, and similarly, a second element may be termed a first element, without departing from the scope of the present invention.
  • Intelligent data management and storage technology refers to a technology that sets analysis criteria for data to be managed with a specific metric, analyzes the data according to the criteria, and then optimizes the data.
  • the original data is kept in the storage device as it is, but the data optimization in this specification also optimizes the storage space of the original data by performing optimization such as compression, deduplication, and virtualization of the original data itself.
  • optimization such as compression, deduplication, and virtualization of the original data itself.
  • DB database
  • data storage To store data, it is necessary to define the type of data, file type, database (DB) type (hereinafter referred to as DB), and data storage.
  • the type of data can be classified into file-type data or DB-type data.
  • the file type may be classified into structured and unstructured files including text files, document files, image files, audio files, video files, and other multimedia data.
  • DBs include all types of existing commercialized and used DBs (Oracle, MSSQL, Informix, DB2, SYBASE, MySQL, and all other commercially used DBs), open source-based DBs, and domestically developed and commercialized DBs. All DB types are included.
  • Types of data storage can be divided into local storage, remote storage, cloud storage, and other storage.
  • FIG 1 shows an example of an intelligent data management and storage system including an intelligent data management and storage device according to an embodiment.
  • the intelligent data management and storage system 10 includes an intelligent data management and storage device 100, a plurality of user terminals 200 that are management target computing devices, and a plurality of storage device servers 300. can be configured.
  • the intelligent data management and storage device 100 is connected to a plurality of user terminals 200, collects and analyzes information on data stored in the plurality of user terminals 200, and then collects data according to the analyzed result.
  • the plurality of user terminals 200 are management target computing devices that receive data management services provided by the intelligent data management and storage device 100, and mean PCs connected to the intelligent data management and storage device 100 through a network. can do.
  • these plurality of user terminals 200 may mean a local data server device in which a plurality of PCs are connected to store and share data.
  • These plurality of user terminals 200 receive and install the client program provided by the intelligent data management and storage device 100, through which information and management rights (compression, movement, storage, copy) for stored data are stored. , virtualization, etc.) to the intelligent data management and storage device 100.
  • the plurality of storage device servers 300 may refer to remote storage and cloud storage, excluding local storage provided in the plurality of user terminals 200 connected to the intelligent data management and storage device 100 through a network.
  • the intelligent data management and storage device 100 reads data from a plurality of user terminals 200 and stores them in the plurality of storage device servers 300, or stores user data stored in the plurality of storage device servers 300. It is provided to a plurality of user terminals 200 .
  • FIG. 2 is a block diagram illustrating the configuration of an intelligent data management and storage device according to an embodiment.
  • an intelligent data management and storage device 100 for implementing the method or function proposed in this specification includes a control unit 110, a storage unit 130, a bus (not shown) for data transmission, or an external It may include a communication unit 120 for performing communication with, an output unit 140 and an input unit 150.
  • the illustrated components are not essential, so an intelligent data management and storage device 100 having more or fewer components may be implemented. In addition, these components may be implemented as hardware or software, or through a combination of hardware and software.
  • the controller 110 may refer to all types of processing devices capable of processing data, such as a processor. Controller 110 may be configured to execute processing logic to perform various operations and steps described herein.
  • the 'processor' may refer to a data processing device embedded in hardware having a physically structured circuit to perform functions expressed by codes or instructions included in a program, for example.
  • a data processing device built into hardware a microprocessor, a central processing unit (CPU), a processor core, a multiprocessor, an application-specific integrated (ASIC) circuit), field programmable gate array (FPGA), etc., but the scope of the present invention is not limited thereto.
  • the communication unit 120 may be composed of wired and/or wireless communication modules.
  • the communication unit 120 may use wireless fidelity (Wi-Fi), Bluetooth, Zigbee, near field communication (NFC), wireless broadband Internet (Wibro), and the like.
  • a wireless communication module and a wired communication module such as a wired LAN such as Ethernet may be included.
  • the communication unit 120 may transmit and receive data by performing wired/wireless communication with other devices through a network.
  • the storage unit 130 may include magnetic storage media or flash storage media, but the scope of the present invention is not limited thereto.
  • the output unit 140 is for generating an output related to sight, hearing, or touch, and may include, for example, the display unit 145 .
  • the display unit 145 may implement a touch screen by forming a mutual layer structure or integrally with the touch sensor. Such a touch screen may function as a user input unit providing an input interface between the device and the user, and may provide an output interface between the device and the user.
  • the input unit 150 may be connected to the control unit 110 through an input/output interface connected to a bus.
  • the input unit 150 may include a keyboard, a pointing device, a microphone, a joystick, a touch pad, a scanner, and the like.
  • the input/output interface may include any one of a wide variety of interfaces such as a serial port interface, a PS/2 interface, a parallel port interface, a USB interface, and an IEEE 1394 interface, or may logically represent a combination of other interfaces.
  • the intelligent data management and storage device 100 may be implemented as a separate device (device of FIG. 2) connected to and operating with the user terminal 200 as shown in FIG. 1, and its functions It may be included in the user terminal 200 and implemented as computing elements of the user terminal 200 .
  • the control unit 110 performs the functions of the intelligent data management and storage device 100 to be described later, that is, processes and procedures of an intelligent data management and storage method.
  • FIG. 3 is a diagram illustrating an intelligent data management and storage method using an intelligent data management and storage device according to an embodiment.
  • the intelligent data management and storage method by the intelligent data management and storage device 100 converts copy data generated by reading original data 210 from the user terminal 200 to the storage device server ( 300), data category-based data analysis is performed (S110) before being stored in the data storage prepared in step 300), and then, according to the analysis result, the original data is optimized by methods such as compression and redundancy removal (S120),
  • the optimized data 220 is stored in a local storage (S130) or stored in a data storage provided in the storage device server 300 (S140).
  • the intelligent data management and storage method supports virtualization of the original data (S150), so that after the original data is optimized and moved to the data store, even if the original data 210 stored in the local storage is deleted, the virtualized original data Through the data 211, information of the data can be easily checked.
  • the intelligent data management and storage device 100 learns an artificial intelligence-based data analysis module using this data, automatically analyzes the data, and then optimizes the data.
  • the artificial intelligence-based data analysis module uses the original data and the classification data classified by the user as learning data to classify data into categories and learn optimization patterns for each data category, and then automatically analyze data when new data is entered. By classifying categories, optimization can be performed in an appropriate way.
  • the intelligent data management and storage method analyzes classification and data call patterns according to data characteristics of the original data to be managed, analyzes to minimize data storage costs, and automatically or manually compresses the original data based on this. Data can be managed or moved and stored by removing redundant data or virtualizing it.
  • Intelligent data management and storage methods may be classified into data analysis, data management, and data storage based on data categories.
  • the data analysis function means analyzing data or files based on categories (categories), classifying the data according to types and characteristics, reporting the classification results to the user, and optimizing the data based on the results.
  • data optimization is performed based on categories, and the original data is optimized and stored in the order of optimization for infrequently used data, optimization according to data type, reading/writing other data, or optimization by other categories.
  • the virtualization of the original data provides the user with ledger information on the original data.
  • the categories corresponding to data optimization criteria are (1) Time, (2) File Type, (3) File Size, (4) File Property, and (5) File It can be classified by frequency of use.
  • Category classification analysis based on time divides data into infrequently used data and frequently used data based on the frequency of data use, optimizes and saves the infrequently used data, and virtualizes the original data. It provides the information of the original data to the user.
  • All data (files or DBs) in the user terminal 200 may have three time indexes, and the three time indexes are data creation time (creation time) and data modification time (modification time). time), and the time at which data is called (access time) (or time at which data is read).
  • the intelligent data management and storage method may analyze whether data is used or not based on three time indexes for data including data creation time, data modification time, and data call time.
  • the time index is divided into four levels based on usage time, for example, files used within 6 months of the current time (level 4), files used between 6 and 12 months (level 3), 12 Data is classified into files that have not been used for more than one month (level 2) and unused free space (level 1).
  • the intelligent data management and storage method analyzes the usage time of the data, classifies the level for optimization, and optimizes the data included in the level and stores it in the system, or it can be backed up and stored in a storage with low storage cost.
  • the data belonging to level 4 is only about 20%, and the data belonging to level 3 or later is 80%.
  • the compression rate may vary depending on the type of data, but statistically, the compression rate of data excluding video data or image data is 80% or higher on average, so the storage space for storing the original data is at least 60 % can be optimized.
  • the free space corresponding to level 1, that is, the unused storage space, does not contain data but is not initialized due to the nature of the system, so it may take a long time to optimize. Therefore, this space is set to '0' or Optimization time can be reduced by initializing with '1'.
  • the method for managing and storing intelligent data may classify the entire data into four levels based on the usage time, visualize it in a graph or table, and provide analysis results of the data.
  • FIG. 4 illustrates an example of visualizing data analysis results applied based on usage time among time indexes.
  • the intelligent data management and storage method maintains 24 GB of recently used data corresponding to level 4 among the total storage capacity of 200 GB provided in the user terminal 200 and stores data corresponding to levels 1 to 3.
  • the remaining 176 GB is selected as the optimization target 410 and optimized to 80% for the selected optimization target data, thereby saving about 140 GB of storage space of the user terminal 200 .
  • the intelligent data management and storage method according to the embodiment performs data compression, redundant data removal, and virtualization on 176GB of data to be optimized, and stores it in a local storage in the user terminal 200 or stores it in another storage to store the data locally. Optimize storage.
  • the local storage of the user terminal 200 includes an OS file area used by an operating system (OS) and a user data area.
  • OS operating system
  • User data used by users is classified and stored in the form of files or DBs.
  • the intelligent data management and storage method according to the embodiment includes text files, document files, image files, video files, audio files, and other types (external). It classifies the file type, calculates the file name and data size for each type, produces statistics, and visualizes the analysis result in the form of a graph or table.
  • the user can easily know what type of file is most frequently used in a specific system through the visualization result (for example, a system used in a hospital has a lot of video data or image data, so the analysis result is derived), Information about the size of the OS area, the contents and size of the file area, and the contents and size of the DB area can be obtained.
  • the user can optimize according to the type of data by selectively applying data optimization for each file type through the intelligent data management and storage method provided by the intelligent data management and storage device 100 . In the case of optimization, when compression is used, since compression for general file types and compression techniques for compressing video data are significantly different, optimal results can be obtained by selectively using compression techniques that can be optimized according to the type of data.
  • FIG 5 shows an example of visualizing data analysis results according to file types.
  • image data and video data 510 occupy a large portion of the total data storage space of 400 GB of a user terminal 200
  • image rather than uniform data compression is applied.
  • Data compression can be optimized by using an optional compression technique that provides the highest compression ratio for both data and video data.
  • data other than image data and video data uses a compression method optimized for each type of data.
  • the data optimized by the compression method it is possible to provide data information in the original state that was originally provided to the user through data virtualization.
  • Category classification by file size can be divided into large files, medium files, and small files. For example, all file sizes are collected, the average value is obtained, and files with sizes close to the average value are classified as medium files. In this method, files with an average value or less are classified as small files, and files with an average value or more are classified as large files. Data to be optimized is classified according to the file size, and classification result information can be provided to the user.
  • Category classification by file characteristics can be largely divided into four categories: system files, private files, business files, and public files, and classification by file characteristics. means to analyze the number of files of each of the above four types and the size of each file.
  • the system file refers to a file or program code stored in an area (OS area) used by an OS (operating system) among local storage spaces of the user terminal 200 .
  • the intelligent data management and storage method according to the embodiment calculates the ratio of the size of the storage space used in the OS area and the space used as the OS area to the total size of the storage space.
  • the personal files refer to files having personal privacy. These data or files are managed so that no one with any authority can read, write, or even delete them unless encryption is used when backing up or duplicating in consideration of individual privacy, or the individual himself or herself is not authenticated.
  • the intelligent data management and storage method according to the embodiment calculates the ratio of the size of the storage space used by personal files and the space used for storing personal files to the total size of the storage space.
  • Business files refer to files used while conducting company business. Files used for business use have a shared folder concept and are shared by applying the license concept, and backup or replication must be performed to protect data information in direct connection with the storage of data.
  • the intelligent data management and storage method according to the embodiment calculates the size of the storage space used by work files and the ratio of the total storage space used to store work files.
  • Public files refer to files created through search or download on the Internet. Since there are many files or data duplicated between multiple people within a group, duplicate files are removed to maintain consistency as one file or data, and the rest are connected using links.
  • the intelligent data management and storage method according to the embodiment calculates the size of the storage space used by common files and the ratio of the total storage space used to store common files.
  • category classification according to file use frequency analyzes how many files are used by users or systems, and provides information to users by analyzing information on recently used files by creating a history of the most used files. manage For example, among files used during a preset period, files may be classified according to a preset file use frequency, and files of the corresponding classification may be optimized according to a preset criterion.
  • 6 is a diagram explaining procedures of data analysis and data optimization according to time and file type.
  • the file classification module 610 of the intelligent data management and storage device 100 provides storage directory information 601 for a management target file from the user terminal 200, file access time information 602, and file access time information 602. After receiving type information 603, based on the received information, files are collected based on time (S601), and files are classified based on time (S603). Next, the file classification module 610 collects files based on the file type based on the received information (S605) and classifies the files based on the file type (S607). Classification results classified by time criteria and types are stored in the intelligent data management and storage device 100 (S609), and each classification result (621, 622) is visualized in the file classification module (610) (S611). After being output to the user, data optimization is performed manually or automatically by the user's selection (S613). Visualization is output in the form of tables or graphs so that users can easily understand the analysis results at a glance.
  • the intelligent data management and storage method may analyze the number of files constituting management target data and optimize the data according to the analysis result.
  • Analysis by the number of files means the total number of files that the user has on the user terminal 200, and is classified according to the number of files. For example, if the number of files is 100,000 or less, small grade (Small), between 100,000 and 1,000,000, normal grade (Normal), and if the number of files is more than 1,000,000, large grade (Large) Classifying the data of the user terminal 200 means that In data management, as the number of files increases, the processing speed or transmission speed decreases. Therefore, in case of a large number of files, the method of processing or transmitting the files is applied to the method of processing volume or utilizing Archive. to optimize data management.
  • the intelligent data management and storage method may analyze data storage costs and optimize the data according to the analysis result.
  • the cost of storing data depends on the type of storage medium (disk, Virtual Tape Library (VTL), Solid-State Drive (SSD), memory, tape, USB, etc.), and the storage medium also Storage costs vary depending on whether it is used for personal or business purposes. In addition, storage costs vary depending on whether data is stored locally, remotely, or stored in the cloud.
  • the data storage location may vary depending on whether it is a personal storage location, a corporate storage location, or a data center, and may also vary depending on the region (city) where the data center used is located.
  • the intelligent data management and storage method calculates the storage cost as a formula using factors that may change the storage cost as variables, converts the storage cost into absolute and relative values, finds storage that minimizes the storage cost, and stores data. can move
  • the storage cost (C) of 1 TB can be calculated by Equation 1 below.
  • Cost of 1 TB storage Cost (C) (Cost of total TB used by the system)/Total number of TB
  • the 1 TB storage cost index (T) can be calculated by the following ⁇ Equation 2>.
  • the intelligent data management and storage method according to the embodiment minimizes the storage cost by utilizing the storage cost index when selecting a storage to store data.
  • the intelligent data management and storage method according to the embodiment may calculate the storage cost index even if there is already stored data, and then move the data to the data storage where the storage cost index is minimized in a policy manner.
  • the intelligent data management and storage method collects and analyzes data on the speed of storing or reading data, and then visualizes the analysis result to provide users with storage performance figures for all storage media. It provides data movement or data optimization so that the most used data can be stored in this good storage.
  • the data management function refers to a data storage management function that manages data storage and data storage media in which data is stored.
  • the data storage management function includes management of designated multi-data storage, local storage, remote storage, and cloud storage, disk (DISK), virtual tape library (VTL), and physical tape library ( It has management capabilities for Physical Tape Library (PTL), Storage Area Network (SAN), and Network Attached Storage (NAS), with monitoring capabilities that provide detailed information about running processes and shutdowns. It is a reporting function that provides detailed information about the process that has been performed.
  • An intelligent data management and storage method transfers or backs up management target data of the user terminal 200 to a storage selected from among data stores connected to a network based on the storage cost analysis result according to the storage medium described above, and , the optimized data can be stored.
  • the intelligent data management and storage method is a data storage function, a backup function that reads original data once and stores it on a point-in-time basis, a replication function that reflects and stores the original data in real time whenever it is changed, and backup and It provides a hybrid function that fuses the cloning function.
  • FIG. 7 is a diagram illustrating a system configuration for implementing a backup using an intelligent data management and storage method according to an embodiment.
  • the intelligent data management and storage method includes a backup UI module (710), a backup master module (720), a backup client module (730), and a backup server module ( Backup Server module: 740) implements data backup.
  • the backup UI module 710 is a software module installed in the intelligent data management and storage device 100 or the user terminal 200 that performs the functions of the intelligent data management and storage device 100, and manages all backup and recovery operations.
  • a user interface UI
  • Users can set backup policies, schedule backups, register clients to receive backups, and register backup servers, and manage data recovery and check the results of backup and recovery.
  • the user interface screen provided by the backup UI module divides and displays data storage areas into local storage with original data and remote storage or cloud storage, allowing users to transfer data from local storage to local storage and local storage with just a click of the mouse on the screen. You can easily save data from remote storage, local storage to cloud storage, remote storage to local storage, cloud storage to local storage, and cloud storage to remote storage.
  • the backup master module 720 is a software module installed in the intelligent data management and storage device 100 or the user terminal 200 that performs the function of the intelligent data management and storage device 100, and includes a backup client 730 and a backup server. (740) to manage and control the backup target as a whole, and store all data related to backup in DB (MySQL/postgres).
  • the intelligent data management and storage device 100 may be a Linux server device or the like, and at this time, a user controls the backup master module 720 through a backup UI module 710 installed in a terminal such as a Windows PC.
  • the backup client module 730 includes a server that stores data to be backed up, such as a Windows system-based backup client module 731, a Linux server-based backup client module 732, and a Unix server-based backup client module 733. As a software module installed in the device (the user terminals 200 of FIG. 1 ), it reads the data to be backed up and transfers it to the data storage provided in the backup server device 740 .
  • the backup server module 740 is a server device having backup storage such as a Windows system-based backup server module 741, a Linux server-based backup server module 742, and a Unix server-based backup server module 743 (FIG. 1 As a software module installed in the storage servers 300), it communicates with the backup master module 720 and the backup client module 730, sets a storage to store data, reads data from the backup client 730, and reads the data. Serves as a repository to store
  • FIG. 8 is a diagram illustrating in detail the functions of data analysis, data management, and data storage performed by the intelligent data management and storage method according to the above-described embodiment as a table.
  • an artificial intelligence processing module applicable to the apparatus and method proposed in this specification, particularly the aforementioned artificial intelligence-based data analysis module, and its application will be described with reference to FIG. 9 . That is, it is clarified that the content to be described later, that is, the content related to FIG. 9 can be applied to implement the method proposed in this specification.
  • AI Artificial Intelligence
  • AI can increase efficiency and reduce processing delays.
  • Time-consuming tasks such as analyzing large amounts of data can be performed instantly by using AI.
  • Machine learning refers to a set of actions that train a machine to create a machine that can do tasks that humans can or cannot do.
  • Machine learning requires data and a running model.
  • data learning methods can be largely classified into three types: supervised learning, unsupervised learning, and reinforcement learning.
  • Neural network training is aimed at minimizing errors in the output.
  • Neural network learning repeatedly inputs training data to the neural network, calculates the output of the neural network for the training data and the error of the target, and backpropagates the error of the neural network from the output layer of the neural network to the input layer in a direction to reduce the error. ) to update the weight of each node in the neural network.
  • Supervised learning uses training data in which correct answers are labeled in the learning data, and unsupervised learning may not have correct answers labeled in the learning data. That is, for example, learning data in the case of supervised learning related to data classification may be data in which each learning data is labeled with a category. Labeled training data is input to the neural network, and an error may be calculated by comparing the output (category) of the neural network and the label of the training data. The calculated error is back-propagated in a reverse direction (ie, from the output layer to the input layer) in the neural network, and connection weights of each node of each layer of the neural network may be updated according to the back-propagation.
  • a reverse direction ie, from the output layer to the input layer
  • the amount of change in the connection weight of each updated node may be determined according to a learning rate.
  • the neural network's computation of input data and backpropagation of errors can constitute a learning cycle (epoch).
  • the learning rate may be applied differently according to the number of iterations of the learning cycle of the neural network. For example, a high learning rate is used in the early stages of neural network learning to increase efficiency by allowing the neural network to quickly achieve a certain level of performance, and a low learning rate can be used in the late stage to increase accuracy.
  • the learning method may vary depending on the characteristics of the data. For example, in a case where the purpose of the receiver is to accurately predict data transmitted by the transmitter in a communication system, it is preferable to perform learning using supervised learning rather than unsupervised learning or reinforcement learning.
  • the learning model corresponds to the human brain, and the most basic linear model can be considered. called deep learning).
  • the neural network cord used as a learning method is largely divided into deep neural networks (DNN), convolutional deep neural networks (CNN), and recurrent neural networks (RNN). there is.
  • DNN deep neural networks
  • CNN convolutional deep neural networks
  • RNN recurrent neural networks
  • An artificial neural network is an example of connecting several perceptrons.
  • FIG. 9 is a block diagram of an AI device according to an embodiment of the present invention.
  • the AI device 900 may include an electronic device including an AI module capable of performing AI processing or a server including the AI module.
  • the AI device 900 may be included in at least a part of the intelligent data management and storage device 100 according to the embodiment to perform at least a part of AI processing together.
  • the AI device 900 may include an AI processor 901, a memory 905 and/or a communication unit 907.
  • the AI device 900 is a computing device capable of learning a neural network, and may be implemented in various electronic devices such as a server, a desktop PC, a notebook PC, and a tablet PC.
  • the AI processor 901 may learn a neural network using a program stored in the memory 905 .
  • the AI processor 901 may learn a neural network for recognizing image-related data.
  • the neural network for recognizing image-related data may be designed to simulate the structure of the human brain on a computer, and may include a plurality of network nodes having weights that simulate neurons of the human neural network.
  • a plurality of network modes may transmit and receive data according to a connection relationship, respectively, so as to simulate synaptic activity of neurons that transmit and receive signals through synapses.
  • the neural network may include a deep learning model developed from a neural network model. In the deep learning model, a plurality of network nodes may exchange data according to a convolution connection relationship while being located in different layers.
  • Examples of neural network models are deep neural networks (DNN), convolutional deep neural networks (CNN), recurrent Boltzmann machines (RNNs), restricted Boltzmann machines (RBMs), deep trust It includes various deep learning techniques such as deep belief networks (DBN) and deep Q-network, and can be applied to fields such as computer vision, voice recognition, natural language processing, and voice/signal processing.
  • DNN deep neural networks
  • CNN convolutional deep neural networks
  • RNNs recurrent Boltzmann machines
  • RBMs restricted Boltzmann machines
  • DNN deep belief networks
  • DNN deep Q-network
  • the processor performing the functions described above may be a general-purpose processor (eg, CPU), or may be an AI-only processor (eg, GPU) for artificial intelligence learning.
  • a general-purpose processor eg, CPU
  • an AI-only processor eg, GPU
  • the memory 905 may store various programs and data necessary for the operation of the AI device 900 .
  • the memory 905 may be implemented as a non-volatile memory, a volatile memory, a flash-memory, a hard disk drive (HDD), or a solid state drive (SDD).
  • the memory 905 is accessed by the AI processor 901, and reading/writing/modifying/deleting/updating of data by the AI processor 901 can be performed.
  • the memory 905 may store a neural network model (eg, a deep learning model 906) generated through a learning algorithm for data classification/recognition according to an embodiment of the present invention.
  • a neural network model eg, a deep learning model 906
  • the AI processor 901 may include a data learning unit 902 that learns a neural network for data classification/recognition.
  • the data learning unit 902 may learn criteria for which training data to use to determine data classification/recognition and how to classify and recognize data using the training data.
  • the data learning unit 902 may acquire learning data to be used for learning and learn the deep learning model by applying the obtained learning data to the deep learning model.
  • the data learning unit 902 may be manufactured in the form of at least one hardware chip and mounted in the AI device 900 .
  • the data learning unit 902 may be manufactured in the form of a dedicated hardware chip for artificial intelligence (AI), or manufactured as a part of a general-purpose processor (CPU) or a graphics-only processor (GPU) for the AI device 900. may be mounted.
  • the data learning unit 902 may be implemented as a software module.
  • the software module When implemented as a software module (or a program module including instructions), the software module may be stored in a computer-readable, non-transitory computer readable recording medium (non-transitory computer readable media). In this case, at least one software module may be provided by an Operating System (OS) or an application.
  • OS Operating System
  • the data learning unit 902 may include a learning data acquisition unit 903 and a model learning unit 904 .
  • the training data acquisition unit 903 may acquire training data necessary for a neural network model for classifying and recognizing data.
  • the learning data acquisition unit 903 may acquire data and/or sample data to be input to a neural network model as learning data.
  • the model learning unit 904 may learn to have a criterion for determining how to classify predetermined data by using the obtained training data. At this time, the model learning unit 904 may learn the neural network model through supervised learning using at least some of the learning data as a criterion. Alternatively, the model learning unit 904 may learn the neural network model through unsupervised learning in which a criterion for determination is discovered by self-learning using training data without guidance. In addition, the model learning unit 904 may learn the neural network model through reinforcement learning using feedback about whether the result of the situation judgment according to learning is correct. In addition, the model learning unit 904 may train the neural network model using a learning algorithm including error back-propagation or gradient decent.
  • the model learning unit 904 may store the learned neural network model in memory.
  • the model learning unit 904 may store the learned neural network model in a memory of a server connected to the AI device 900 through a wired or wireless network.
  • the data learning unit 902 further includes a training data pre-processing unit (not shown) and a training data selection unit (not shown) to improve the analysis result of the recognition model or save resources or time required for generating the recognition model. You may.
  • the learning data pre-processing unit may pre-process the acquired data so that the acquired data can be used for learning for situation determination.
  • the learning data pre-processing unit may process the acquired data into a preset format so that the model learning unit 904 can use the acquired learning data for learning for image recognition.
  • the learning data selector may select data necessary for learning from among the learning data acquired by the learning data acquisition unit 903 or the learning data preprocessed by the preprocessor.
  • the selected learning data may be provided to the model learning unit 904 .
  • the learning data selection unit may select only data about an object included in a specific region as training data by detecting a specific region among acquired images.
  • the data learning unit 902 may further include a model evaluation unit (not shown) to improve the analysis result of the neural network model.
  • the model evaluation unit inputs evaluation data to the neural network model, and when an analysis result output from the evaluation data does not satisfy a predetermined criterion, the model learning unit 902 may perform relearning.
  • the evaluation data may be predefined data for evaluating the recognition model.
  • the model evaluator may evaluate that the predetermined criterion is not satisfied when the number or ratio of the evaluation data for which the analysis result is inaccurate among the analysis results of the learned recognition model for the evaluation data exceeds a preset threshold. there is.
  • the communication unit 907 may transmit AI processing results by the AI processor 901 to an external electronic device.
  • the external electronic device is a device capable of wired/wireless communication with the AI device, and may include a broadcasting device and a viewer device to be described later.
  • the AI device may be implemented in the manager device.
  • the AI device 900 shown in FIG. 9 has been functionally divided into an AI processor 901, a memory 905, a communication unit 907, etc., but the above-described components are integrated into one module and the AI module Note that it can also be called
  • each step or operation included in the intelligent data management and storage method using the above-described intelligent data management and storage device may be implemented as a computer program and stored in a computer-readable recording medium, and each step may be performed by a computer device. , a process or action may be executed.
  • An embodiment according to the present invention may be implemented by various means, for example, hardware, firmware, software, or a combination thereof.
  • one embodiment of the present invention is one or more ASICs (Application Specific Integrated Circuits), DSPs (Digital Signal Processors), DSPDs (Digital Signal Processing Devices), PLDs (Programmable Logic Devices), FPGAs ( Field Programmable Gate Arrays), processors, controllers, microcontrollers, microprocessors, etc.
  • ASICs Application Specific Integrated Circuits
  • DSPs Digital Signal Processors
  • DSPDs Digital Signal Processing Devices
  • PLDs Programmable Logic Devices
  • FPGAs Field Programmable Gate Arrays
  • processors controllers, microcontrollers, microprocessors, etc.
  • an embodiment of the present invention may be implemented in the form of a module, procedure, or function that performs the functions or operations described above.
  • the software code can be stored in memory and run by a processor.
  • the memory may be located inside or outside the processor and exchange data with the processor by various means known in the art.
  • unit eg, a controller
  • unit may refer to a unit including one or a combination of two or more of, for example, hardware, software, or firmware. “Unit” may be used interchangeably with terms such as, for example, unit, logic, logical block, component, or circuit.
  • a "unit” may be a minimum unit of an integrally constituted part or a part thereof.
  • a “unit” may be a minimal unit or part thereof that performs one or more functions.
  • a “unit” may be implemented mechanically or electronically.
  • a "part” is an application-specific integrated circuit (ASIC) chip, field-programmable gate arrays (FPGAs), or programmable-logic device that performs certain operations, known or developed in the future. may contain at least one.
  • ASIC application-specific integrated circuit
  • FPGAs field-programmable gate arrays
  • programmable-logic device that performs certain operations, known or developed in the future. may contain at least one.
  • At least some of the devices (eg, modules or functions thereof) or methods (eg, operations) according to various embodiments may be stored on computer-readable storage media in the form of, for example, program modules. It can be implemented as a command stored in . When the command is executed by a processor, the one or more processors may perform a function corresponding to the command.
  • the computer-readable storage medium may be, for example, a memory.
  • the term "a” is defined as one or more than one. Also, the use of introductory phrases such as “at least one” and “one or more” in a claim means that the same claim includes introductory phrases such as “at least one” and “one or more” and ambiguous phrases such as “an”. If any, be construed to mean that the introduction of another claim element by the ambiguous phrase "an” limits any particular claim containing the so-introduced claim element to an invention containing only one such element. It shouldn't be.
  • a reference to a system that contains a specific component should also include a scenario where the system does not contain that specific component.
  • a reference to a method that includes a specific action must also include scenarios in which the method does not include that specific component.
  • a reference to a system configured to perform a specific action should also include a scenario in which the system is not configured to perform the specific action.
  • any method may include at least the operations included in the drawings and/or specifications, and may include only the operations included in the drawings and/or specifications.
  • the word “comprising” does not exclude the presence of the recited elements or acts in a claim.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present specification relates to an intelligent data management and storage method. The method comprises the steps of: collecting file information for a file to be managed; analyzing and classifying the file to be managed, by category, on the basis of the collected file information; optimizing the classified file according to a first preset criterion; and selecting a data storage location according to a second preset criterion and storing the optimized file. Accordingly, data to be managed can be optimized and stored at minimal cost.

Description

지능형 데이터 관리 및 저장 장치 및 이를 이용한 지능형 데이터 관리 및 저장 방법Intelligent data management and storage device and intelligent data management and storage method using the same
본 명세서는 지능형 데이터 관리 및 저장 장치 및 이를 이용한 지능형 데이터 관리 및 저장 방법에 관한 것이다.The present specification relates to an intelligent data management and storage device and an intelligent data management and storage method using the same.
데이터의 저장 기술은 데이터의 안정성 확보와 비즈니스의 원활한 지원을 위하여 데이터를 데이터 저장소(저장 매체)에 저장하는 기술이다.Data storage technology is a technology that stores data in a data storage (storage medium) to secure data stability and smoothly support business.
기존의 데이터 저장 기술은 원본 데이터를 읽어서 읽은 데이터의 복사본을 그대로 데이터 저장소에 저장하거나, 데이터 저장 공간을 줄이기 위해 읽은 데이터를 압축하여 데이터 저장소에 보관하는 방법을 사용하였다.Existing data storage technology uses a method of reading original data and storing a copy of the read data as it is in a data storage, or compressing and storing the read data in a data storage to reduce data storage space.
기존의 데이터 저장 기술은 데이터가 가지고 있는 유형이나 특성을 고려하지 않고 데이터를 저장하다 보니 원본 데이터의 관리 비용이나 저장 비용이 많이 들었고 데이터 저장소에 저장하는 데이터의 관리 비용과 저장 비용도 최적화를 할 수가 없었다. 그리고 기존의 데이터 저장 기술은 원본 데이터를 원격 데이터 저장소나 클라우드 데이터 저장소에 저장하기 위해서 네트워크를 사용하게 되어 있는데 원본 데이터의 크기가 성능에 영향을 주기 때문에 원본 데이터의 최적화가 필요하게 되었다.Existing data storage technologies store data without considering the type or characteristics of the data, so the management and storage costs of the original data are high, and the management and storage costs of the data stored in the data storage cannot be optimized. There was no In addition, existing data storage technology uses a network to store original data in a remote data store or cloud data store, but optimization of the original data is necessary because the size of the original data affects performance.
특히 인공지능, 빅데이터, 클라우드 기술 등의 4차 산업이 발전함에 따라 방대한 데이터와 다양한 유형의 데이터의 변화를 수용할 수 있는 데이터의 관리 저장 기술이 필요하게 되었다.In particular, as the 4th industry such as artificial intelligence, big data, and cloud technology develops, data management and storage technology that can accommodate changes in vast amounts of data and various types of data has become necessary.
본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The problems to be solved by the present invention are not limited to the problems mentioned above, and other problems not mentioned will be clearly understood by those skilled in the art from the description below.
본 명세서는 지능형 데이터 관리 및 저장 방법을 제시한다. 상기 방법은 관리 대상 파일에 대한 파일 정보를 수집하는 단계; 상기 수집된 파일 정보에 기초하여 카테고리 별로 상기 관리 대상 파일을 분석하여 분류하는 단계; 상기 분류된 파일을 제1 미리 설정된 기준에 따라 최적화하는 단계; 및 상기 최적화된 파일을 제2 미리 설정된 기준에 따라 데이터 저장소를 선택하여 저장하는 단계를 포함할 수 있다.This specification presents an intelligent data management and storage method. The method may include collecting file information on a management target file; analyzing and classifying the management target file for each category based on the collected file information; optimizing the classified files according to a first preset criterion; and selecting and storing the optimized file in a data storage according to a second preset criterion.
상기 지능형 데이터 관리 및 저장 방법 및 그 밖의 실시예는 다음과 같은 특징을 포함할 수 있다.The intelligent data management and storage method and other embodiments may include the following features.
실시 예에 따라, 상기 수집된 파일 정보에 기초하여 카테고리 별로 상기 관리 대상 파일을 분류하는 단계는, 상기 수집된 파일의 사용 시간 정보에 기초하여 상기 관리 대상 파일을 사용 시간 대에 따라 분류하는 단계이고, 상기 분류된 파일을 제1 미리 설정된 기준에 따라 최적화하는 단계는, 상기 분류된 파일 중 특정 시간 대의 파일을 압축하는 단계일 수 있다.According to an embodiment, the step of classifying the management target files for each category based on the collected file information is the step of classifying the management target files according to usage time slots based on usage time information of the collected files, and , Optimizing the classified files according to a first preset criterion may include compressing files of a specific time period among the classified files.
실시 예에 따라, 상기 수집된 파일 정보에 기초하여 카테고리 별로 상기 관리 대상 파일을 분류하는 단계는, 상기 수집된 파일의 파일 유형 정보에 기초하여 상기 관리 대상 파일을 파일 유형별로 분류하는 단계이고, 상기 분류된 파일을 제1 미리 설정된 기준에 따라 최적화하는 단계는, 상기 분류된 파일을 파일 유형별로 다른 압축 방법으로 압축하는 단계일 수 있다.According to an embodiment, the step of classifying the management target files for each category based on the collected file information is the step of classifying the management target files for each file type based on the file type information of the collected files. Optimizing the classified files according to a first preset criterion may include compressing the classified files using different compression methods for each file type.
실시 예에 따라, 상기 최적화된 파일을 제2 미리 설정된 기준에 따라 데이터 저장소를 선택하여 저장하는 단계는, 복수의 데이터 저장소들 각각의 사용 비용을 분석하는 단계; 및 상기 복수의 데이터 저장소들 중 상기 사용 비용이 최소가 되는 데이터 저장소에 상기 최적화된 파일을 저장하는 단계를 포함할 수 있다.According to an embodiment, the step of selecting and storing the optimized file in a data store according to a second preset criterion may include analyzing a use cost of each of a plurality of data stores; and storing the optimized file in a data storage having a minimum usage cost among the plurality of data storages.
실시 예에 따라, 상기 사용 비용은, 데이터 저장소의 저장 매체의 종류, 데이터 저장소의 설치 위치, 데이터 저장소의 소유자, 및 데이터 저장소의 용도 중 적어도 하나에 의해 결정될 수 있다.According to an embodiment, the usage cost may be determined by at least one of a type of storage medium of the data store, an installation location of the data store, an owner of the data store, and a purpose of the data store.
실시 예에 따라, 상기 사용 비용은 1 TB 저장 비용지수(T)에 의해 결정되고, 상기 1 TB의 저장 비용 지수(T)는 데이터 저장소 제공자의 1 TB 저장 공간 제공 서비스의 가격(S)을 1 TB 당 저장 비용 원가(C)로 나눈 결과 값으로 산출되고, 상기 1 TB 당 저장 비용(C)은 사용되는 총 TB의 원가를 총 TB 수로 나눈 결과 값으로 산출될 수 있다.According to an embodiment, the usage cost is determined by a 1 TB storage cost index (T), and the 1 TB storage cost index (T) sets the price (S) of a 1 TB storage space provision service of a data storage provider to 1 The storage cost per TB (C) may be calculated as a result of dividing the cost of storage per TB by the total number of TBs.
실시 예에 따라, 상기 카테고리는 파일 크기, 파일 특성, 및 파일 사용 빈도를 포함하는 분류로 구분되고, 상기 수집된 파일 정보에 기초하여 카테고리 별로 상기 관리 대상 파일을 분류하는 단계는, 상기 수집된 파일 정보에 기초하여 상기 관리 대상 파일을 파일 크기 범위 별로 분류하거나, 파일 특성 별로 분류하거나, 파일 사용 빈도 범위 별로 분류할 수 있다.According to an embodiment, the categories are divided into classifications including file size, file characteristics, and file use frequency, and classifying the management target files by category based on the collected file information includes the collected files. Based on the information, the management target files may be classified according to file size ranges, file characteristics, or file usage frequency ranges.
실시 예에 따라, 상기 방법은, 상기 관리 대상 파일을 가상화하여 상기 관리 대상 파일에 대한 데이터 정보를 제공하는 단계를 더 포함할 수 있다.According to an embodiment, the method may further include providing data information on the management target file by virtualizing the management target file.
한편, 본 명세서는 컴퓨터프로그램을 제시한다. 상기 컴퓨터프로그램은 컴퓨터 하드웨어와 결합되어, 상기 단계들 중 어느 한 단계에 따른 지능형 데이터 관리 및 저장 방법이 포함하는 각 단계를 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터프로그램일 수 있다.Meanwhile, this specification presents a computer program. The computer program may be a computer program stored in a computer readable recording medium in order to execute each step included in the intelligent data management and storage method according to any one of the above steps by being combined with computer hardware.
다른 한편, 본 명세서는 지능형 데이터 관리 및 저장 장치를 제시한다. 상기 장치는, 하나 이상의 인스트럭션을 저장하는 메모리; 및 상기 인스트럭션을 실행시키기 위한 프로세서;를 포함하고, 상기 인스트럭션이 실행될 때, 상기 프로세서는, 관리 대상 파일에 대한 파일 정보를 수집하고, 상기 수집된 파일 정보에 기초하여 카테고리 별로 상기 관리 대상 파일을 분류하고, 상기 분류된 파일을 제1 미리 설정된 기준에 따라 최적화하고, 및 상기 최적화된 파일을 제2 미리 설정된 기준에 따라 데이터 저장소를 선택하여 저장할 수 있다.On the other hand, this specification presents an intelligent data management and storage device. The device includes a memory for storing one or more instructions; and a processor for executing the instruction, wherein when the instruction is executed, the processor collects file information about a file to be managed, and classifies the file to be managed by category based on the collected file information. and optimize the classified file according to a first preset criterion, and select and store the optimized file in a data storage according to a second preset criterion.
본 명세서에 개시된 실시 예에 따르면 관리 대상 원본 데이터의 특성을 고려하여 데이터를 최적화 함으로서, 관리 비용이나 저장 비용을 최소화 할 수 있는 효과가 있다.According to an embodiment disclosed in this specification, by optimizing data in consideration of characteristics of original data to be managed, there is an effect of minimizing management cost or storage cost.
한편, 본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.On the other hand, the effects obtainable in the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the description below. You will be able to.
본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 발명을 실시하기 위한 구체적인 내용과 함께 본 발명의 기술 사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니 된다.The following drawings attached to this specification illustrate preferred embodiments of the present invention, and serve to further understand the technical idea of the present invention together with specific details for carrying out the invention, so the present invention is described in such drawings should not be construed as limited to
도 1은 실시 예에 따른 지능형 데이터 관리 및 저장 장치를 포함하는 지능형 데이터 관리 및 저장 시스템의 예를 도시한다.1 shows an example of an intelligent data management and storage system including an intelligent data management and storage device according to an embodiment.
도 2는 실시 예에 따른 지능형 데이터 관리 및 저장 장치의 구성을 도시하는 블록도이다.2 is a block diagram illustrating the configuration of an intelligent data management and storage device according to an embodiment.
도 3은 실시 예에 따른 지능형 데이터 관리 및 저장 장치에 의한 지능형 데이터 관리 및 저장 방법을 설명하는 도면이다.3 is a diagram illustrating an intelligent data management and storage method using an intelligent data management and storage device according to an embodiment.
도 4는 시간 인덱스 중 사용 시간을 기준으로 적용한 데이터 분석 결과를 시각화한 예를 도시한다.4 illustrates an example of visualizing data analysis results applied based on usage time among time indexes.
도 5는 파일 유형에 따른 데이터 분석 결과를 시각화한 예를 도시한다.5 shows an example of visualizing data analysis results according to file types.
도 6은 시간 및 파일 유형에 따른 데이터 분석 및 데이터 최적화의 절차를 설명하는 도면이다.6 is a diagram explaining procedures of data analysis and data optimization according to time and file type.
도 7은 실시 예에 따른 지능형 데이터 관리 및 저장 방법에 의한 백업을 구현하는 시스템 구성을 설명하는 도면이다.7 is a diagram illustrating a system configuration for implementing a backup using an intelligent data management and storage method according to an embodiment.
도 8은 전술한 실시 예에 따른 지능형 데이터 관리 및 저장 방법에 의해 수행되는 데이터 분석, 데이터 관리, 및 데이터 저장의 기능을 표로서 상세하게 정리하여 설명한 도면이다.8 is a diagram illustrating in detail the functions of data analysis, data management, and data storage performed by the intelligent data management and storage method according to the above-described embodiment as a table.
도 9는 본 발명의 일 실시예에 따른 AI 장치의 블록도이다.9 is a block diagram of an AI device according to an embodiment of the present invention.
본 명세서에 개시된 기술은 데이터 관리 및 저장 기술에 적용될 수 있다. 그러나 본 명세서에 개시된 기술은 이에 한정되지 않고, 상기 기술의 기술적 사상이 적용될 수 있는 모든 장치 및 방법에도 적용될 수 있다.The technology disclosed herein can be applied to data management and storage technology. However, the technology disclosed in this specification is not limited thereto, and may be applied to all devices and methods to which the technical spirit of the technology may be applied.
본 명세서에서 사용되는 기술적 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 명세서에 개시된 기술의 사상을 한정하려는 의도가 아님을 유의해야 한다. 또한, 본 명세서에서 사용되는 기술적 용어는 본 명세서에서 특별히 다른 의미로 정의되지 않는 한, 본 명세서에 개시된 기술이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로 해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나, 과도하게 축소된 의미로 해석되지 않아야 한다. 또한, 본 명세서에서 사용되는 기술적인 용어가 본 명세서에 개시된 기술의 사상을 정확하게 표현하지 못하는 잘못된 기술적 용어일 때에는, 본 명세서에 개시된 기술이 속하는 분야에서 통상의 지식을 가진 자가 올바르게 이해할 수 있는 기술적 용어로 대체되어 이해되어야 할 것이다. 또한, 본 명세서에서 사용되는 일반적인 용어는 사전에 정의되어 있는 바에 따라, 또는 전후 문맥 상에 따라 해석되어야 하며, 과도하게 축소된 의미로 해석되지 않아야 한다.It should be noted that technical terms used in this specification are only used to describe specific embodiments and are not intended to limit the spirit of the technology disclosed in this specification. In addition, technical terms used in this specification should be interpreted in terms commonly understood by those of ordinary skill in the field to which the technology disclosed in this specification belongs, unless specifically defined otherwise in this specification. It should not be interpreted in an overly comprehensive sense or in an excessively reduced sense. In addition, when the technical terms used in this specification are incorrect technical terms that do not accurately express the spirit of the technology disclosed in this specification, it is a technical term that can be correctly understood by those of ordinary skill in the field to which the technology disclosed in this specification belongs. should be replaced with In addition, general terms used in this specification should be interpreted as defined in advance or according to context, and should not be interpreted in an excessively reduced sense.
본 명세서에서 사용되는 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성 요소는 제2 구성 요소로 명명될 수 있고, 유사하게 제2 구성 요소도 제1 구성 요소로 명명될 수 있다.Terms including ordinal numbers such as first and second used herein may be used to describe various components, but the components should not be limited by the terms. These terms are only used for the purpose of distinguishing one component from another. For example, a first element may be termed a second element, and similarly, a second element may be termed a first element, without departing from the scope of the present invention.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예들을 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, the embodiments disclosed in this specification will be described in detail with reference to the accompanying drawings, but the same or similar components are assigned the same reference numerals regardless of reference numerals, and redundant description thereof will be omitted.
또한, 본 명세서에 개시된 기술을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 기술의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 기술의 사상을 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 그 기술의 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다.In addition, in describing the technology disclosed in this specification, if it is determined that a detailed description of a related known technology may obscure the gist of the technology disclosed in this specification, the detailed description will be omitted. In addition, it should be noted that the accompanying drawings are only intended to facilitate understanding of the spirit of the technology disclosed in this specification, and should not be construed as limiting the spirit of the technology by the accompanying drawings.
이하, 본 명세서에서 제안하는 방법에 대해 구체적으로 살펴보기로 한다.Hereinafter, the method proposed in this specification will be described in detail.
지능형 데이터 관리 및 저장 기술은 지정 항목(specific metric)으로 관리 대상 데이터에 대한 분석 기준을 정하고 이 기준에 따라 데이터를 분석한 뒤, 데이터를 최적화하는 기술을 의미한다. 일반적인 데이터 관리 및 저장 기술에서는 원본 데이터를 그대로 저장 장치에 유지하는데 머무르지만, 본 명세서의 데이터 최적화는 원본 데이터 자체도 압축, 중복 제거, 및 가상화 등의 최적화를 수행하여 원본 데이터의 저장 공간도 최적화하고 이를 다시 로컬 저장소에 저장하거나 원격 저장소에 저장하거나 클라우드 저장소에 저장할 때에도 데이터 저장 공간을 최소화하여 저장하고 네트워크 사용도 최소화할 수 있다.Intelligent data management and storage technology refers to a technology that sets analysis criteria for data to be managed with a specific metric, analyzes the data according to the criteria, and then optimizes the data. In general data management and storage technology, the original data is kept in the storage device as it is, but the data optimization in this specification also optimizes the storage space of the original data by performing optimization such as compression, deduplication, and virtualization of the original data itself. When saving data to local storage, remote storage, or cloud storage, data storage space can be minimized and network usage can be minimized.
데이터의 저장을 위해서는 데이터의 유형, 파일의 유형, 데이터 베이스(Data Base: DB)(이하 DB라 함)의 유형, 그리고 데이터 저장소에 대한 정의가 필요하다.To store data, it is necessary to define the type of data, file type, database (DB) type (hereinafter referred to as DB), and data storage.
데이터의 유형은 파일 형태의 데이터 또는 DB 형태의 데이터로 구분될 수 있다.The type of data can be classified into file-type data or DB-type data.
파일의 유형은 텍스트 파일, 문서 파일, 이미지(image) 파일, 오디오(audio) 파일, 비디오(video) 파일 및 기타 멀티미디어 데이터를 포함한 정형 및 비정형 파일 등으로 구분될 수 있다.The file type may be classified into structured and unstructured files including text files, document files, image files, audio files, video files, and other multimedia data.
또한, DB는 기존 상용화 되어 사용되고 있는 모든 종류의 DB(Oracle, MSSQL, Informix, DB2, SYBASE, MySQL, 기타 상용화 되어 사용되는 모든 DB)와 오픈소스를 기반으로 한 DB, 그리고 국내에서 개발되어 상용화된 모든 DB의 유형을 포함한다.In addition, DBs include all types of existing commercialized and used DBs (Oracle, MSSQL, Informix, DB2, SYBASE, MySQL, and all other commercially used DBs), open source-based DBs, and domestically developed and commercialized DBs. All DB types are included.
데이터 저장소의 유형은 로컬 저장소, 원격 저장소, 클라우드 저장소, 및 기타 저장소로 구분될 수 있다.Types of data storage can be divided into local storage, remote storage, cloud storage, and other storage.
이하에서는, 본 발명의 실시 예에 따른 지능형 데이터 관리 및 저장을 위한 지능형 데이터 관리 및 저장 장치에 대해서 설명한다.Hereinafter, an intelligent data management and storage device for intelligent data management and storage according to an embodiment of the present invention will be described.
도 1은 실시 예에 따른 지능형 데이터 관리 및 저장 장치를 포함하는 지능형 데이터 관리 및 저장 시스템의 예를 도시한다.1 shows an example of an intelligent data management and storage system including an intelligent data management and storage device according to an embodiment.
도 1을 참조하면, 지능형 데이터 관리 및 저장 시스템(10)은 지능형 데이터 관리 및 저장 장치(100), 관리 대상 컴퓨팅 장치인 복수의 사용자 단말(200) 및 복수의 저장 장치 서버(300)를 포함하여 구성될 수 있다.Referring to FIG. 1, the intelligent data management and storage system 10 includes an intelligent data management and storage device 100, a plurality of user terminals 200 that are management target computing devices, and a plurality of storage device servers 300. can be configured.
지능형 데이터 관리 및 저장 장치(100)는 복수의 사용자 단말(200)들에 연결되어, 복수의 사용자 단말(200)에 저장되어 있는 데이터에 대한 정보를 수집하여 분석한 뒤, 분석된 결과에 따라 복수의 사용자 단말(200)의 데이터를 압축, 이동, 저장, 가상화 등을 하는 서비스를 제공한다.The intelligent data management and storage device 100 is connected to a plurality of user terminals 200, collects and analyzes information on data stored in the plurality of user terminals 200, and then collects data according to the analyzed result. Provides services such as compressing, moving, storing, and virtualizing the data of the user terminal 200.
복수의 사용자 단말(200)은 지능형 데이터 관리 및 저장 장치(100)가 제공하는 데이터 관리 서비스를 제공받는 관리 대상 컴퓨팅 장치로서, 지능형 데이터 관리 및 저장 장치(100)에 네트워크로 연결되어 있는 PC들을 의미할 수 있다. 또한, 이들 복수의 사용자 단말(200)은 복수의 PC들이 연결되어 데이터를 저장 및 공유하는 로컬 데이터 서버 장치를 의미할 수도 있다. 이들 복수의 사용자 단말(200)은 지능형 데이터 관리 및 저장 장치(100)가 제공하는 클라이언트 프로그램을 전송받아 설치하고 있으며, 이를 통해서 저장되어 있는 데이터에 대한 정보 및 관리 권한(압축, 이동, 저장, 복사, 가상화 등)을 지능형 데이터 관리 및 저장 장치(100)에 제공한다.The plurality of user terminals 200 are management target computing devices that receive data management services provided by the intelligent data management and storage device 100, and mean PCs connected to the intelligent data management and storage device 100 through a network. can do. In addition, these plurality of user terminals 200 may mean a local data server device in which a plurality of PCs are connected to store and share data. These plurality of user terminals 200 receive and install the client program provided by the intelligent data management and storage device 100, through which information and management rights (compression, movement, storage, copy) for stored data are stored. , virtualization, etc.) to the intelligent data management and storage device 100.
복수의 저장 장치 서버(300)는 지능형 데이터 관리 및 저장 장치(100)에 네트워크로 연결되어 있는 복수의 사용자 단말(200)에 구비된 로컬 저장소를 제외한 원격 저장소 및 클라우드 저장소 등을 의미할 수 있다. 지능형 데이터 관리 및 저장 장치(100)는 복수의 사용자 단말(200)의 데이터를 읽어와 이들 복수의 저장 장치 서버(300)에 저장하거나, 복수의 저장 장치 서버(300)에 저장되어 있는 사용자 데이터를 복수의 사용자 단말(200)에 제공한다.The plurality of storage device servers 300 may refer to remote storage and cloud storage, excluding local storage provided in the plurality of user terminals 200 connected to the intelligent data management and storage device 100 through a network. The intelligent data management and storage device 100 reads data from a plurality of user terminals 200 and stores them in the plurality of storage device servers 300, or stores user data stored in the plurality of storage device servers 300. It is provided to a plurality of user terminals 200 .
도 2는 실시 예에 따른 지능형 데이터 관리 및 저장 장치의 구성을 도시하는 블록도이다.2 is a block diagram illustrating the configuration of an intelligent data management and storage device according to an embodiment.
도 2를 참조하면, 본 명세서에서 제안하는 방법 또는 기능을 구현하기 위한 지능형 데이터 관리 및 저장 장치(100)는 제어부(110), 저장부(130), 데이터 전송을 위한 버스(미도시) 또는 외부와 통신을 수행하기 위한 통신부(120), 출력부(140) 및 입력부(150)를 포함할 수 있다. 도시된 구성 요소들은 필수적인 것은 아니어서, 그 보다 많은 구성 요소들을 갖거나, 그보다 적은 구성 요소들을 갖는 지능형 데이터 관리 및 저장 장치(100)가 구현될 수도 있다. 또한, 이러한 구성 요소는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합을 통해서 구현될 수 있다.Referring to FIG. 2, an intelligent data management and storage device 100 for implementing the method or function proposed in this specification includes a control unit 110, a storage unit 130, a bus (not shown) for data transmission, or an external It may include a communication unit 120 for performing communication with, an output unit 140 and an input unit 150. The illustrated components are not essential, so an intelligent data management and storage device 100 having more or fewer components may be implemented. In addition, these components may be implemented as hardware or software, or through a combination of hardware and software.
제어부(110)는 프로세서(processor)와 같이 데이터를 처리할 수 있는 모든 종류의 프로세싱 장치들을 의미할 수 있다. 제어부(110)는 본 명세서에서 설명되는 다양한 동작들과 단계들을 수행하기 위한 프로세싱 로직을 실행하도록 구성될 수 있다. 여기서, '프로세서'는, 예를 들어 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 이와 같이 하드웨어에 내장된 데이터 처리 장치의 일 예로써, 마이크로프로세서(microprocessor), 중앙 처리 장치(central processing unit: CPU), 프로세서 코어(processor core), 멀티 프로세서(multiprocessor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array) 등의 처리 장치를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.The controller 110 may refer to all types of processing devices capable of processing data, such as a processor. Controller 110 may be configured to execute processing logic to perform various operations and steps described herein. Here, the 'processor' may refer to a data processing device embedded in hardware having a physically structured circuit to perform functions expressed by codes or instructions included in a program, for example. As an example of such a data processing device built into hardware, a microprocessor, a central processing unit (CPU), a processor core, a multiprocessor, an application-specific integrated (ASIC) circuit), field programmable gate array (FPGA), etc., but the scope of the present invention is not limited thereto.
통신부(120)는 유선 및/또는 무선 통신 모듈로 구성될 수 있다. 예를 들어, 통신부(120)는, 와이파이(Wireless Fidelity, Wi-Fi), 블루투스(Bluetooth), 지그비(Zigbee), 엔에프씨(near field communication: NFC), 와이브로(Wireless Broadband Internet: Wibro) 등의 무선 통신모듈과 이더넷(Ethernet) 등의 유선 랜(LAN)과 같은 유선 통신 모듈 등을 포함할 수 있다. 통신부(120)는 네트워크를 통해 다른 장치와 유/무선 통신을 수행하여 데이터를 송수신할 수 있다.The communication unit 120 may be composed of wired and/or wireless communication modules. For example, the communication unit 120 may use wireless fidelity (Wi-Fi), Bluetooth, Zigbee, near field communication (NFC), wireless broadband Internet (Wibro), and the like. A wireless communication module and a wired communication module such as a wired LAN such as Ethernet may be included. The communication unit 120 may transmit and receive data by performing wired/wireless communication with other devices through a network.
저장부(130)는 자기 저장 매체(magnetic storage media) 또는 플래시 저장 매체(flash storage media)를 포함할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.The storage unit 130 may include magnetic storage media or flash storage media, but the scope of the present invention is not limited thereto.
출력부(140)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 예를 들어, 디스플레이부(145)를 포함할 수 있다. 디스플레이부(145)는 터치 센서와 상호 레이어 구조를 이루거나 일체형으로 형성됨으로써, 터치 스크린을 구현할 수 있다. 이러한 터치 스크린은, 장치와 사용자 사이의 입력 인터페이스를 제공하는 사용자 입력부로써 기능함과 동시에, 장치와 사용자 사이의 출력 인터페이스를 제공할 수 있다.The output unit 140 is for generating an output related to sight, hearing, or touch, and may include, for example, the display unit 145 . The display unit 145 may implement a touch screen by forming a mutual layer structure or integrally with the touch sensor. Such a touch screen may function as a user input unit providing an input interface between the device and the user, and may provide an output interface between the device and the user.
입력부(150)는 버스에 연결된 입출력 인터페이스를 통해 제어부(110)에 접속될 수 있다. 상기 입력부(150)는 키보드, 포인팅 장치, 마이크로폰, 조이스틱, 터치패드, 스캐너 등을 포함할 수 있다. 입출력 인터페이스는 직렬 포트 인터페이스, PS/2 인터페이스, 병렬 포트 인터페이스, USB 인터페이스, IEEE 1394 인터페이스와 같은 매우 다양한 인터페이스 중 어느 하나를 포함하거나, 다른 인터페이스의 조합까지도 논리적으로 나타낼 수 있다.The input unit 150 may be connected to the control unit 110 through an input/output interface connected to a bus. The input unit 150 may include a keyboard, a pointing device, a microphone, a joystick, a touch pad, a scanner, and the like. The input/output interface may include any one of a wide variety of interfaces such as a serial port interface, a PS/2 interface, a parallel port interface, a USB interface, and an IEEE 1394 interface, or may logically represent a combination of other interfaces.
한편, 실시 예에 따른 지능형 데이터 관리 및 저장 장치(100)는 도 1에 도시한 바와 같이 사용자 단말(200)에 연결되어 작동하는 별도의 장치(도 2의 장치)로 구현될 수도 있고, 그 기능이 사용자 단말(200)에 포함되어 사용자 단말(200)의 컴퓨팅 요소들로 구현될 수도 있다.On the other hand, the intelligent data management and storage device 100 according to the embodiment may be implemented as a separate device (device of FIG. 2) connected to and operating with the user terminal 200 as shown in FIG. 1, and its functions It may be included in the user terminal 200 and implemented as computing elements of the user terminal 200 .
제어부(110)는 후술할 지능형 데이터 관리 및 저장 장치(100)의 기능, 즉 지능형 데이터 관리 및 저장 방법의 과정 및 절차들을 수행한다.The control unit 110 performs the functions of the intelligent data management and storage device 100 to be described later, that is, processes and procedures of an intelligent data management and storage method.
도 3은 실시 예에 따른 지능형 데이터 관리 및 저장 장치에 의한 지능형 데이터 관리 및 저장 방법을 설명하는 도면이다.3 is a diagram illustrating an intelligent data management and storage method using an intelligent data management and storage device according to an embodiment.
도 3을 참조하면, 실시 예에 따른 지능형 데이터 관리 및 저장 장치(100)에 의한 지능형 데이터 관리 및 저장 방법은 사용자 단말(200)로부터 원본 데이터(210)를 읽어서 생성한 복사본 데이터를 저장 장치 서버(300)에 마련된 데이터 저장소에 그대로 저장하기 전에 데이터 카테고리(범주) 기반의 데이터 분석을 수행(S110) 한 뒤, 그 분석 결과에 따라 원본 데이터를 압축, 중복 제거 등의 방법으로 최적화(S120) 하고, 최적화된 데이터(220)를 로컬 저장소에 저장(S130)하거나 저장 장치 서버(300)에 마련된 데이터 저장소에 저장(S140)한다. 이 때, 지능형 데이터 관리 및 저장 방법은 원본 데이터의 가상화를 지원(S150)하여 원본 데이터가 최적화되어 데이터 저장소로 이동된 후, 로컬 저장소에 저장되어 있던 원본 데이터(210)가 삭제되더라도, 가상화된 원본 데이터(211)를 통해 데이터의 정보를 용이하게 확인할 수 있다.Referring to FIG. 3, the intelligent data management and storage method by the intelligent data management and storage device 100 according to the embodiment converts copy data generated by reading original data 210 from the user terminal 200 to the storage device server ( 300), data category-based data analysis is performed (S110) before being stored in the data storage prepared in step 300), and then, according to the analysis result, the original data is optimized by methods such as compression and redundancy removal (S120), The optimized data 220 is stored in a local storage (S130) or stored in a data storage provided in the storage device server 300 (S140). At this time, the intelligent data management and storage method supports virtualization of the original data (S150), so that after the original data is optimized and moved to the data store, even if the original data 210 stored in the local storage is deleted, the virtualized original data Through the data 211, information of the data can be easily checked.
지능형 데이터 관리 및 저장 장치(100)는 데이터 카테고리 기반의 분석 데이터가 누적되면 이 데이터를 활용하여 인공지능 기반의 데이터 분석 모듈을 학습시켜 자동으로 데이터를 분석한 뒤, 최적화도 가능하다. 이 때, 인공지능 기반의 데이터 분석 모듈은 원본 데이터와 사용자에 의해 카테고리가 구분된 분류 데이터를 학습 데이터로 하여 데이터의 카테고리 분류 및 데이터 카테고리 별 최적화 패턴을 학습한 뒤, 새로운 데이터가 입력되면 자동으로 카테고리를 분류하여 적합한 방법으로 최적화를 수행할 수 있게 된다.When the data category-based analysis data is accumulated, the intelligent data management and storage device 100 learns an artificial intelligence-based data analysis module using this data, automatically analyzes the data, and then optimizes the data. At this time, the artificial intelligence-based data analysis module uses the original data and the classification data classified by the user as learning data to classify data into categories and learn optimization patterns for each data category, and then automatically analyze data when new data is entered. By classifying categories, optimization can be performed in an appropriate way.
실시 예에 따른 지능형 데이터 관리 및 저장 방법은 관리 대상 원본 데이터에 대한 데이터 특성에 따른 분류와 데이터 호출 패턴을 분석하고 데이터 저장 비용을 최소화할 수 있도록 분석하고 이를 기반으로 원본 데이터를 자동 또는 수동으로 압축하거나, 중복 데이터를 제거하거나, 가상화 하는 방법으로 데이터를 관리하거나 이동시켜 저장할 수 있다.The intelligent data management and storage method according to the embodiment analyzes classification and data call patterns according to data characteristics of the original data to be managed, analyzes to minimize data storage costs, and automatically or manually compresses the original data based on this. Data can be managed or moved and stored by removing redundant data or virtualizing it.
실시 예에 따른 지능형 데이터 관리 및 저장 방법은 데이터 카테고리 기반의 데이터 분석, 데이터 관리, 및 데이터 저장으로 구분할 수 있다.Intelligent data management and storage methods according to embodiments may be classified into data analysis, data management, and data storage based on data categories.
[1] 데이터 분석 기능[1] Data analysis function
이하에서는, 실시 예에 따른 지능형 데이터 관리 및 저장 방법에 의한 데이터 분석 기능에 대해서 설명한다.Hereinafter, a data analysis function by an intelligent data management and storage method according to an embodiment will be described.
데이터 분석 기능은 카테고리(범주) 기반으로 데이터 또는 파일을 분석하여 데이터를 유형과 특성에 따라 분류한 뒤, 그 분류 결과를 사용자에게 보고하고 그 결과를 토대로 데이터를 최적화하는 것을 의미한다.The data analysis function means analyzing data or files based on categories (categories), classifying the data according to types and characteristics, reporting the classification results to the user, and optimizing the data based on the results.
이 때, 데이터 최적화는 카테고리를 기준으로 수행되며, 자주 사용하지 않는 데이터에 대한 최적화, 데이터 유형에 따른 최적화, 그 밖의 데이터를 읽기/쓰기 하거나 기타 범주에 의한 최적화 순서로 원본 데이터를 최적화해서 보관하고 사용자에게는 원본 데이터의 가상화를 통해 원본 데이터에 대한 원장 정보를 사용자에게 제공해 준다. 데이터 최적화 기준에 해당하는 카테고리는 (1)시간(Time), (2)파일 유형(File Type), (3)파일 크기(File Size), (4)파일 특성(File Property) 및 (5)파일 사용 빈도(Frequency)로 구분될 수 있다.At this time, data optimization is performed based on categories, and the original data is optimized and stored in the order of optimization for infrequently used data, optimization according to data type, reading/writing other data, or optimization by other categories. The virtualization of the original data provides the user with ledger information on the original data. The categories corresponding to data optimization criteria are (1) Time, (2) File Type, (3) File Size, (4) File Property, and (5) File It can be classified by frequency of use.
(1) 시간(Time)에 따른 카테고리 분류(1) Category classification according to time
시간을 기준으로 하는 카테고리 분류 분석은 데이터에 대한 사용 빈도를 기준으로 자주 사용하지 않는 데이터와 자주 사용하는 데이터로 구분하고, 자주 사용하지 않는 데이터에 대해서는 최적화를 해서 저장을 하고 원본 데이터는 가상화를 해서 사용자에게 원본 데이터의 정보를 제공한다.Category classification analysis based on time divides data into infrequently used data and frequently used data based on the frequency of data use, optimizes and saves the infrequently used data, and virtualizes the original data. It provides the information of the original data to the user.
사용자 단말(200) 내에 있는 모든 데이터(파일 또는 DB)는 3개의 시간 인덱스(Time index)를 가질 수 있으며, 3개의 시간 인덱스는 데이터가 생성된 시간(creation time), 데이터가 수정된 시간(modification time), 및 데이터가 호출된 시간(access time)(또는 데이터를 읽은 시간)으로 구분될 수 있다.All data (files or DBs) in the user terminal 200 may have three time indexes, and the three time indexes are data creation time (creation time) and data modification time (modification time). time), and the time at which data is called (access time) (or time at which data is read).
실시 예에 따른 지능형 데이터 관리 및 저장 방법은 데이터 생성 시간, 데이터 수정 시간, 데이터 호출 시간을 포함하는 데이터에 대한 3개의 시간 인덱스를 기준으로 데이터의 사용 여부를 분석할 수 있다. 시간 인덱스는 사용 시간을 기준으로 4개의 레벨(level)로, 예컨대, 현재 시간을 기준으로 6개월 이내에 사용된 파일(레벨 4), 6개월에서 12개월 사이에 사용된 파일(레벨 3), 12개월 이상 사용하지 않은 파일(레벨 2), 사용되고 있지 않은 여유 공간(레벨 1)으로 데이터를 구분한다. 지능형 데이터 관리 및 저장 방법은 데이터의 사용 시간을 분석하여 최적화하기 위한 레벨을 구분하고, 해당 레벨에 포함되는 데이터를 최적화해서 시스템에 보관하거나 저장소 비용이 적은 저장소에 백업하여 보관할 수 있다.The intelligent data management and storage method according to the embodiment may analyze whether data is used or not based on three time indexes for data including data creation time, data modification time, and data call time. The time index is divided into four levels based on usage time, for example, files used within 6 months of the current time (level 4), files used between 6 and 12 months (level 3), 12 Data is classified into files that have not been used for more than one month (level 2) and unused free space (level 1). The intelligent data management and storage method analyzes the usage time of the data, classifies the level for optimization, and optimizes the data included in the level and stores it in the system, or it can be backed up and stored in a storage with low storage cost.
대략 통계적으로 보면 시스템에 있는 전체 데이터 량 중에 레벨 4에 속하는 데이터는 20% 정도에 불과하고 레벨 3 이후에 속하는 데이터는 80%에 해당한다. 예를 들어, 이메일의 경우 첨부 파일을 한번 내려 받으면 다시는 메일 내에서 그 첨부 파일을 읽을 일이 드물다. 그리고 압축으로 데이터를 최적화하는 경우에는 데이터의 유형에 따라 압축률이 달라질 수는 있지만 통계적으로 비디오 데이터나 이미지 데이터를 제외한 데이터의 압축률은 평균적으로 80% 이상 가능하므로 원본 데이터를 보관하는 저장 공간을 최소 60% 이상 최적화할 수 있다. 레벨 1에 해당하는 여유 공간 즉 사용되고 있지 않은 저장 공간은 시스템의 특성상 데이터는 들어 있지 않지만 초기화가 되어 있지 않기 때문에 이로 인하여 최적화를 수행할 때 시간이 많이 걸릴 수 있으므로 이 공간을 값을 '0' 또는 '1'로 초기화하는 최적화를 진행하여 최적화 수행 시간도 절감할 수 있다.Roughly statistically speaking, out of the total amount of data in the system, the data belonging to level 4 is only about 20%, and the data belonging to level 3 or later is 80%. For example, in the case of e-mail, once an attachment is downloaded, it is rare to read that attachment within the e-mail again. In addition, when data is optimized by compression, the compression rate may vary depending on the type of data, but statistically, the compression rate of data excluding video data or image data is 80% or higher on average, so the storage space for storing the original data is at least 60 % can be optimized. The free space corresponding to level 1, that is, the unused storage space, does not contain data but is not initialized due to the nature of the system, so it may take a long time to optimize. Therefore, this space is set to '0' or Optimization time can be reduced by initializing with '1'.
한편, 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 사용 시간을 기준으로 한 4개의 레벨로 전체 데이터를 구분하여 그래프 또는 표 등으로 가시화하여 데이터의 분석 결과를 제공할 수 있다.Meanwhile, the method for managing and storing intelligent data according to the embodiment may classify the entire data into four levels based on the usage time, visualize it in a graph or table, and provide analysis results of the data.
도 4는 시간 인덱스 중 사용 시간을 기준으로 적용한 데이터 분석 결과를 시각화한 예를 도시한다.4 illustrates an example of visualizing data analysis results applied based on usage time among time indexes.
도 4를 참조하면, 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 사용자 단말(200)에 마련되어 있는 전체 200GB의 저장 용량 중에서 레벨 4에 해당하는 최근 사용 데이터 24GB를 유지하고 레벨 1 내지 3에 해당하는 나머지 176GB를 최적화 대상(410)으로 선정하고, 선정된 최적화 대상 데이터에 대해서 80%로 최적화하여 약 140GB의 사용자 단말(200)의 저장 공간을 절약할 수 있다. 이 때, 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 176GB의 최적화 대상 데이터에 대해서 데이터 압축, 중복 데이터 제거, 및 가상화를 수행하여 사용자 단말(200) 내의 로컬 저장소에 보관하거나 다른 저장소에 보관하여 로컬 저장소를 최적화한다.Referring to FIG. 4 , the intelligent data management and storage method according to the embodiment maintains 24 GB of recently used data corresponding to level 4 among the total storage capacity of 200 GB provided in the user terminal 200 and stores data corresponding to levels 1 to 3. The remaining 176 GB is selected as the optimization target 410 and optimized to 80% for the selected optimization target data, thereby saving about 140 GB of storage space of the user terminal 200 . At this time, the intelligent data management and storage method according to the embodiment performs data compression, redundant data removal, and virtualization on 176GB of data to be optimized, and stores it in a local storage in the user terminal 200 or stores it in another storage to store the data locally. Optimize storage.
(2) 파일 유형(File Type)에 따른 카테고리 분류(2) Category classification according to file type
사용자 단말(200)의 로컬 저장소에는 운영체제(OS)가 사용하는 OS 파일 영역과 사용자 데이터 영역이 있다. 사용자가 사용하는 사용자 데이터는 파일이나 DB 형태로 구분되어 보관된다. 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 텍스트(text) 파일, 문서(document) 파일, 이미지(image) 파일, 비디오(video) 파일, 오디오(audio) 파일, 및 그 밖의 기타 유형들(external)로 파일 유형을 구분하며, 각 유형별로 파일 이름과 데이터 크기를 계산하여 통계를 내고 그 분석 결과를 그래프나 표의 형태로 가시화하여 보여줄 수 있다. 사용자는 가시화 결과를 통해 특정 시스템에서 가장 많이 사용하는 파일의 유형이 무엇인지 쉽게 알 수 있으며(예를 들어, 병원에 사용되는 시스템은 비디오 데이터나 이미지 데이터가 많은 것으로 분석 결과가 도출된다.), OS 영역의 크기, 파일의 영역의 내용과 크기, 그리고 DB 영역의 내용과 크기 정보를 알아낼 수가 있다. 사용자는 지능형 데이터 관리 및 저장 장치(100)가 제공하는 지능형 데이터 관리 및 저장 방법을 통해 각 파일의 유형별로 데이터에 대한 최적화를 선택적으로 적용하여 데이터의 유형에 맞게 최적화를 할 수 있다. 최적화의 경우 압축을 사용할 때 일반 파일의 유형에 대한 압축과 비디오 데이터를 압축하는 압축 기법은 크게 다르게 때문에 데이터의 유형에 맞게 최적화할 수 있는 압축 기법을 선택적으로 사용하여 최적의 결과를 얻을 수 있다.The local storage of the user terminal 200 includes an OS file area used by an operating system (OS) and a user data area. User data used by users is classified and stored in the form of files or DBs. The intelligent data management and storage method according to the embodiment includes text files, document files, image files, video files, audio files, and other types (external). It classifies the file type, calculates the file name and data size for each type, produces statistics, and visualizes the analysis result in the form of a graph or table. The user can easily know what type of file is most frequently used in a specific system through the visualization result (for example, a system used in a hospital has a lot of video data or image data, so the analysis result is derived), Information about the size of the OS area, the contents and size of the file area, and the contents and size of the DB area can be obtained. The user can optimize according to the type of data by selectively applying data optimization for each file type through the intelligent data management and storage method provided by the intelligent data management and storage device 100 . In the case of optimization, when compression is used, since compression for general file types and compression techniques for compressing video data are significantly different, optimal results can be obtained by selectively using compression techniques that can be optimized according to the type of data.
도 5는 파일 유형에 따른 데이터 분석 결과를 시각화한 예를 도시한다.5 shows an example of visualizing data analysis results according to file types.
도 5를 참조하면, 어느 사용자 단말(200)의 전체 데이터 저장 공간 400GB 중에서 이미지 데이터와 비디오 데이터(510)가 주로 큰 비율을 차지하고 있으므로, 최적화를 위한 압축 방법을 적용 시 획일적인 데이터 압축이 아니라 이미지 데이터와 비디오 데이터에 대해서 최고의 압축율을 제공하는 선택적인 압축 기법의 사용으로 데이터 압축을 최적화할 수 있다. 이때, 이미지 데이터와 비디오 데이터를 제외한 다른 데이터는 각 데이터의 유형에 최적화된 압축 방법을 사용한다. 한편, 압축의 방법으로 최적화되어 있는 데이터에 대해서는 데이터 가상화를 통하여 사용자에게는 원래 제공되고 있던 원본 상태의 데이터 정보를 제공할 수 있다.Referring to FIG. 5 , since image data and video data 510 occupy a large portion of the total data storage space of 400 GB of a user terminal 200, when a compression method for optimization is applied, image rather than uniform data compression is applied. Data compression can be optimized by using an optional compression technique that provides the highest compression ratio for both data and video data. At this time, data other than image data and video data uses a compression method optimized for each type of data. On the other hand, for the data optimized by the compression method, it is possible to provide data information in the original state that was originally provided to the user through data virtualization.
(3) 파일 크기(File Size)에 따른 카테고리 분류(3) Category classification according to file size
파일 크기에 의한 카테고리 분류는 대형 파일, 중형 파일, 소형 파일로 구분할 수 있으며, 예를 들어, 전체 가지고 있는 파일의 크기를 모두 수집하여 평균 값을 구하고 평균 값에 가까운 크기의 파일을 중형 파일로 분류하고, 평균값 이하의 파일을 소형 파일로 분류하고, 평균값 이상의 파일을 대형 파일로 분류하는 방법으로 최적화할 데이터를 파일 크기에 따라 분류하여 사용자에게 분류 결과 정보를 제공할 수 있다.Category classification by file size can be divided into large files, medium files, and small files. For example, all file sizes are collected, the average value is obtained, and files with sizes close to the average value are classified as medium files. In this method, files with an average value or less are classified as small files, and files with an average value or more are classified as large files. Data to be optimized is classified according to the file size, and classification result information can be provided to the user.
(4) 파일 특성(File Property)에 따른 카테고리 분류(4) Category classification according to file properties
파일 특성에 의한 카테고리 분류는 크게 시스템 파일(system files), 개인 파일(private files), 업무용 파일(business files), 및 공용 파일(public files)의 4가지로 구분될 수 있으며, 파일 특성에 의한 분류는 위의 4가지로 분류되는 유형의 파일의 개수가 각각 얼마나 되고 파일의 크기가 얼마나 되는지 분석을 하는 것을 의미한다.Category classification by file characteristics can be largely divided into four categories: system files, private files, business files, and public files, and classification by file characteristics. means to analyze the number of files of each of the above four types and the size of each file.
시스템 파일은 사용자 단말(200)의 로컬 저장 공간 중 OS(운영체제)가 사용하는 영역(OS 영역)에 저장되어 있는 파일이나 프로그램 코드를 의미한다. 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 OS 영역에서 사용하는 저장 공간의 크기와 전체 저장 공간의 크기 대비 OS 영역으로 사용된 공간의 비율을 계산한다.The system file refers to a file or program code stored in an area (OS area) used by an OS (operating system) among local storage spaces of the user terminal 200 . The intelligent data management and storage method according to the embodiment calculates the ratio of the size of the storage space used in the OS area and the space used as the OS area to the total size of the storage space.
개인 파일은 개인의 프라이버시를 가지는 파일들을 의미한다. 이러한 데이터나 파일은 개인의 프라이버시를 고려하여 백업이나 복제를 할 때 암호화를 사용하거나 개인 자신이 인증이 되지 않으면 어떠한 권한을 가지고 있는 사람도 읽거나 쓸 수 없게 심지어는 삭제도 할 수 없게 관리된다. 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 개인 파일이 사용하는 저장 공간의 크기와 전체 저장 공간의 크기 대비 개인 파일의 저장에 사용된 공간의 비율을 계산한다.The personal files refer to files having personal privacy. These data or files are managed so that no one with any authority can read, write, or even delete them unless encryption is used when backing up or duplicating in consideration of individual privacy, or the individual himself or herself is not authenticated. The intelligent data management and storage method according to the embodiment calculates the ratio of the size of the storage space used by personal files and the space used for storing personal files to the total size of the storage space.
업무용 파일은 회사의 업무를 하면서 사용하는 파일을 의미한다. 업무용으로 사용되는 파일은 공유 폴더 개념을 두어 사용 허가 개념을 적용하여 공유하게 하며 데이터의 저장과 직접 연결하여 데이터의 정보 보호를 위해 백업이나 복제를 해야 한다. 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 업무용 파일이 사용하는 저장 공간의 크기와 전체 저장 공간의 크기 대비 업무용 파일의 저장에 사용된 비율을 계산한다.Business files refer to files used while conducting company business. Files used for business use have a shared folder concept and are shared by applying the license concept, and backup or replication must be performed to protect data information in direct connection with the storage of data. The intelligent data management and storage method according to the embodiment calculates the size of the storage space used by work files and the ratio of the total storage space used to store work files.
공용 파일은 인터넷에서 검색이나 다운로드를 통해서 생성한 파일들을 의미한다. 이러한 데이터는 하나의 집단 내에서 여러 사람들 간에 중복하여 생성한 파일이나 데이터가 많기 때문에 중복 파일을 제거함으로써 하나의 파일이나 데이터로 일관성을 유지하고 나머지는 링크를 활용하여 연결한다. 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 공용 파일이 사용하는 저장 공간의 크기와 전체 저장 공간의 크기 대비 공용 파일의 저장에 사용된 비율을 계산한다.Public files refer to files created through search or download on the Internet. Since there are many files or data duplicated between multiple people within a group, duplicate files are removed to maintain consistency as one file or data, and the rest are connected using links. The intelligent data management and storage method according to the embodiment calculates the size of the storage space used by common files and the ratio of the total storage space used to store common files.
(5) 파일 사용 빈도(Frequency)에 따른 카테고리 분류(5) Category classification according to file usage frequency (Frequency)
한편, 파일 사용 빈도에 따른 카테고리 분류는 파일이 얼마나 많이 사용자 또는 시스템에서 사용되고 있는지를 분석하는 것으로 가장 많이 사용하고 있는 파일의 내역을 만들어 최근 사용되는 파일에 대한 정보를 분석하여 사용자에게 정보를 제공하고 관리한다. 예를 들어, 미리 설정한 기간 동안에 사용된 파일들 중, 미리 설정한 파일 사용 빈도에 따라 파일들을 분류하고, 미리 정해진 기준에 따라 해당 분류의 파일들을 최적화할 수 있다.On the other hand, category classification according to file use frequency analyzes how many files are used by users or systems, and provides information to users by analyzing information on recently used files by creating a history of the most used files. manage For example, among files used during a preset period, files may be classified according to a preset file use frequency, and files of the corresponding classification may be optimized according to a preset criterion.
이하에서는 카테고리 분류에 따른 데이터 최적화의 일 예로, 첨부의 도 6을 참조하여 시간 및 파일 유형에 따른 데이터 카테고리 분류 및 분류 결과에 따른 데이터 최적화에 대해서 설명한다.Hereinafter, as an example of data optimization according to category classification, data category classification according to time and file type and data optimization according to the classification result will be described with reference to FIG. 6 attached.
도 6은 시간 및 파일 유형에 따른 데이터 분석 및 데이터 최적화의 절차를 설명하는 도면이다.6 is a diagram explaining procedures of data analysis and data optimization according to time and file type.
도 6을 참조하면, 지능형 데이터 관리 및 저장 장치(100)의 파일 분류 모듈(610)은 사용자 단말(200)로부터 관리 대상 파일에 대한 저장소 디렉토리 정보(601), 파일 접근 시간 정보(602) 및 파일 유형 정보(603)를 수신한 뒤, 수신된 정보에 기초하여 시간 기준으로 파일을 수집하고(S601), 시간 기준으로 파일을 분류한다(S603). 다음으로, 파일 분류 모듈(610)은 수신된 정보에 기초하여 파일 유형 기준으로 파일을 수집하고(S605), 파일 유형 기준으로 파일을 분류한다(S607). 시간 기준 및 유형으로 분류된 분류 결과는 지능형 데이터 관리 및 저장 장치(100)에 저장되고(S609), 각각의 분류 결과(621, 622)는 파일 분류 모듈(610)에서 시각화 과정(S611)을 거쳐 사용자에게 출력된 후, 사용자의 선택에 의해 수동으로 또는 자동으로 데이터 최적화가 수행된다(S613). 시각화는 표 또는 그래프의 형태로 출력되어 사용자가 분석 결과를 한 눈에 파악하기 쉽도록 수행된다.Referring to FIG. 6 , the file classification module 610 of the intelligent data management and storage device 100 provides storage directory information 601 for a management target file from the user terminal 200, file access time information 602, and file access time information 602. After receiving type information 603, based on the received information, files are collected based on time (S601), and files are classified based on time (S603). Next, the file classification module 610 collects files based on the file type based on the received information (S605) and classifies the files based on the file type (S607). Classification results classified by time criteria and types are stored in the intelligent data management and storage device 100 (S609), and each classification result (621, 622) is visualized in the file classification module (610) (S611). After being output to the user, data optimization is performed manually or automatically by the user's selection (S613). Visualization is output in the form of tables or graphs so that users can easily understand the analysis results at a glance.
(6) 파일 개수의 분석에 기초한 데이터 최적화(6) Optimization of data based on analysis of number of files
한편, 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 관리 대상 데이터를 구성하는 파일 개수를 분석하여 그 분석 결과에 따라 데이터 최적화를 할 수 있다.Meanwhile, the intelligent data management and storage method according to the embodiment may analyze the number of files constituting management target data and optimize the data according to the analysis result.
파일 개수에 의한 분석은 사용자가 사용자 단말(200) 상에 가지고 있는 파일의 총 개수를 의미하고, 파일의 개수에 따라 분류하는 것이다. 예를 들어, 파일의 개수가 100,000개 이하이면 소형 등급(Small), 100,000개에서 1,000,000개 사이이면 보통 등급(Normal), 1,000,000 이상이면 대형 등급(Large)으로 사용자 단말(200)의 데이터를 분류하는 것을 의미한다. 데이터 관리에 있어서 파일의 개수가 많으면 많을수록 처리하는 속도나 전송하는 속도가 떨어지기 때문에 파일의 개수가 많을 경우 파일에 대한 처리나 전송에 대한 방식을 Volume을 처리하는 방식이나 Archive를 활용하는 방식을 적용하여 데이터 관리를 최적화할 수 있다.Analysis by the number of files means the total number of files that the user has on the user terminal 200, and is classified according to the number of files. For example, if the number of files is 100,000 or less, small grade (Small), between 100,000 and 1,000,000, normal grade (Normal), and if the number of files is more than 1,000,000, large grade (Large) Classifying the data of the user terminal 200 means that In data management, as the number of files increases, the processing speed or transmission speed decreases. Therefore, in case of a large number of files, the method of processing or transmitting the files is applied to the method of processing volume or utilizing Archive. to optimize data management.
(7) 저장 비용 분석에 기초한 데이터 최적화(7) Data optimization based on storage cost analysis
한편, 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 데이터 저장 비용을 분석하고, 그 분석 결과에 따라 데이터 최적화를 할 수 있다.Meanwhile, the intelligent data management and storage method according to the embodiment may analyze data storage costs and optimize the data according to the analysis result.
데이터의 저장 비용은 저장 매체(디스크, 가상 테이프 라이브러리(Virtual Tape Library: VTL), 솔리드-스테이트 드라이브(Solid-State Drive: SSD), 메모리, 테이프, USB 등)의 종류에 따라 다르고, 저장 매체도 용도가 개인용인지 업무용인지에 따라 저장 비용이 다르다. 또한, 데이터를 로컬 저장소에 저장하는지, 원격 저장소에 저장하는지, 또는 클라우드에 저장하는지에 따라서도 저장 비용이 다르다. 데이터의 저장 장소가 개인 저장 장소인지, 기업 저장 장소인지, 데이터 센터인지에 따라서도 다르고 사용하는 데이터 센터가 위치하는 지역(도시)에 따라서도 달라질 수 있다.The cost of storing data depends on the type of storage medium (disk, Virtual Tape Library (VTL), Solid-State Drive (SSD), memory, tape, USB, etc.), and the storage medium also Storage costs vary depending on whether it is used for personal or business purposes. In addition, storage costs vary depending on whether data is stored locally, remotely, or stored in the cloud. The data storage location may vary depending on whether it is a personal storage location, a corporate storage location, or a data center, and may also vary depending on the region (city) where the data center used is located.
실시 예에 따른 지능형 데이터 관리 및 저장 방법은 이러한 저장 비용이 달라질 수 있는 요소들을 변수로 삼아 저장 비용을 수식으로 산정하고 저장 비용을 절대적인 그리고 상대적인 수치로 환산하여 저장 비용이 최소화되는 저장소를 찾아 데이터를 이동할 수 있다.The intelligent data management and storage method according to the embodiment calculates the storage cost as a formula using factors that may change the storage cost as variables, converts the storage cost into absolute and relative values, finds storage that minimizes the storage cost, and stores data. can move
1 TB의 저장 비용 원가(C)는 다음의 <수식 1>에 의해 산출할 수 있다.The storage cost (C) of 1 TB can be calculated by Equation 1 below.
<수식 1> 1 TB 저장 비용 원가(C) = (시스템에서 사용하는 총 TB의 원가)/총 TB 수<Formula 1> Cost of 1 TB storage Cost (C) = (Cost of total TB used by the system)/Total number of TB
따라서, 클라우드 서비스 제공자(Cloud Service Provider: CSP)의 1 TB 저장 공간 제공 서비스의 가격을 S라고 할 때, 1 TB의 저장 비용 지수(T)는 다음의 <수식 2>에 의해 산출할 수 있다.Therefore, when the price of a 1 TB storage space provision service of a cloud service provider (CSP) is S, the 1 TB storage cost index (T) can be calculated by the following <Equation 2>.
<수식 2> 1 TB 저장 비용지수(T) = S/C<Formula 2> 1 TB storage cost index (T) = S/C
1 TB 저장 비용 지수를 나타내는 T가 적을수록 저장 비용이 최소화되므로 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 데이터를 저장하는 저장소를 선택할 때 저장 비용 지수를 활용하여 저장 비용을 최소화한다. 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 이미 저장된 데이터가 있다고 하더라도 저장 비용 지수를 산정한 뒤, 정책적으로 데이터를 저장 비용 지수가 최소가 되는 데이터 저장소로 데이터를 이동시킬 수 있다.Since the storage cost is minimized as the T representing the 1 TB storage cost index decreases, the intelligent data management and storage method according to the embodiment minimizes the storage cost by utilizing the storage cost index when selecting a storage to store data. The intelligent data management and storage method according to the embodiment may calculate the storage cost index even if there is already stored data, and then move the data to the data storage where the storage cost index is minimized in a policy manner.
(8) 저장 성능에 기초한 데이터 최적화(8) Data optimization based on storage performance
한편, 실시 예에 따른 지능형 데이터 관리 및 저장 방법은 데이터를 저장하거나 읽는 속도 데이터를 수집하여 분석한 뒤, 그 분석 결과를 가시화해서 사용자에게 모든 저장 매체에 대한 저장 성능 수치를 제공할 수 있으며, 성능이 좋은 저장소에 가장 많이 사용하는 데이터를 보관할 수 있도록 데이터의 이동이나 데이터의 최적화를 제공한다.On the other hand, the intelligent data management and storage method according to the embodiment collects and analyzes data on the speed of storing or reading data, and then visualizes the analysis result to provide users with storage performance figures for all storage media. It provides data movement or data optimization so that the most used data can be stored in this good storage.
[2] 데이터 관리 기능[2] Data management function
이하에서는, 실시 예에 따른 지능형 데이터 관리 및 저장 방법에 의한 데이터 관리 기능에 대해 설명한다.Hereinafter, a data management function by an intelligent data management and storage method according to an embodiment will be described.
데이터 관리 기능은 데이터가 저장되는 데이터 저장소 및 데이터 저장 매체에 대한 관리를 하는 데이터 저장소 관리 기능을 의미한다. 데이터 저장소 관리 기능은 지정한 멀티 데이터 저장소에 대한 관리와, 로컬 저장소, 원격 저장소 및 클라우드 저장소에 대한 관리와, 저장 매체인 디스크(DISK), 가상 테이프 라이브러리(Virtual Tape Library: VTL), 물리적 테이프 라이브러리(Physical Tape Library: PTL), 스토리지 에어리어 네트워크(Storage Area Network: SAN), 및 네트워크 결합 스토리지(Network Attached Storage: NAS)에 대한 관리 기능을 가지고 있으며 실행 중인 프로세스에 대한 상세한 정보를 제공하는 모니터링 기능 그리고 종료된 프로세스에 대한 상세 정보를 제공하는 보고 기능을 의미한다.The data management function refers to a data storage management function that manages data storage and data storage media in which data is stored. The data storage management function includes management of designated multi-data storage, local storage, remote storage, and cloud storage, disk (DISK), virtual tape library (VTL), and physical tape library ( It has management capabilities for Physical Tape Library (PTL), Storage Area Network (SAN), and Network Attached Storage (NAS), with monitoring capabilities that provide detailed information about running processes and shutdowns. It is a reporting function that provides detailed information about the process that has been performed.
실시 예에 따른 지능형 데이터 관리 및 저장 방법은 전술한 저장 매체에 따른 저장 비용 분석 결과에 기초하여 네트워크로 연결되어 있는 데이터 저장소들 중에 선택된 저장소에 사용자 단말(200)의 관리 대상 데이터를 이관하거나 백업하고, 최적화된 데이터를 저장할 수 있다.An intelligent data management and storage method according to an embodiment transfers or backs up management target data of the user terminal 200 to a storage selected from among data stores connected to a network based on the storage cost analysis result according to the storage medium described above, and , the optimized data can be stored.
[3] 데이터 저장 기능[3] Data storage function
이하에서는, 실시 예에 따른 지능형 데이터 관리 및 저장 방법에 의한 데이터 저장 기능에 대해 설명한다.Hereinafter, a data storage function by an intelligent data management and storage method according to an embodiment will be described.
실시 예에 따른 지능형 데이터 관리 및 저장 방법은 데이터를 저장하는 기능으로 원본 데이터를 한번 읽어서 시점 기준으로 저장하는 백업 기능, 원본 데이터가 변경될 때마다 이를 실시간으로 반영하여 저장하는 복제 기능, 그리고 백업과 복제 기능을 융합한 하이브리드 기능을 제공한다.The intelligent data management and storage method according to the embodiment is a data storage function, a backup function that reads original data once and stores it on a point-in-time basis, a replication function that reflects and stores the original data in real time whenever it is changed, and backup and It provides a hybrid function that fuses the cloning function.
도 7은 실시 예에 따른 지능형 데이터 관리 및 저장 방법에 의한 백업을 구현하는 시스템 구성을 설명하는 도면이다.7 is a diagram illustrating a system configuration for implementing a backup using an intelligent data management and storage method according to an embodiment.
도 7을 참조하면, 지능형 데이터 관리 및 저장 방법은 백업 UI 모듈(Backup UI module: 710), 백업 마스터 모듈(Backup Master module: 720), 백업 클라이언트 모듈(Backup Client module: 730) 및 백업 서버 모듈(Backup Server module: 740)을 포함하는 구성으로 데이터 백업을 구현한다.Referring to FIG. 7, the intelligent data management and storage method includes a backup UI module (710), a backup master module (720), a backup client module (730), and a backup server module ( Backup Server module: 740) implements data backup.
백업 UI 모듈(710)은 지능형 데이터 관리 및 저장 장치(100) 또는 지능형 데이터 관리 및 저장 장치(100)의 기능을 수행하는 사용자 단말(200)에 설치되는 소프트웨어 모듈로서 모든 백업과 복구에 대한 관리를 할 수 있는 사용자 UI(User Interface)를 제공한다. 사용자는 이 사용자 UI를 통해 백업에 대한 정책 설정, 백업 스케줄링, 백업을 받을 클라이언트의 등록, 백업 서버의 등록 등을 할 수 있으며 데이터 복구에 대한 관리 및 백업과 복구에 대한 결과를 확인할 수 있다. 백업 UI 모듈이 제공하는 사용자 인터페이스 화면은 원본 데이터가 있는 로컬 저장소와 원격 저장소 또는 클라우드 저장소로 데이터 저장 영역을 구분하여 표시함으로써 사용자가 화면 상에서 마우스의 클릭만으로도 데이터를 로컬 저장소에서 로컬 저장소로, 로컬 저장소에서 원격 저장소로, 로컬 저장소에서 클라우드 저장소로 쉽게 저장할 수 있으며, 원격 저장소에서 로컬 저장소로, 클라우드 저장소에서 로컬 저장소로, 클라우드 저장소에서 원격 저장소로의 데이터 저장을 또한 쉽게 할 수 있게 된다.The backup UI module 710 is a software module installed in the intelligent data management and storage device 100 or the user terminal 200 that performs the functions of the intelligent data management and storage device 100, and manages all backup and recovery operations. A user interface (UI) is provided. Through this user UI, users can set backup policies, schedule backups, register clients to receive backups, and register backup servers, and manage data recovery and check the results of backup and recovery. The user interface screen provided by the backup UI module divides and displays data storage areas into local storage with original data and remote storage or cloud storage, allowing users to transfer data from local storage to local storage and local storage with just a click of the mouse on the screen. You can easily save data from remote storage, local storage to cloud storage, remote storage to local storage, cloud storage to local storage, and cloud storage to remote storage.
백업 마스터 모듈(720)은 지능형 데이터 관리 및 저장 장치(100) 또는 지능형 데이터 관리 및 저장 장치(100)의 기능을 수행하는 사용자 단말(200)에 설치되는 소프트웨어 모듈로서 백업 클라이언트(730) 및 백업 서버(740)와 통신하여 전체적으로 백업 대상을 관리 및 제어하며, DB(MySQL/postgres)에 백업에 관련한 모든 데이터를 저장한다. 지능형 데이터 관리 및 저장 장치(100)는 리눅스 서버 장치 등일 수 있으며, 이 때, 사용자는 윈도우즈 PC 같은 단말에 설치된 백업 UI 모듈(710)을 통해서 백업 마스터 모듈(720)을 제어한다.The backup master module 720 is a software module installed in the intelligent data management and storage device 100 or the user terminal 200 that performs the function of the intelligent data management and storage device 100, and includes a backup client 730 and a backup server. (740) to manage and control the backup target as a whole, and store all data related to backup in DB (MySQL/postgres). The intelligent data management and storage device 100 may be a Linux server device or the like, and at this time, a user controls the backup master module 720 through a backup UI module 710 installed in a terminal such as a Windows PC.
백업 클라이언트 모듈(730)은 윈도우즈 시스템 기반의 백업 클라이언트 모듈(731), 리눅스 서버 기반의 백업 클라이언트 모듈(732), 유닉스 서버 기반의 백업 클라이언트 모듈(733) 등 백업 대상이 되는 데이터를 저장하고 있는 서버 장치(도 1의 사용자 단말들(200))에 설치되는 소프트웨어 모듈로서 백업 대상 데이터를 읽어서 백업 서버 장치(740)에 마련되어 있는 데이터 저장소로 전달한다.The backup client module 730 includes a server that stores data to be backed up, such as a Windows system-based backup client module 731, a Linux server-based backup client module 732, and a Unix server-based backup client module 733. As a software module installed in the device (the user terminals 200 of FIG. 1 ), it reads the data to be backed up and transfers it to the data storage provided in the backup server device 740 .
백업 서버 모듈(740)은 윈도우즈 시스템 기반의 백업 서버 모듈(741), 리눅스 서버 기반의 백업 서버 모듈(742), 유닉스 서버 기반의 백업 서버 모듈(743) 등 백업 저장소가 마련되어 있는 서버 장치(도 1의 저장 장치 서버들(300))에 설치되는 소프트웨어 모듈로서 백업 마스터 모듈(720) 및 백업 클라이언트 모듈(730)과 통신을 하며 데이터를 저장할 저장소를 설정하여 백업 클라이언트(730)로부터 데이터를 읽어와 데이터를 저장하는 저장소 역할을 한다.The backup server module 740 is a server device having backup storage such as a Windows system-based backup server module 741, a Linux server-based backup server module 742, and a Unix server-based backup server module 743 (FIG. 1 As a software module installed in the storage servers 300), it communicates with the backup master module 720 and the backup client module 730, sets a storage to store data, reads data from the backup client 730, and reads the data. Serves as a repository to store
도 8은 전술한 실시 예에 따른 지능형 데이터 관리 및 저장 방법에 의해 수행되는 데이터 분석, 데이터 관리, 및 데이터 저장의 기능을 표로서 상세하게 정리하여 설명한 도면이다.8 is a diagram illustrating in detail the functions of data analysis, data management, and data storage performed by the intelligent data management and storage method according to the above-described embodiment as a table.
이하에서는, 본 명세서에서 제안하는 장치 및 방법, 특히 전술한 인공지능 기반의 데이터 분석 모듈에 적용할 수 있는 인공 지능 프로세싱 모듈 및 이의 적용에 대해 도 9를 참고하여 살펴보기로 한다. 즉, 후술하는 내용 즉, 도 9와 관련된 내용은 본 명세서에서 제안하는 방법을 구현하기 위해 적용될 수 있음을 명확히 한다.Hereinafter, an artificial intelligence processing module applicable to the apparatus and method proposed in this specification, particularly the aforementioned artificial intelligence-based data analysis module, and its application will be described with reference to FIG. 9 . That is, it is clarified that the content to be described later, that is, the content related to FIG. 9 can be applied to implement the method proposed in this specification.
인공 지능(Artificial Intelligence, 이하 AI라 한다.)은 수많은 분석을 사용하여 복잡한 대상 작업이 수행되는 방식을 결정할 수 있다. 즉, AI는 효율성을 높이고 처리 지연을 줄일 수 있다. 대량의 데이터 분석과 같은 시간 소모적인 작업은 AI를 사용함으로써 즉시 수행될 수 있다.Artificial Intelligence (hereafter referred to as AI) can use numerous analyzes to determine how complex target tasks are to be performed. In other words, AI can increase efficiency and reduce processing delays. Time-consuming tasks such as analyzing large amounts of data can be performed instantly by using AI.
이하, AI의 일종인 머신 러닝에 대해 보다 구체적으로 살펴본다.Hereinafter, machine learning, a type of AI, will be looked at in more detail.
머신 러닝은 사람이 할 수 있거나 혹은 하기 어려운 작업을 대신해낼 수 있는 기계를 만들어 내기 위해 기계를 학습시키는 일련의 동작을 의미한다. 머신 러닝을 위해서는 데이터와 러닝 모델이 필요하다. 머신 러닝에서 데이터의 학습 방법은 크게 3가지 즉, 지도 학습(supervised learning), 비지도 학습(unsupervised learning) 그리고 강화 학습(reinforcement learning)으로 구분될 수 있다.Machine learning refers to a set of actions that train a machine to create a machine that can do tasks that humans can or cannot do. Machine learning requires data and a running model. In machine learning, data learning methods can be largely classified into three types: supervised learning, unsupervised learning, and reinforcement learning.
신경망 학습은 출력의 오류를 최소화하기 위한 것이다. 신경망 학습은 반복적으로 학습 데이터를 신경망에 입력시키고 학습 데이터에 대한 신경망의 출력과 타겟의 에러를 계산하고, 에러를 줄이기 위한 방향으로 신경망의 에러를 신경망의 출력 레이어에서부터 입력 레이어 방향으로 역전파(backpropagation) 하여 신경망의 각 노드의 가중치를 업데이트하는 과정이다.Neural network training is aimed at minimizing errors in the output. Neural network learning repeatedly inputs training data to the neural network, calculates the output of the neural network for the training data and the error of the target, and backpropagates the error of the neural network from the output layer of the neural network to the input layer in a direction to reduce the error. ) to update the weight of each node in the neural network.
지도 학습은 학습 데이터에 정답이 라벨링된 학습 데이터를 사용하며 비지도 학습은 학습 데이터에 정답이 라벨링되어 있지 않을 수 있다. 즉, 예를 들어 데이터 분류에 관한 지도 학습의 경우의 학습 데이터는 학습 데이터 각각에 카테고리가 라벨링된 데이터 일 수 있다. 라벨링된 학습 데이터가 신경망에 입력되고 신경망의 출력(카테고리)과 학습 데이터의 라벨을 비교하여 오차(error)가 계산될 수 있다. 계산된 오차는 신경망에서 역방향(즉, 출력 레이어에서 입력 레이어 방향)으로 역전파되며, 역전파에 따라 신경망의 각 레이어의 각 노드들의 연결 가중치가 업데이트 될 수 있다. 업데이트 되는 각 노드의 연결 가중치는 학습률(learning rate)에 따라 변화량이 결정될 수 있다. 입력 데이터에 대한 신경망의 계산과 에러의 역전파는 학습 사이클(epoch)을 구성할 수 있다. 학습률은 신경망의 학습 사이클의 반복 횟수에 따라 상이하게 적용될 수 있다. 예를 들어, 신경망의 학습 초기에는 높은 학습률을 사용하여 신경망이 빠르게 일정 수준의 성능을 확보하도록 하여 효율성을 높이고, 학습 후기에는 낮은 학습률을 사용하여 정확도를 높일 수 있다Supervised learning uses training data in which correct answers are labeled in the learning data, and unsupervised learning may not have correct answers labeled in the learning data. That is, for example, learning data in the case of supervised learning related to data classification may be data in which each learning data is labeled with a category. Labeled training data is input to the neural network, and an error may be calculated by comparing the output (category) of the neural network and the label of the training data. The calculated error is back-propagated in a reverse direction (ie, from the output layer to the input layer) in the neural network, and connection weights of each node of each layer of the neural network may be updated according to the back-propagation. The amount of change in the connection weight of each updated node may be determined according to a learning rate. The neural network's computation of input data and backpropagation of errors can constitute a learning cycle (epoch). The learning rate may be applied differently according to the number of iterations of the learning cycle of the neural network. For example, a high learning rate is used in the early stages of neural network learning to increase efficiency by allowing the neural network to quickly achieve a certain level of performance, and a low learning rate can be used in the late stage to increase accuracy.
데이터의 특징에 따라 학습 방법은 달라질 수 있다. 예를 들어, 통신 시스템 상에서 송신단에서 전송한 데이터를 수신단에서 정확하게 예측하는 것을 목적으로 하는 경우, 비지도 학습 또는 강화 학습 보다는 지도 학습을 이용하여 학습을 수행하는 것이 바람직하다.The learning method may vary depending on the characteristics of the data. For example, in a case where the purpose of the receiver is to accurately predict data transmitted by the transmitter in a communication system, it is preferable to perform learning using supervised learning rather than unsupervised learning or reinforcement learning.
러닝 모델은 인간의 뇌에 해당하는 것으로서, 가장 기본적인 선형 모델을 생각할 수 있으나, 인공 신경망(ANN, artificial neural networks)와 같은 복잡성이 높은 신경망 구조를 러닝 모델로 사용하는 머신 러닝의 패러다임을 딥러닝(deep learning)이라 한다.The learning model corresponds to the human brain, and the most basic linear model can be considered. called deep learning).
학습(learning) 방식으로 사용하는 신경망 코어(neural network cord)는 크게 심층 신경망(DNN, deep neural networks), 합성곱 신경망(CNN, convolutional deep neural networks), 순환 신경망(RNN, Recurrent Neural Network) 방식이 있다.The neural network cord used as a learning method is largely divided into deep neural networks (DNN), convolutional deep neural networks (CNN), and recurrent neural networks (RNN). there is.
인공 신경망(artificial neural network)은 여러 개의 퍼셉트론을 연결한 예시이다.An artificial neural network is an example of connecting several perceptrons.
도 9는 본 발명의 일 실시예에 따른 AI 장치의 블록도이다.9 is a block diagram of an AI device according to an embodiment of the present invention.
상기 AI 장치(900)는 AI 프로세싱을 수행할 수 있는 AI 모듈을 포함하는 전자 기기 또는 상기 AI 모듈을 포함하는 서버 등을 포함할 수 있다. 또한, 상기 AI 장치(900)는 실시 예에 따른 지능형 데이터 관리 및 저장 장치(100)의 적어도 일부의 구성으로 포함되어 AI 프로세싱 중 적어도 일부를 함께 수행하도록 구비될 수도 있다.The AI device 900 may include an electronic device including an AI module capable of performing AI processing or a server including the AI module. In addition, the AI device 900 may be included in at least a part of the intelligent data management and storage device 100 according to the embodiment to perform at least a part of AI processing together.
상기 AI 장치(900)는 AI 프로세서(901), 메모리(905) 및/또는 통신부(907)를 포함할 수 있다.The AI device 900 may include an AI processor 901, a memory 905 and/or a communication unit 907.
상기 AI 장치(900)는 신경망을 학습할 수 있는 컴퓨팅 장치로서, 서버, 데스크탑 PC, 노트북 PC, 태블릿 PC 등과 같은 다양한 전자 장치로 구현될 수 있다.The AI device 900 is a computing device capable of learning a neural network, and may be implemented in various electronic devices such as a server, a desktop PC, a notebook PC, and a tablet PC.
AI 프로세서(901)는 메모리(905)에 저장된 프로그램을 이용하여 신경망을 학습할 수 있다. 특히, AI 프로세서(901)는 영상 관련 데이터를 인식하기 위한 신경망을 학습할 수 있다. 여기서, 영상 관련 데이터를 인식하기 위한 신경망은 인간의 뇌 구조를 컴퓨터 상에서 모의하도록 설계될 수 있으며, 인간의 신경망의 뉴런(neuron)을 모의하는, 가중치를 갖는 복수의 네트워크 노드들을 포함할 수 있다. 복수의 네트워크 모드들은 뉴런이 시냅스(synapse)를 통해 신호를 주고받는 뉴런의 시냅틱 활동을 모의하도록 각각 연결 관계에 따라 데이터를 주고받을 수 있다. 여기서 신경망은 신경망 모델에서 발전한 딥러닝 모델을 포함할 수 있다. 딥 러닝 모델에서 복수의 네트워크 노드들은 서로 다른 레이어에 위치하면서 컨볼루션(convolution) 연결 관계에 따라 데이터를 주고받을 수 있다. 신경망 모델의 예는 심층 신경망(DNN, deep neural networks), 합성곱 신경망(CNN, convolutional deep neural networks), 순환 신경망(RNN, Recurrent Boltzmann Machine), 제한 볼츠만 머신(RBM, Restricted Boltzmann Machine), 심층 신뢰 신경망(DBN, deep belief networks), 심층 Q-네트워크(Deep Q-Network)와 같은 다양한 딥 러닝 기법들을 포함하며, 컴퓨터비젼, 음성인식, 자연어처리, 음성/신호처리 등의 분야에 적용될 수 있다.The AI processor 901 may learn a neural network using a program stored in the memory 905 . In particular, the AI processor 901 may learn a neural network for recognizing image-related data. Here, the neural network for recognizing image-related data may be designed to simulate the structure of the human brain on a computer, and may include a plurality of network nodes having weights that simulate neurons of the human neural network. A plurality of network modes may transmit and receive data according to a connection relationship, respectively, so as to simulate synaptic activity of neurons that transmit and receive signals through synapses. Here, the neural network may include a deep learning model developed from a neural network model. In the deep learning model, a plurality of network nodes may exchange data according to a convolution connection relationship while being located in different layers. Examples of neural network models are deep neural networks (DNN), convolutional deep neural networks (CNN), recurrent Boltzmann machines (RNNs), restricted Boltzmann machines (RBMs), deep trust It includes various deep learning techniques such as deep belief networks (DBN) and deep Q-network, and can be applied to fields such as computer vision, voice recognition, natural language processing, and voice/signal processing.
한편, 전술한 바와 같은 기능을 수행하는 프로세서는 범용 프로세서(예를 들어, CPU)일 수 있으나, 인공지능 학습을 위한 AI 전용 프로세서(예를 들어, GPU)일 수 있다.Meanwhile, the processor performing the functions described above may be a general-purpose processor (eg, CPU), or may be an AI-only processor (eg, GPU) for artificial intelligence learning.
메모리(905)는 AI 장치(900)의 동작에 필요한 각종 프로그램 및 데이터를 저장할 수 있다. 메모리(905)는 비 휘발성 메모리, 휘발성 메모리, 플래시 메모리(flash-memory), 하드디스크 드라이브(HDD) 또는 솔리드 스테이트 드라이브(SDD) 등으로 구현할 수 있다. 메모리(905)는 AI 프로세서(901)에 의해 액세스되며, AI 프로세서(901)에 의한 데이터의 독취/기록/수정/삭제/갱신 등이 수행될 수 있다. 또한, 메모리(905)는 본 발명의 일 실시예에 따른 데이터 분류/인식을 위한 학습 알고리즘을 통해 생성된 신경망 모델(예를 들어, 딥 러닝 모델(906))을 저장할 수 있다.The memory 905 may store various programs and data necessary for the operation of the AI device 900 . The memory 905 may be implemented as a non-volatile memory, a volatile memory, a flash-memory, a hard disk drive (HDD), or a solid state drive (SDD). The memory 905 is accessed by the AI processor 901, and reading/writing/modifying/deleting/updating of data by the AI processor 901 can be performed. In addition, the memory 905 may store a neural network model (eg, a deep learning model 906) generated through a learning algorithm for data classification/recognition according to an embodiment of the present invention.
한편, AI 프로세서(901)는 데이터 분류/인식을 위한 신경망을 학습하는 데이터 학습부(902)를 포함할 수 있다. 데이터 학습부(902)는 데이터 분류/인식을 판단하기 위하여 어떤 학습 데이터를 이용할지, 학습 데이터를 이용하여 데이터를 어떻게 분류하고 인식할지에 관한 기준을 학습할 수 있다. 데이터 학습부(902)는 학습에 이용될 학습 데이터를 획득하고, 획득된 학습데이터를 딥러닝 모델에 적용함으로써, 딥러닝 모델을 학습할 수 있다. Meanwhile, the AI processor 901 may include a data learning unit 902 that learns a neural network for data classification/recognition. The data learning unit 902 may learn criteria for which training data to use to determine data classification/recognition and how to classify and recognize data using the training data. The data learning unit 902 may acquire learning data to be used for learning and learn the deep learning model by applying the obtained learning data to the deep learning model.
데이터 학습부(902)는 적어도 하나의 하드웨어 칩 형태로 제작되어 AI 장치(900)에 탑재될 수 있다. 예를 들어, 데이터 학습부(902)는 인공지능(AI)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 범용 프로세서(CPU) 또는 그래픽 전용 프로세서(GPU)의 일부로 제작되어 AI 장치(900)에 탑재될 수도 있다. 또한, 데이터 학습부(902)는 소프트웨어 모듈로 구현될 수 있다. 소프트웨어 모듈(또는 인스트럭션(instruction)을 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록 매체(non-transitory computer readable media)에 저장될 수 있다. 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 애플리케이션에 의해 제공될 수 있다.The data learning unit 902 may be manufactured in the form of at least one hardware chip and mounted in the AI device 900 . For example, the data learning unit 902 may be manufactured in the form of a dedicated hardware chip for artificial intelligence (AI), or manufactured as a part of a general-purpose processor (CPU) or a graphics-only processor (GPU) for the AI device 900. may be mounted. Also, the data learning unit 902 may be implemented as a software module. When implemented as a software module (or a program module including instructions), the software module may be stored in a computer-readable, non-transitory computer readable recording medium (non-transitory computer readable media). In this case, at least one software module may be provided by an Operating System (OS) or an application.
데이터 학습부(902)는 학습 데이터 획득부(903) 및 모델 학습부(904)를 포함할 수 있다.The data learning unit 902 may include a learning data acquisition unit 903 and a model learning unit 904 .
학습 데이터 획득부(903)는 데이터를 분류하고 인식하기 위한 신경망 모델에 필요한 학습 데이터를 획득할 수 있다. 예를 들어, 학습 데이터 획득부(903)는 학습 데이터로서, 신경망 모델에 입력하기 위한 데이터 및/또는 샘플 데이터를 획득할 수 있다.The training data acquisition unit 903 may acquire training data necessary for a neural network model for classifying and recognizing data. For example, the learning data acquisition unit 903 may acquire data and/or sample data to be input to a neural network model as learning data.
모델 학습부(904)는 상기 획득된 학습 데이터를 이용하여, 신경망 모델이 소정의 데이터를 어떻게 분류할지에 관한 판단 기준을 가지도록 학습할 수 있다. 이 때 모델 학습부(904)는 학습 데이터 중 적어도 일부를 판단 기준으로 이용하는 지도 학습(supervised learning)을 통하여, 신경망 모델을 학습시킬 수 있다. 또는 모델 학습부(904)는 지도 없이 학습 데이터를 이용하여 스스로 학습함으로써, 판단 기준을 발견하는 비지도 학습(unsupervised learning)을 통해 신경망 모델을 학습시킬 수 있다. 또한, 모델 학습부(904)는 학습에 따른 상황 판단의 결과가 올바른지에 대한 피드백을 이용하여 강화 학습(reinforcement learning)을 통하여, 신경망 모델을 학습시킬 수 있다. 또한, 모델 학습부(904)는 오류 역전파법(error back-propagation) 또는 경사 하강법(gradient decent)을 포함하는 학습 알고리즘을 이용하여 신경망 모델을 학습시킬 수 있다. The model learning unit 904 may learn to have a criterion for determining how to classify predetermined data by using the obtained training data. At this time, the model learning unit 904 may learn the neural network model through supervised learning using at least some of the learning data as a criterion. Alternatively, the model learning unit 904 may learn the neural network model through unsupervised learning in which a criterion for determination is discovered by self-learning using training data without guidance. In addition, the model learning unit 904 may learn the neural network model through reinforcement learning using feedback about whether the result of the situation judgment according to learning is correct. In addition, the model learning unit 904 may train the neural network model using a learning algorithm including error back-propagation or gradient decent.
신경망 모델이 학습되면, 모델 학습부(904)는 학습된 신경망 모델을 메모리에 저장할 수 있다. 모델 학습부(904)는 학습된 신경망 모델을 AI 장치(900)와 유선 또는 무선 네트워크로 연결된 서버의 메모리에 저장할 수도 있다.When the neural network model is learned, the model learning unit 904 may store the learned neural network model in memory. The model learning unit 904 may store the learned neural network model in a memory of a server connected to the AI device 900 through a wired or wireless network.
데이터 학습부(902)는 인식 모델의 분석 결과를 향상시키거나, 인식 모델의 생성에 필요한 리소스 또는 시간을 절약하기 위해 학습 데이터 전처리부(미도시) 및 학습 데이터 선택부(미도시)를 더 포함할 수도 있다. The data learning unit 902 further includes a training data pre-processing unit (not shown) and a training data selection unit (not shown) to improve the analysis result of the recognition model or save resources or time required for generating the recognition model. You may.
학습 데이터 전처리부는 획득된 데이터가 상황 판단을 위한 학습에 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 예를 들어, 학습 데이터 전처리부는, 모델 학습부(904)가 영상 인식을 위한 학습을 위하여 획득된 학습 데이터를 이용할 수 있도록, 획득된 데이터를 기 설정된 포맷으로 가공할 수 있다.The learning data pre-processing unit may pre-process the acquired data so that the acquired data can be used for learning for situation determination. For example, the learning data pre-processing unit may process the acquired data into a preset format so that the model learning unit 904 can use the acquired learning data for learning for image recognition.
또한, 학습 데이터 선택부는, 학습 데이터 획득부(903)에서 획득된 학습 데이터 또는 전처리부에서 전처리된 학습 데이터 중 학습에 필요한 데이터를 선택할 수 있다. 선택된 학습 데이터는 모델 학습부(904)에 제공될 수 있다. 예를 들어, 학습 데이터 선택부는, 획득한 영상 중 특정 영역을 검출함으로써, 특정 영역에 포함된 객체에 대한 데이터만을 학습 데이터로 선택할 수 있다.In addition, the learning data selector may select data necessary for learning from among the learning data acquired by the learning data acquisition unit 903 or the learning data preprocessed by the preprocessor. The selected learning data may be provided to the model learning unit 904 . For example, the learning data selection unit may select only data about an object included in a specific region as training data by detecting a specific region among acquired images.
또한, 데이터 학습부(902)는 신경망 모델의 분석 결과를 향상시키기 위하여 모델 평가부(미도시)를 더 포함할 수도 있다.In addition, the data learning unit 902 may further include a model evaluation unit (not shown) to improve the analysis result of the neural network model.
모델 평가부는, 신경망 모델에 평가 데이터를 입력하고, 평가 데이터로부터 출력되는 분석 결과가 소정 기준을 만족하지 못하는 경우, 모델 학습부(902)로 하여금 다시 학습하도록 할 수 있다. 이 경우, 평가 데이터는 인식 모델을 평가하기 위한 기 정의된 데이터일 수 있다. 일 예로, 모델 평가부는 평가 데이터에 대한 학습된 인식 모델의 분석 결과 중, 분석 결과가 정확하지 않은 평가 데이터의 개수 또는 비율이 미리 설정되 임계치를 초과하는 경우, 소정 기준을 만족하지 못한 것으로 평가할 수 있다.The model evaluation unit inputs evaluation data to the neural network model, and when an analysis result output from the evaluation data does not satisfy a predetermined criterion, the model learning unit 902 may perform relearning. In this case, the evaluation data may be predefined data for evaluating the recognition model. For example, the model evaluator may evaluate that the predetermined criterion is not satisfied when the number or ratio of the evaluation data for which the analysis result is inaccurate among the analysis results of the learned recognition model for the evaluation data exceeds a preset threshold. there is.
통신부(907)는 AI 프로세서(901)에 의한 AI 프로세싱 결과를 외부 전자 기기로 전송할 수 있다.The communication unit 907 may transmit AI processing results by the AI processor 901 to an external electronic device.
여기서 외부 전자 기기는 AI 장치와 유/무선으로 통신할수 있는 디바이스로, 후술할 방송 장치, 시청자 장치를 포함할 수 있다. 이 경우, 상기 AI 장치는 관리자 장치에 구현될 수 있다.Here, the external electronic device is a device capable of wired/wireless communication with the AI device, and may include a broadcasting device and a viewer device to be described later. In this case, the AI device may be implemented in the manager device.
한편, 도 9에 도시된 AI 장치(900)는 AI 프로세서(901)와 메모리(905), 통신부(907) 등으로 기능적으로 구분하여 설명하였지만, 전술한 구성요소들이 하나의 모듈로 통합되어 AI 모듈로 호칭될 수도 있음을 밝혀둔다.On the other hand, the AI device 900 shown in FIG. 9 has been functionally divided into an AI processor 901, a memory 905, a communication unit 907, etc., but the above-described components are integrated into one module and the AI module Note that it can also be called
전술한 설명에서, 단계들 또는 동작들은 본 발명의 구현예에 따라서, 추가적인 단계들, 과정들 또는 동작들로 더 분할되거나, 더 적은 단계들, 과정들 또는 동작들로 조합될 수 있다. 또한, 일부 단계, 과정 또는 동작은 필요에 따라 생략될 수도 있고, 단계, 과정 또는 동작 간의 순서가 전환될 수도 있다. 또한, 전술한 지능형 데이터 관리 및 저장 장치를 이용한 지능형 데이터 관리 및 저장 방법이 포함하는 각 단계 또는 동작은 컴퓨터프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체에 저장될 수 있으며, 컴퓨터 장치에 의해 각 단계, 과정 또는 동작이 실행될 수도 있다.In the foregoing description, the steps or actions may be further divided into additional steps, procedures or actions, or combined into fewer steps, procedures or actions, depending on the implementation of the invention. In addition, some steps, processes or operations may be omitted if necessary, or the order of steps, processes or operations may be switched. In addition, each step or operation included in the intelligent data management and storage method using the above-described intelligent data management and storage device may be implemented as a computer program and stored in a computer-readable recording medium, and each step may be performed by a computer device. , a process or action may be executed.
이상에서 설명된 실시 예들은 본 발명의 구성요소들과 특징들이 소정 형태로 결합된 것들이다. 각 구성요소 또는 특징은 별도의 명시적 언급이 없는 한 선택적인 것으로 고려되어야 한다. 각 구성요소 또는 특징은 다른 구성요소나 특징과 결합되지 않은 형태로 실시될 수 있다. 또한, 일부 구성요소들 및/또는 특징들을 결합하여 본 발명의 실시 예를 구성하는 것도 가능하다. 본 발명의 실시 예들에서 설명되는 동작들의 순서는 변경될 수 있다. 어느 실시예의 일부 구성이나 특징은 다른 실시 예에 포함될 수 있고, 또는 다른 실시예의 대응하는 구성 또는 특징과 교체될 수 있다. 특허청구범위에서 명시적인 인용 관계가 있지 않은 청구항들을 결합하여 실시 예를 구성하거나 출원 후의 보정에 의해 새로운 청구항으로 포함시킬 수 있음은 자명하다.The embodiments described above are those in which elements and features of the present invention are combined in a predetermined form. Each component or feature should be considered optional unless explicitly stated otherwise. Each component or feature may be implemented in a form not combined with other components or features. In addition, it is also possible to configure an embodiment of the present invention by combining some components and/or features. The order of operations described in the embodiments of the present invention may be changed. Some components or features of one embodiment may be included in another embodiment, or may be replaced with corresponding components or features of another embodiment. It is obvious that claims that do not have an explicit citation relationship in the claims can be combined to form an embodiment or can be included as new claims by amendment after filing.
본 발명에 따른 실시 예는 다양한 수단, 예를 들어, 하드웨어, 펌웨어(firmware), 소프트웨어 또는 그것들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 본 발명의 일 실시 예는 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 프로세서, 콘트롤러, 마이크로 콘트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.An embodiment according to the present invention may be implemented by various means, for example, hardware, firmware, software, or a combination thereof. In the case of implementation by hardware, one embodiment of the present invention is one or more ASICs (Application Specific Integrated Circuits), DSPs (Digital Signal Processors), DSPDs (Digital Signal Processing Devices), PLDs (Programmable Logic Devices), FPGAs ( Field Programmable Gate Arrays), processors, controllers, microcontrollers, microprocessors, etc.
펌웨어나 소프트웨어에 의한 구현의 경우, 본 발명의 일 실시 예는 이상에서 설명된 기능 또는 동작들을 수행하는 모듈, 절차, 함수 등의 형태로 구현될 수 있다. 소프트웨어 코드는 메모리에 저장되어 프로세서에 의해 구동될 수 있다. 상기 메모리는 상기 프로세서 내부 또는 외부에 위치하여, 이미 공지된 다양한 수단에 의해 상기 프로세서와 데이터를 주고 받을 수 있다.In the case of implementation by firmware or software, an embodiment of the present invention may be implemented in the form of a module, procedure, or function that performs the functions or operations described above. The software code can be stored in memory and run by a processor. The memory may be located inside or outside the processor and exchange data with the processor by various means known in the art.
본 명세서에서 사용된 용어 "부"는(예를 들면, 제어부 등), 예를 들어, 하드웨어, 소프트웨어 또는 펌웨어(firmware) 중 하나 또는 둘 이상의 조합을 포함하는 단위(unit)를 의미할 수 있다. "부"는, 예를 들어, 유닛(unit), 로직(logic), 논리블록(logical block), 부품(component), 또는 회로(circuit) 등의 용어와 바꾸어 사용(interchangeably use)될 수 있다. "부"는, 일체로 구성된 부품의 최소 단위 또는 그 일부가 될 수 있다. "부"는 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수도 있다. "부"는 기계적으로 또는 전자적으로 구현될 수 있다. 예를 들어, "부"는, 알려졌거나 앞으로 개발될, 어떤 동작들을 수행하는 ASIC(Application-Specific Integrated Circuit) 칩, FPGAs(Field-Programmable Gate Arrays) 또는 프로그램 가능 논리 장치(programmable-logic device) 중 적어도 하나를 포함할 수 있다.As used herein, the term “unit” (eg, a controller) may refer to a unit including one or a combination of two or more of, for example, hardware, software, or firmware. “Unit” may be used interchangeably with terms such as, for example, unit, logic, logical block, component, or circuit. A "unit" may be a minimum unit of an integrally constituted part or a part thereof. A “unit” may be a minimal unit or part thereof that performs one or more functions. A “unit” may be implemented mechanically or electronically. For example, a "part" is an application-specific integrated circuit (ASIC) chip, field-programmable gate arrays (FPGAs), or programmable-logic device that performs certain operations, known or developed in the future. may contain at least one.
다양한 실시예에 따른 장치(예: 모듈들 또는 그 기능들) 또는 방법(예: 동작들)의 적어도 일부는, 예컨대, 프로그램 모듈의 형태로 컴퓨터로 읽을 수 있는 저장매체(computer-readable storage media)에 저장된 명령어로 구현될 수 있다. 상기 명령어가 프로세서에 의해 실행될 경우, 상기 하나 이상의 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다. 컴퓨터로 읽을 수 있는 저장매체는, 예를 들어, 메모리가 될 수 있다.At least some of the devices (eg, modules or functions thereof) or methods (eg, operations) according to various embodiments may be stored on computer-readable storage media in the form of, for example, program modules. It can be implemented as a command stored in . When the command is executed by a processor, the one or more processors may perform a function corresponding to the command. The computer-readable storage medium may be, for example, a memory.
본 명세서에 사용된 용어 "하나"는 하나 또는 하나 이상으로 정의된다. 또한, 청구 범위에서 "적어도 하나" 및 "하나 이상"과 같은 도입 문구를 사용하는 것은, 동일한 청구항에 "적어도 하나" 및 "하나 이상"과 같은 도입 문구 및 "하나" 같은 불명료한 문구가 포함되어 있는 경우라 할지라도, 불명료한 문구 "하나"에 의한 다른 청구항 요소의 도입이 그러한 요소를 하나만을 포함하는 발명에 대해 그렇게 도입된 청구항 요소를 포함하는 임의의 특정 청구항을 제한한다는 것을 의미하는 것으로 해석되어서는 안된다.As used herein, the term "a" is defined as one or more than one. Also, the use of introductory phrases such as “at least one” and “one or more” in a claim means that the same claim includes introductory phrases such as “at least one” and “one or more” and ambiguous phrases such as “an”. If any, be construed to mean that the introduction of another claim element by the ambiguous phrase "an" limits any particular claim containing the so-introduced claim element to an invention containing only one such element. It shouldn't be.
또한, 통상의 기술자는 전술한 동작들의 기능성 사이의 경계가 단지 예시적인 것임을 인식할 것이다. 복수의 동작들은 단일 동작으로 결합될 수 있고, 단일 동작은 추가 동작들로 분산될 수 있으며, 동작들은 시간적으로 적어도 부분적으로 겹쳐서 실행될 수 있다. 또한, 대안적인 실시예들은 특정 동작에 대한 복수의 인스턴스들을 포함할 수 있고, 동작들의 순서는 다양한 다른 실시예에서 변경될 수 있다. 그러나, 다른 수정, 변형 및 대안이 또한 가능하다. 따라서, 상세한 설명 및 도면은 제한적인 의미가 아니라 예시적인 것으로 간주되어야 한다.Further, those skilled in the art will recognize that the boundaries between the functionality of the foregoing operations are exemplary only. A plurality of actions may be combined into a single action, a single action may be distributed into additional actions, and the actions may be executed at least partially overlapping in time. Also, alternative embodiments may include multiple instances of a particular operation, and the order of operations may be changed in various other embodiments. However, other modifications, variations and alternatives are also possible. Accordingly, the detailed description and drawings are to be regarded in an illustrative rather than a limiting sense.
"X일 수 있다"는 문구는 조건 X가 충족될 수 있음을 나타낸다. 이 문구는 또한 조건 X가 충족되지 않을 수도 있음을 나타낸다. 예를 들어, 특정 구성 요소를 포함하는 시스템에 대한 참조는 시스템이 특정 구성 요소를 포함하지 않는 시나리오도 포함해야 한다. 예를 들어, 특정 동작을 포함하는 방법에 대한 참조는 해당 방법이 특정 구성 요소를 포함하지 않는 시나리오도 포함해야 한다. 그러나 또 다른 예를 들면, 특정 동작을 수행하도록 구성된 시스템에 대한 참조는 시스템이 특정 작업을 수행하도록 구성되지 않은 시나리오도 포함해야 한다.The phrase “may be X” indicates that condition X can be met. This phrase also indicates that condition X may not be satisfied. For example, a reference to a system that contains a specific component should also include a scenario where the system does not contain that specific component. For example, a reference to a method that includes a specific action must also include scenarios in which the method does not include that specific component. But to take another example, a reference to a system configured to perform a specific action should also include a scenario in which the system is not configured to perform the specific action.
용어 "포함하는", "갖는", "구성된", "이루어진" 및 "본질적으로 이루어진"은 상호 교환적으로 사용된다. 예를 들어, 임의의 방법은 적어도 도면 및/또는 명세서에 포함된 동작을 포함할 수 있으며, 도면 및/또는 명세서에 포함된 동작만을 포함할 수 있다. 또는, "포함하는"이라는 단어는 청구항에 나열된 요소들 또는 동작들의 존재를 배제하지 않는다.The terms "comprising", "having", "consisting of", "consisting of" and "consisting essentially of" are used interchangeably. For example, any method may include at least the operations included in the drawings and/or specifications, and may include only the operations included in the drawings and/or specifications. Alternatively, the word "comprising" does not exclude the presence of the recited elements or acts in a claim.
본 발명은 본 발명의 필수적 특징을 벗어나지 않는 범위에서 다른 특정한 형태로 구체화될 수 있음은 통상의 기술자에게 자명하다. 따라서, 상술한 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니 되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.It is apparent to those skilled in the art that the present invention can be embodied in other specific forms without departing from the essential characteristics of the present invention. Accordingly, the foregoing detailed description should not be construed as limiting in all respects and should be considered illustrative. The scope of the present invention should be determined by reasonable interpretation of the appended claims, and all changes within the equivalent scope of the present invention are included in the scope of the present invention.

Claims (10)

  1. 지능형 데이터 관리 및 저장 방법에 있어서,In the intelligent data management and storage method,
    관리 대상 파일에 대한 파일 정보를 수집하는 단계;Collecting file information about a management target file;
    상기 수집된 파일 정보에 기초하여 카테고리 별로 상기 관리 대상 파일을 분석하여 분류하는 단계;analyzing and classifying the management target file for each category based on the collected file information;
    상기 분류된 파일을 제1 미리 설정된 기준에 따라 최적화하는 단계; 및optimizing the classified files according to a first preset criterion; and
    상기 최적화된 파일을 제2 미리 설정된 기준에 따라 데이터 저장소를 선택하여 저장하는 단계;를 포함하는Selecting and storing the optimized file in a data store according to a second preset criterion; comprising
    방법.method.
  2. 제1 항에 있어서,According to claim 1,
    상기 수집된 파일 정보에 기초하여 카테고리 별로 상기 관리 대상 파일을 분류하는 단계는,In the step of classifying the management target file for each category based on the collected file information,
    상기 수집된 파일의 사용 시간 정보에 기초하여 상기 관리 대상 파일을 사용 시간 대에 따라 분류하는 단계이고,Classifying the management target file according to the usage time zone based on the usage time information of the collected files;
    상기 분류된 파일을 제1 미리 설정된 기준에 따라 최적화하는 단계는,Optimizing the classified file according to a first preset criterion,
    상기 분류된 파일 중 특정 시간 대의 파일을 압축하는 단계인A step of compressing a file of a specific time period among the classified files
    것을 특징으로 하는 방법.characterized by a method.
  3. 제1 항에 있어서,According to claim 1,
    상기 수집된 파일 정보에 기초하여 카테고리 별로 상기 관리 대상 파일을 분류하는 단계는,In the step of classifying the management target file for each category based on the collected file information,
    상기 수집된 파일의 파일 유형 정보에 기초하여 상기 관리 대상 파일을 파일 유형별로 분류하는 단계이고,Classifying the management target file by file type based on the file type information of the collected files;
    상기 분류된 파일을 제1 미리 설정된 기준에 따라 최적화하는 단계는,Optimizing the classified file according to a first preset criterion,
    상기 분류된 파일을 파일 유형별로 다른 압축 방법으로 압축하는 단계인Compressing the classified files with different compression methods for each file type
    것을 특징으로 하는 방법.characterized by a method.
  4. 제1 항에 있어서,According to claim 1,
    상기 최적화된 파일을 제2 미리 설정된 기준에 따라 데이터 저장소를 선택하여 저장하는 단계는,Selecting and storing the optimized file in a data store according to a second preset criterion,
    복수의 데이터 저장소들 각각의 사용 비용을 분석하는 단계; 및Analyzing a usage cost of each of the plurality of data stores; and
    상기 복수의 데이터 저장소들 중 상기 사용 비용이 최소가 되는 데이터 저장소에 상기 최적화된 파일을 저장하는 단계를 포함하는Storing the optimized file in a data store having the lowest usage cost among the plurality of data stores.
    것을 특징으로 하는 방법.characterized by a method.
  5. 제4 항에 있어서, 상기 사용 비용은,The method of claim 4, wherein the use cost,
    데이터 저장소의 저장 매체의 종류, 데이터 저장소의 설치 위치, 데이터 저장소의 소유자, 및 데이터 저장소의 용도 중 적어도 하나에 의해 결정되는determined by at least one of the type of storage medium of the data store, the installation location of the data store, the owner of the data store, and the purpose of the data store
    것을 특징으로 하는 방법.characterized by a method.
  6. 제5 항에 있어서,According to claim 5,
    상기 사용 비용은 1 TB 저장 비용지수(T)에 의해 결정되고,The usage cost is determined by the 1 TB storage cost index (T),
    상기 1 TB의 저장 비용 지수(T)는 데이터 저장소 제공자의 1 TB 저장 공간 제공 서비스의 가격(S)을 1 TB 당 저장 비용 원가(C)로 나눈 결과 값으로 산출되고,The 1 TB storage cost index (T) is calculated as the result of dividing the price (S) of a data storage provider's 1 TB storage space provision service by the storage cost cost (C) per 1 TB,
    상기 1 TB 당 저장 비용(C)은 사용되는 총 TB의 원가를 총 TB 수로 나눈 결과 값으로 산출되는The storage cost (C) per 1 TB is calculated as the result of dividing the cost of the total used TB by the total number of TB
    것을 특징으로 하는 방법.characterized by a method.
  7. 제1 항에 있어서,According to claim 1,
    상기 카테고리는 파일 크기, 파일 특성, 및 파일 사용 빈도를 포함하는 분류로 구분되고,The category is divided into classifications including file size, file characteristics, and file usage frequency,
    상기 수집된 파일 정보에 기초하여 카테고리 별로 상기 관리 대상 파일을 분류하는 단계는,In the step of classifying the management target file for each category based on the collected file information,
    상기 수집된 파일 정보에 기초하여 상기 관리 대상 파일을 파일 크기 범위 별로 분류하거나, 파일 특성 별로 분류하거나, 파일 사용 빈도 범위 별로 분류하는Based on the collected file information, classifying the management target file by file size range, by file characteristic, or by file usage frequency range
    것을 특징으로 하는 방법.characterized by a method.
  8. 제1 항에 있어서,According to claim 1,
    상기 관리 대상 파일을 가상화하여 상기 관리 대상 파일에 대한 데이터 정보를 제공하는 단계;를 더 포함하는Virtualizing the management target file to provide data information on the management target file; further comprising
    방법.method.
  9. 컴퓨터 하드웨어와 결합되어,Combined with computer hardware,
    제1 항 내지 제8 항 중 어느 한 항에 따른 지능형 데이터 관리 및 저장 방법이 포함하는 각 단계를 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터프로그램.A computer program stored in a computer-readable recording medium to execute each step included in the intelligent data management and storage method according to any one of claims 1 to 8.
  10. 하나 이상의 인스트럭션을 저장하는 메모리; 및a memory that stores one or more instructions; and
    상기 인스트럭션을 실행시키기 위한 프로세서;를 포함하고,A processor for executing the instruction; includes,
    상기 인스트럭션이 실행될 때, 상기 프로세서는,When the instruction is executed, the processor:
    관리 대상 파일에 대한 파일 정보를 수집하고,Collect file information about files to be managed,
    상기 수집된 파일 정보에 기초하여 카테고리 별로 상기 관리 대상 파일을 분류하고,Classifying the management target file by category based on the collected file information;
    상기 분류된 파일을 제1 미리 설정된 기준에 따라 최적화하고, 및optimize the classified files according to a first preset criterion; and
    상기 최적화된 파일을 제2 미리 설정된 기준에 따라 데이터 저장소를 선택하여 저장하는 지능형 데이터 관리 및 저장 장치.An intelligent data management and storage device for selecting and storing the optimized file in a data storage according to a second preset criterion.
PCT/KR2023/001051 2022-01-26 2023-01-20 Intelligent data management and storage device, and intelligent data management and storage method using same WO2023146237A1 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2022-0011173 2022-01-26
KR20220011173 2022-01-26
KR1020220070617A KR102616356B1 (en) 2022-01-26 2022-06-10 Intelligent data management apparatus and intelligent data management method using the same
KR10-2022-0070617 2022-06-10

Publications (1)

Publication Number Publication Date
WO2023146237A1 true WO2023146237A1 (en) 2023-08-03

Family

ID=87471921

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/001051 WO2023146237A1 (en) 2022-01-26 2023-01-20 Intelligent data management and storage device, and intelligent data management and storage method using same

Country Status (1)

Country Link
WO (1) WO2023146237A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100137323A (en) * 2009-06-22 2010-12-30 삼성전자주식회사 Client, brokerage sever and method for providing cloud storage
KR101103611B1 (en) * 2010-07-29 2012-01-09 차남경 Remote control system for mediating and dividing data
KR20140061218A (en) * 2012-11-12 2014-05-21 삼성전자주식회사 Method and apparatus for managing storage space in an electronic device using context data and user profile data
KR20150100100A (en) * 2014-02-24 2015-09-02 엔쓰리엔 주식회사 DATA processing improvement device and method thereof
KR20210008953A (en) * 2015-03-25 2021-01-25 아마존 테크놀로지스, 인크. Dynamic configuration of data volumes

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100137323A (en) * 2009-06-22 2010-12-30 삼성전자주식회사 Client, brokerage sever and method for providing cloud storage
KR101103611B1 (en) * 2010-07-29 2012-01-09 차남경 Remote control system for mediating and dividing data
KR20140061218A (en) * 2012-11-12 2014-05-21 삼성전자주식회사 Method and apparatus for managing storage space in an electronic device using context data and user profile data
KR20150100100A (en) * 2014-02-24 2015-09-02 엔쓰리엔 주식회사 DATA processing improvement device and method thereof
KR20210008953A (en) * 2015-03-25 2021-01-25 아마존 테크놀로지스, 인크. Dynamic configuration of data volumes

Similar Documents

Publication Publication Date Title
US11783036B2 (en) Ransomware infection detection in filesystems
US20210026982A1 (en) Sensitive data extrapolation system
US20210133233A1 (en) Managing storage operations through an administrative assistant that processes natural language
US11100064B2 (en) Automated log-based remediation of an information management system
US11238173B2 (en) Automated intelligent provisioning of data storage resources in response to user requests in a data storage management system
US11294786B2 (en) Management of internet of things devices
US11443061B2 (en) Data protection within an unsecured storage environment
US10552294B2 (en) Management of internet of things devices
US20230289661A1 (en) Root cause discovery engine
US10360110B2 (en) Point-in-time backups of a production application made accessible over fibre channel and/or iSCSI as data sources to a remote application by representing the backups as pseudo-disks operating apart from the production application and its host
US10282546B1 (en) Systems and methods for detecting malware based on event dependencies
US11249858B2 (en) Point-in-time backups of a production application made accessible over fibre channel and/or ISCSI as data sources to a remote application by representing the backups as pseudo-disks operating apart from the production application and its host
US11709615B2 (en) Block-level data replication
US9608867B1 (en) Detecting deviation of data center connectivity by conditional sub-graph matching
US10762051B1 (en) Reducing hash collisions in large scale data deduplication
US20230236938A1 (en) Management database long-term archiving to a recovery manager
US20190266279A1 (en) User clustering based on metadata analysis
JPWO2007007410A1 (en) Message analysis apparatus, control method, and control program
JP6841921B2 (en) Systems and methods for propagating information across connected entity sets regardless of specific entity type
US11526599B2 (en) Clustered application policy generation
WO2022007574A1 (en) Block-based anomaly detection
WO2024058465A1 (en) Method for training local neural network model for federated learning
WO2023146237A1 (en) Intelligent data management and storage device, and intelligent data management and storage method using same
US10140187B1 (en) Techniques for system backup
KR102616356B1 (en) Intelligent data management apparatus and intelligent data management method using the same

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23747278

Country of ref document: EP

Kind code of ref document: A1