KR20240029127A - System and method for generating deep learning model based on hierachical transfer learning for environmental information recognition - Google Patents

System and method for generating deep learning model based on hierachical transfer learning for environmental information recognition Download PDF

Info

Publication number
KR20240029127A
KR20240029127A KR1020220107219A KR20220107219A KR20240029127A KR 20240029127 A KR20240029127 A KR 20240029127A KR 1020220107219 A KR1020220107219 A KR 1020220107219A KR 20220107219 A KR20220107219 A KR 20220107219A KR 20240029127 A KR20240029127 A KR 20240029127A
Authority
KR
South Korea
Prior art keywords
target domain
dataset
class
similar
learning model
Prior art date
Application number
KR1020220107219A
Other languages
Korean (ko)
Inventor
서경은
양창모
김동칠
Original Assignee
한국전자기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자기술연구원 filed Critical 한국전자기술연구원
Priority to KR1020220107219A priority Critical patent/KR20240029127A/en
Priority to PCT/KR2022/014926 priority patent/WO2024043390A1/en
Publication of KR20240029127A publication Critical patent/KR20240029127A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 방법이 제공된다. 상기 방법은 비타겟 도메인 데이터셋을 기반으로 딥러닝 모델을 1차 학습하는 단계; 타겟 도메인 및 상기 타겟 도메인과 유사 목적을 갖는 것으로 수집된 유사 타겟 도메인의 각 데이터셋에 대한 특징 정보를 분석하는 단계; 상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계; 상기 생성된 클래스 정답지를 갖는 유사 타겟 도메인의 데이터셋을 기반으로 상기 1차 학습된 딥러닝 모델에 대한 2차 학습을 수행하는 단계; 및 상기 타겟 도메인의 데이터셋을 기반으로 상기 2차 학습된 딥러닝 모델에 대한 3차 학습을 수행하는 단계를 포함한다.A method for creating a deep learning model based on hierarchical transfer learning for environmental information recognition is provided. The method includes first learning a deep learning model based on a non-target domain dataset; Analyzing characteristic information for each dataset of a target domain and a similar target domain collected as having a similar purpose as the target domain; generating a class answer key for each dataset of the similar target domain based on an analysis result of the feature information; performing secondary learning on the primary learned deep learning model based on a dataset of a similar target domain having the generated class answer key; And it includes performing third learning on the second learned deep learning model based on the dataset of the target domain.

Description

환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 시스템 및 방법{SYSTEM AND METHOD FOR GENERATING DEEP LEARNING MODEL BASED ON HIERACHICAL TRANSFER LEARNING FOR ENVIRONMENTAL INFORMATION RECOGNITION}System and method for generating a deep learning model based on hierarchical transfer learning for environmental information recognition {SYSTEM AND METHOD FOR GENERATING DEEP LEARNING MODEL BASED ON HIERACHICAL TRANSFER LEARNING FOR ENVIRONMENTAL INFORMATION RECOGNITION}

본 발명은 환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for generating a deep learning model based on hierarchical transfer learning for environmental information recognition.

최근 지능형 CCTV를 이용하여 자동으로 비디오의 정보를 분석하고 이를 보안에 활용하려는 수요가 급격히 증가하고 있다. 이때, 환경정보는 다양한 환경에서 강인한 지능형 영상 분석을 제공하기 위해 필수적으로 활용되는 정보이다. 일 예로, 저조도 센서를 사용하여 조도의 변화 값을 측정하고 이를 환경정보로 이용하여 조도 변화에 맞는 영상 분석 서비스를 제공할 수 있다.Recently, the demand to automatically analyze video information using intelligent CCTV and use it for security is rapidly increasing. At this time, environmental information is information that is essential to provide robust intelligent video analysis in various environments. For example, a low-light sensor can be used to measure the change in illumination and use this as environmental information to provide an image analysis service tailored to the change in illumination.

하지만, 조도뿐만 아니라 영상분석 성능을 저하시키는 다양한 환경정보의 요인들이 존재한다. 이러한 환경정보는 비, 흐림, 맑음 등의 날씨의 경우 동일한 장면을 촬영하더라도 시각적으로 다른 영상을 획득하게 되는 요인으로 작용한다. 따라서, 영상 분석 서비스를 제공하고자 하는 경우 환경정보에 대한 고려가 필요하나, 현재 영상 분석 서비스에 적용된 기술로는 환경정보를 정확하게 인식하는데 어려움이 있다.However, there are various environmental information factors that degrade image analysis performance in addition to illuminance. This environmental information acts as a factor in obtaining visually different images even when shooting the same scene in case of weather such as rain, cloudiness, or clear weather. Therefore, when trying to provide a video analysis service, it is necessary to consider environmental information, but it is difficult to accurately recognize environmental information with the technology currently applied to video analysis services.

종래 영상 분석 서비스의 경우, 보편적인 특징을 학습한 모델을 그대로 사용하거나, 타겟 도메인에만 특화되어 학습된 모델을 사용하였다. 이 경우 타겟 도메인의 특징이 조금만 달라지는 경우 안정적인 환경정보 인식 결과를 제공하는 것은 불가하였다.In the case of conventional video analysis services, a model that learned universal features was used as is, or a model learned specifically for the target domain was used. In this case, it was impossible to provide stable environmental information recognition results when the characteristics of the target domain changed slightly.

도 1a 내지 도 1d은 일반적인 데이터 증강을 위한 전이학습 과정을 도시한 도면이다.1A to 1D are diagrams showing a transfer learning process for general data augmentation.

도 1a 내지 도 1d에 도시된 바와 같이 비슷한 데이터셋을 생성하여 전이학습을 통해 딥러닝 모델을 학습하는 경우가 있다. 참고로, 도 1a 내지 도 1d는 원본 이미지를 회전 등의 변환을 통해 동일한 이미지로 인식하거나, 또는 다른 이미지의 경우 다른 이미지로 인식되도록 학습하는 것이다. 이러한 전이학습 과정은 이미지를 변형하고 변형한 이미지와 현재 이미지가 동일한지 여부를 비교하는 과정으로 딥러닝 모델의 학습이 이루어진다. 하지만, 현재 환경정보 인식을 위한 효과적인 전이학습 방법은 부재한 실정이다.As shown in FIGS. 1A to 1D, there are cases where similar datasets are created and a deep learning model is learned through transfer learning. For reference, FIGS. 1A to 1D show that the original image is recognized as the same image through transformation such as rotation, or in the case of a different image, it is learned to be recognized as a different image. This transfer learning process is a process of transforming the image and comparing whether the transformed image and the current image are the same, and the deep learning model is learned. However, there is currently no effective transfer learning method for environmental information recognition.

공개특허공보 제10-2020-0057291호 (2020.05.26)Public Patent Publication No. 10-2020-0057291 (2020.05.26)

본 발명의 실시예는 다양한 데이터의 보편적인 특징을 학습한 딥러닝 모델의 지식을 활용하여 계층적 전이학습을 통해 타겟 도메인에 최적화된 딥러닝 모델로 학습 및 생성하기 위한 것으로, 보편적인 특징에 대한 지식 기반 학습을 통해 빠르고 정확한 타겟 도메인에 대한 데이터 처리가 가능한, 환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 시스템 및 방법을 제공한다.An embodiment of the present invention is to learn and create a deep learning model optimized for the target domain through hierarchical transfer learning by utilizing the knowledge of a deep learning model that has learned universal features of various data. We provide a hierarchical transfer learning-based deep learning model generation system and method for environmental information recognition that enables fast and accurate data processing for target domains through knowledge-based learning.

다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.However, the technical challenge that this embodiment aims to achieve is not limited to the technical challenges described above, and other technical challenges may exist.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제1 측면에 따른 환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 방법은 도메인이 타겟되지 않은 데이터셋(이하, 비타겟 도메인 데이터셋)을 기반으로 딥러닝 모델을 1차 학습하는 단계; 타겟 도메인 및 상기 타겟 도메인과 유사 목적을 갖는 것으로 수집된 유사 타겟 도메인의 각 데이터셋에 대한 특징 정보를 분석하는 단계; 상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계; 상기 생성된 클래스 정답지를 갖는 유사 타겟 도메인의 데이터셋을 기반으로 상기 1차 학습된 딥러닝 모델에 대한 2차 학습을 수행하는 단계; 및 상기 타겟 도메인의 데이터셋을 기반으로 상기 2차 학습된 딥러닝 모델에 대한 3차 학습을 수행하는 단계를 포함한다.As a technical means for achieving the above-mentioned technical problem, the method for generating a deep learning model based on hierarchical transfer learning for environmental information recognition according to the first aspect of the present invention is a method of generating a deep learning model based on domain not targeted (hereinafter referred to as non-targeted domain). A step of first learning a deep learning model based on a data set; Analyzing characteristic information for each dataset of a target domain and a similar target domain collected as having a similar purpose as the target domain; generating a class answer key for each dataset of the similar target domain based on an analysis result of the feature information; performing secondary learning on the primary learned deep learning model based on a dataset of a similar target domain having the generated class answer key; And it includes performing third learning on the second learned deep learning model based on the dataset of the target domain.

본 발명의 일부 실시예에 있어서, 타겟 도메인 및 상기 타겟 도메인과 유사 목적을 갖는 것으로 수집된 유사 타겟 도메인의 각 데이터셋에 대한 특징 정보를 분석하는 단계는, 상기 타겟 도메인의 데이터셋 및 상기 유사 타겟 도메인의 데이터셋에 대한 클래스별 포함된 이미지의 특징 정보를 분석할 수 있다.In some embodiments of the present invention, the step of analyzing characteristic information on the target domain and each dataset of the similar target domain collected as having a similar purpose as the target domain includes the dataset of the target domain and the similar target You can analyze the feature information of images included by class in the domain dataset.

본 발명의 일부 실시예에 있어서, 상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계는, 상기 비타겟 도메인 데이터셋의 정답지를 상기 유사 타겟 도메인의 각 데이터셋에 적용하여 클래스 정답지를 생성하되, 상기 유사 타겟 도메인의 데이터셋이 상기 타겟 도메인의 데이터셋과 유사한 것으로 분석된 경우 클래스 의존적 정답지를 생성하고, 상기 유사 타겟 도메인의 데이터셋이 상기 타겟 도메인의 데이터셋과 비유사한 것으로 분석된 경우 클래스 독립적 정답지를 생성할 수 있다.In some embodiments of the present invention, the step of generating a class answer key for each dataset of the similar target domain based on an analysis result of the feature information includes the answer key of the non-target domain dataset being used as a class answer key for the similar target domain. Generate a class answer key by applying it to each data set. If the data set of the similar target domain is analyzed to be similar to the data set of the target domain, a class-dependent answer key is generated, and the data set of the similar target domain is generated as a class answer key to the target domain. If it is analyzed as dissimilar to the dataset, a class-independent answer key can be generated.

본 발명의 일부 실시예에 있어서, 상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계는, 상기 유사 타겟 도메인의 각 데이터셋 간에 동일 클래스명을 갖는 클래스의 경우 동일 클래스로 설정하여, 각 데이터셋의 상기 클래스 의존적 정답지의 클래스명이 동일하도록 생성할 수 있다.In some embodiments of the present invention, the step of generating a class answer key for each dataset of the similar target domain based on the analysis result of the feature information includes having the same class name among each dataset of the similar target domain. In the case of a class, it can be set to the same class so that the class name of the class-dependent answer key for each dataset is the same.

본 발명의 일부 실시예에 있어서, 상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계는, 상기 유사 타겟 도메인의 각 데이터셋 간에 동일 클래스명을 갖는 클래스에 대하여 이종 클래스로 설정하여, 각 데이터셋의 상기 클래스 독립적 정답지의 클래스명이 각각 상이하도록 생성할 수 있다.In some embodiments of the present invention, the step of generating a class answer key for each dataset of the similar target domain based on the analysis result of the feature information includes having the same class name among each dataset of the similar target domain. By setting the class to a heterogeneous class, the class independent answer key of each dataset can be generated so that the class name is different.

본 발명의 일부 실시예에 있어서, 상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계는, 상기 타겟 도메인과 상기 유사 타겟 도메인의 클래스별 데이터 간의 비유사 정도가 소정의 기준 조건에 따른 구분이 불가한 경우, 상기 유사 타겟 도메인의 데이터에 대하여 K-means 클러스터링 알고리즘을 적용하여 K개의 군집 데이터로 구성하고, 각 구성된 군집 데이터를 새로운 클래스로 설정하여 상기 클래스 군집화 정답지를 생성할 수 있다.In some embodiments of the present invention, the step of generating a class answer key for each dataset of the similar target domain based on the analysis result of the feature information includes the step of generating a class answer key for each dataset of the similar target domain and the ratio between the target domain and data for each class of the similar target domain. If the degree of similarity cannot be distinguished according to predetermined criteria, the K-means clustering algorithm is applied to the data of the similar target domain to form K cluster data, and each formed cluster data is set as a new class. You can create a class clustering answer sheet.

또한, 본 발명의 제2 측면에 따른 환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 시스템은 소정의 네트워크를 통해 데이터셋을 수집하는 통신모듈, 상기 데이터셋을 기반으로 딥러닝 모델을 학습하기 위한 프로그램이 저장된 메모리 및 상기 메모리에 저장된 프로그램을 실행시키는 프로세서를 포함한다. 이때, 상기 프로세서는 상기 프로그램을 실행시킴에 따라, 도메인이 타겟되지 않은 데이터셋(이하, 비타겟 도메인 데이터셋)을 기반으로 딥러닝 모델의 1차 학습을 수행하고, 상기 통신모듈을 통해 수집된 타겟 도메인 및 상기 타겟 도메인과 유사 목적을 갖는 것으로 수집된 유사 타겟 도메인의 각 데이터셋에 대한 특징 정보를 분석한 후, 상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하고, 상기 생성된 클래스 정답지를 갖는 유사 타겟 도메인의 데이터셋을 기반으로 상기 딥러닝 모델에 대한 2차 학습을 수행하며, 상기 타겟 도메인의 데이터셋을 기반으로 상기 딥러닝 모델에 대한 3차 학습을 수행한다.In addition, the deep learning model generation system based on hierarchical transfer learning for environmental information recognition according to the second aspect of the present invention includes a communication module that collects a dataset through a predetermined network, and a deep learning model based on the dataset. It includes a memory storing a program for learning and a processor executing the program stored in the memory. At this time, as the processor executes the program, the processor performs primary learning of a deep learning model based on a domain non-targeted dataset (hereinafter referred to as non-targeted domain dataset), and the data collected through the communication module After analyzing the target domain and the feature information for each dataset of the similar target domain collected as having a similar purpose as the target domain, a class for each dataset of the similar target domain is based on the analysis results of the feature information. Generate an answer sheet, perform secondary learning on the deep learning model based on a dataset of a similar target domain with the generated class answer key, and perform 3 steps for the deep learning model based on the dataset of the target domain. Perform primary learning.

본 발명의 일부 실시예에 있어서, 상기 프로세서는 상기 타겟 도메인의 데이터셋 및 상기 유사 타겟 도메인의 데이터셋에 대한 클래스별 포함된 이미지의 특징 정보를 분석하고, 상기 특징 정보의 분석 결과를 기반으로 상기 비타겟 도메인 데이터셋의 정답지를 상기 유사 타겟 도메인의 각 데이터셋에 적용하여 클래스 정답지를 생성할 수 있다.In some embodiments of the present invention, the processor analyzes feature information of images included in each class for the dataset of the target domain and the dataset of the similar target domain, and based on the analysis result of the feature information, the processor The answer key for the non-target domain dataset can be applied to each data set in the similar target domain to generate the class answer key.

본 발명의 일부 실시예에 있어서, 상기 프로세서는 상기 유사 타겟 도메인의 데이터셋이 상기 타겟 도메인의 데이터셋과 유사한 것으로 분석된 경우 클래스 의존적 정답지를 생성하되, 상기 유사 타겟 도메인의 각 데이터셋 간에 동일 클래스명을 갖는 클래스의 경우 동일 클래스로 설정하여, 각 데이터셋의 상기 클래스 의존적 정답지의 클래스명이 동일하도록 생성할 수 있다.In some embodiments of the present invention, the processor generates a class-dependent answer key when the dataset of the similar target domain is analyzed to be similar to the dataset of the target domain, but the same class between each dataset of the similar target domain In the case of classes with names, they can be set to the same class so that the class names of the class-dependent answer key for each dataset are the same.

본 발명의 일부 실시예에 있어서, 상기 프로세서는 상기 유사 타겟 도메인의 데이터셋이 상기 타겟 도메인의 데이터셋과 비유사한 것으로 분석된 경우 클래스 독립적 정답지를 생성하되, 상기 유사 타겟 도메인의 각 데이터셋 간에 동일 클래스명을 갖는 클래스에 대하여 이종 클래스로 설정하여, 각 데이터셋의 상기 클래스 독립적 정답지의 클래스명이 각각 상이하도록 생성할 수 있다.In some embodiments of the present invention, the processor generates a class-independent answer key when the dataset of the similar target domain is analyzed to be dissimilar to the dataset of the target domain, but the same is true between each dataset of the similar target domain. Classes with class names can be set as heterogeneous classes, so that the class names of the class-independent answer sheets of each dataset are different.

본 발명의 일부 실시예에 있어서, 상기 프로세서는 상기 타겟 도메인과 상기 유사 타겟 도메인의 클래스별 데이터 간의 비유사 정도가 소정의 기준 조건에 따른 구분이 불가한 경우, 상기 유사 타겟 도메인의 데이터에 대하여 K-means 클러스터링 알고리즘을 적용하여 K개의 군집 데이터로 구성하고, 각 구성된 군집 데이터를 새로운 클래스로 설정하여 상기 클래스 군집화 정답지를 생성할 수 있다.In some embodiments of the present invention, when the degree of dissimilarity between the target domain and data for each class of the similar target domain cannot be distinguished according to a predetermined standard condition, the processor may select K for the data of the similar target domain. By applying the -means clustering algorithm, K cluster data can be composed, and each composed cluster data can be set as a new class to generate the class clustering answer key.

이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공될 수 있다.In addition to this, another method for implementing the present invention, another system, and a computer-readable recording medium recording a computer program for executing the method may be further provided.

전술한 본 발명의 일 실시예에 의하면, 타겟 도메인의 변화에도 안정적인 환경정보 인식 결과 제공이 가능하며, 도메인이 타겟되지 않은 보편적 특징을 기반의 데이터셋을 통한 딥러닝 모델의 학습이 수행되는바, 보다 빠르고 정확한 딥러닝 모델 및 환경정보 인식 결과 제공이 가능하다는 장점이 있다.According to an embodiment of the present invention described above, it is possible to provide stable environmental information recognition results even when the target domain changes, and learning of a deep learning model is performed through a dataset based on universal features that are not targeted at the domain, It has the advantage of being able to provide faster and more accurate deep learning models and environmental information recognition results.

본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the description below.

도 1a 내지 도 1d는 일반적인 데이터 증강을 위한 전이학습 과정을 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 딥러닝 모델 생성 방법의 순서도이다.
도 3은 본 발명의 일 실시예에 따른 딥러닝 모델 생성 방법의 개념을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에서의 클래스 정답지를 생성하는 과정을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에서의 클래스 의존적 정답지를 생성하는 과정을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에서의 클래스 독립적 정답지를 생성하는 과정을 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시예에서의 클래스 군집화 정답지를 생성하는 과정을 설명하기 위한 도면이다.
도 8 내지 도 10은 본 발명의 일 실시예에서 생성된 클래스 정답지가 적용된 유사 타겟 도메인을 기반으로 딥러닝 모델을 학습하는 과정을 도시한 도면이다.
도 11은 본 발명의 일 실시예에 따른 딥러닝 모델 생성 시스템의 블록도이다.
1A to 1D are diagrams showing a transfer learning process for general data augmentation.
Figure 2 is a flowchart of a deep learning model generation method according to an embodiment of the present invention.
Figure 3 is a diagram for explaining the concept of a deep learning model generation method according to an embodiment of the present invention.
Figure 4 is a diagram for explaining the process of generating a class answer key in one embodiment of the present invention.
Figure 5 is a diagram for explaining the process of generating a class-dependent answer key in one embodiment of the present invention.
Figure 6 is a diagram for explaining the process of generating a class-independent answer key in one embodiment of the present invention.
Figure 7 is a diagram for explaining the process of generating a class clustering answer key in one embodiment of the present invention.
Figures 8 to 10 are diagrams showing the process of learning a deep learning model based on a similar target domain to which the class answer key generated in one embodiment of the present invention is applied.
Figure 11 is a block diagram of a deep learning model generation system according to an embodiment of the present invention.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.The advantages and features of the present invention and methods for achieving them will become clear by referring to the embodiments described in detail below along with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below and may be implemented in various different forms. The present embodiments are merely provided to ensure that the disclosure of the present invention is complete and to provide a general understanding of the technical field to which the present invention pertains. It is provided to fully inform the skilled person of the scope of the present invention, and the present invention is only defined by the scope of the claims.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.The terminology used herein is for describing embodiments and is not intended to limit the invention. As used herein, singular forms also include plural forms, unless specifically stated otherwise in the context. As used in the specification, “comprises” and/or “comprising” does not exclude the presence or addition of one or more other elements in addition to the mentioned elements. Like reference numerals refer to like elements throughout the specification, and “and/or” includes each and every combination of one or more of the referenced elements. Although “first”, “second”, etc. are used to describe various components, these components are of course not limited by these terms. These terms are merely used to distinguish one component from another. Therefore, it goes without saying that the first component mentioned below may also be a second component within the technical spirit of the present invention.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.Unless otherwise defined, all terms (including technical and scientific terms) used in this specification may be used with meanings commonly understood by those skilled in the art to which the present invention pertains. Additionally, terms defined in commonly used dictionaries are not interpreted ideally or excessively unless clearly specifically defined.

이하에서는 도 2 내지 도 10을 참조하여 본 발명의 일 실시예에 따른 환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 방법(이하, 딥러닝 모델 생성 방법)에 대해 설명하도록 한다.Hereinafter, a deep learning model generation method based on hierarchical transfer learning for environmental information recognition according to an embodiment of the present invention (hereinafter referred to as a deep learning model generation method) will be described with reference to FIGS. 2 to 10.

도 2는 본 발명의 일 실시예에 따른 딥러닝 모델 생성 방법의 순서도이다. 도 3은 본 발명의 일 실시예에 따른 딥러닝 모델 생성 방법의 개념을 설명하기 위한 도면이다.Figure 2 is a flowchart of a deep learning model generation method according to an embodiment of the present invention. Figure 3 is a diagram for explaining the concept of a deep learning model generation method according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 딥러닝 모델 생성 방법은 비타겟 도메인 데이터셋을 기반으로 딥러닝 모델을 1차 학습하는 단계(S110)와, 타겟 도메인 및 상기 타겟 도메인과 유사 목적을 갖는 것으로 수집된 유사 타겟 도메인의 각 데이터셋에 대한 특징 정보를 분석하는 단계(S120)와, 상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계(S130)와, 상기 생성된 클래스 정답지를 갖는 유사 타겟 도메인의 데이터셋을 기반으로 상기 1차 학습된 딥러닝 모델에 대한 2차 학습을 수행하는 단계(S140) 및 상기 타겟 도메인의 데이터셋을 기반으로 상기 2차 학습된 딥러닝 모델에 대한 3차 학습을 수행하는 단계(S150)를 포함하여 실시된다.A deep learning model generation method according to an embodiment of the present invention includes the step of first learning a deep learning model based on a non-target domain dataset (S110), a target domain, and data collected as having a similar purpose to the target domain. Analyzing feature information for each dataset of a similar target domain (S120); Generating a class answer key for each dataset of the similar target domain based on the analysis result of the feature information (S130); Performing secondary learning on the primary learned deep learning model based on a dataset of a similar target domain having the generated class answer key (S140) and performing secondary learning based on the dataset of the target domain It is carried out including a step (S150) of performing third learning on the deep learning model.

한편, 도 2에 도시된 각 단계들은 후술하는 딥러닝 모델 생성 시스템(100)에 의해 수행되는 것으로 이해될 수 있으나, 반드시 이에 한정되는 것은 아니다.Meanwhile, each step shown in FIG. 2 may be understood as being performed by the deep learning model creation system 100, which will be described later, but is not necessarily limited thereto.

먼저, 도메인이 타겟되지 않은 기존 데이터셋인 비타겟 도메인 데이터셋을 기반으로 딥러닝 모델에 대한 1차 학습을 수행한다(S110). 이때, 비타겟 도메인 데이터셋은 사람/동물, 날씨 등의 다양한 도메인에 대한 오픈된 일반 데이터셋으로, S110 단계에서는 딥러닝 모델을 대상으로 전이학습 정답지 생성 방법을 적용하여, 오픈된 일반 데이터셋인 비타겟 도메인 데이터셋을 통해 보편적 지식을 학습한다.First, the first learning of the deep learning model is performed based on the non-target domain dataset, which is an existing dataset where the domain is not targeted (S110). At this time, the non-target domain dataset is an open general dataset for various domains such as people/animals and weather. In step S110, the transfer learning answer key generation method is applied to the deep learning model to create an open general dataset. Learn universal knowledge through non-target domain datasets.

다음으로, 타겟 도메인과 유사 목적을 갖는 것으로 수집된 유사 타겟 도메인과 타겟 도메인의 각 데이터 셋에 대한 특징 정보를 분석한다(S120). 이때, 유사 타겟 도메인은 타겟 도메인과 비슷한 목적을 위해 수집된 데이터셋으로 구성된 도메인으로, 유사 타겟 도메인을 구성하는 데이터셋은 오픈된 데이터셋으로 구성될 수 있다. Next, characteristic information on each data set of the target domain and the similar target domain collected as having a similar purpose as the target domain is analyzed (S120). At this time, the similar target domain is a domain composed of datasets collected for a similar purpose as the target domain, and the dataset constituting the similar target domain may be composed of an open dataset.

즉, 기존에는 타겟 도메인에 최적화된 딥러닝 모델을 생성하기 위해서, 타겟 도메인 데이터셋에 대해서만 데이터를 수집하고 이를 바로 딥러닝 모델의 학습에 적용하였는데, 이 경우 학습된 딥러닝 모델에 입력되는 타겟 도메인의 이미지가 조금이라도 달라질 경우 동일한 인식 결과를 출력하지 못하는 문제가 있었다. In other words, in order to create a deep learning model optimized for the target domain, data was collected only for the target domain dataset and applied directly to the training of the deep learning model. In this case, the target domain input to the learned deep learning model was collected. There was a problem in that the same recognition results could not be output if the image was slightly different.

본 발명의 일 실시예는 이러한 문제를 해소하기 위해, 타겟 도메인과 동일 목적을 갖는 것으로 결정된 유사 타겟 도메인의 데이터셋을 수집하고 이에 대한 클래스 정답지를 재정의한 후, 클래스 정답지가 재정의된 유사 타겟 도메인의 데이터셋을 기반으로 딥러닝 모델을 학습하고, 이후 타겟 도메인의 데이터셋을 기반으로 딥러닝 모델을 학습함으로써 위와 같은 문제를 해소할 수 있다.In order to solve this problem, one embodiment of the present invention collects a data set of a similar target domain determined to have the same purpose as the target domain, redefines the class answer key for the same, and then uses the redefined class answer key of the similar target domain. The above problem can be solved by learning a deep learning model based on the dataset and then learning the deep learning model based on the dataset of the target domain.

일 실시예로, S120 단계에서는 타겟 도메인의 데이터셋 및 유사 타겟 도메인의 데이터셋에 대한 클래스별로 포함된 이미지의 특징 정보를 분석할 수 있다. In one embodiment, in step S120, feature information of images included by class for the target domain dataset and the similar target domain dataset may be analyzed.

다음으로, 특징 정보의 분석 결과를 기반으로 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성한다(S130).Next, a class answer key is generated for each dataset of a similar target domain based on the analysis results of the feature information (S130).

도 4는 본 발명의 일 실시예에서의 클래스 정답지를 생성하는 과정을 설명하기 위한 도면이다.Figure 4 is a diagram for explaining the process of generating a class answer key in one embodiment of the present invention.

일 실시예로, 유사 타겟 도메인의 데이터셋이 타겟 도메인의 데이터셋 간의 특징 정보에 대한 유사도를 산출하고(S131), 비교 결과 유사도가 기 설정된 임계값을 초과하여 유사한 것으로 분석된 경우 클래스 의존적 정답지를 생성하고(S132), 반대로 유사 타겟 도메인의 데이터셋이 타겟 도메인의 데이터셋과 비유사한 것으로 분석된 경우 클래스 독립적 정답지 또는 클래스 군집화 정답지를 생성할 수 있다(S133~S135). In one embodiment, the similarity of the feature information between the datasets of the similar target domain is calculated (S131), and when the similarity is analyzed to exceed a preset threshold as a result of the comparison, the class-dependent answer key is provided. Generate (S132), and conversely, if the data set of the similar target domain is analyzed as dissimilar to the data set of the target domain, a class-independent answer key or a class clustering answer key can be generated (S133 to S135).

이때, 유사 정도는 딥러닝 모델이 적용된 디바이스의 설치 환경에 따라 사용자의 의도가 다를 수 있는바, 사용자의 의도 정보에 따라 유사도의 임계값이 결정될 수 있다. 또는, 사용자가 직접 시각적으로 타겟 도메인과 유사 타겟 도메인의 유사 여부를 확인하여 결정할 수도 있다.At this time, the degree of similarity may vary depending on the user's intention depending on the installation environment of the device to which the deep learning model is applied, and the threshold value of similarity may be determined according to the user's intention information. Alternatively, the user may decide to visually check whether the target domain is similar to the similar target domain.

예를 들어, 타겟 도메인과 유사 타겟 도메인의 데이터셋이 흐림 클래스에 대한 이미지를 제공하더라도, 흐림 클래스에 포함된 이미지가 매우 다르다면 두 데이터셋의 특징이 모두 같다고 할 수 없다. 이 경우 동일한 클래스로 정의하여 학습 데이터로 사용할 경우 딥러닝 모델의 성능 저하 요인으로 작용할 수 있으므로 클래스 독립적으로 판단하여 클래스 독립적 정답지를 생성 및 적용할 수 있다. 반대로, 포함된 흐림 이미지가 매우 유사하다면 데이터셋의 특징이 유사하다고 볼 수 있으므로 동일한 클래스로 판단하여 클래스 의존적 정답지를 생성 및 적용할 수 있다.For example, even if the datasets of the target domain and the similar target domain provide images for the blur class, if the images included in the blur class are very different, the features of the two datasets cannot be said to be the same. In this case, if the same class is defined and used as learning data, it may act as a factor in deteriorating the performance of the deep learning model, so class-independent judgment can be made to generate and apply a class-independent answer key. Conversely, if the included blur images are very similar, the characteristics of the dataset can be considered similar, so it can be judged to be the same class and generate and apply a class-dependent answer key.

도 5는 본 발명의 일 실시예에서의 클래스 의존적 정답지를 생성하는 과정을 설명하기 위한 도면이다.Figure 5 is a diagram for explaining the process of generating a class-dependent answer key in one embodiment of the present invention.

일 실시예로, 본 발명에서는 비타겟 도메인 데이터셋의 정답지를 유사 타겟 도메인의 데이터셋에 적용하여 새로운 클래스 정답지를 생성할 수 있다(S132). As an example, in the present invention, a new class answer key can be generated by applying the answer key from a non-target domain dataset to a data set of a similar target domain (S132).

이때, 유사 타겟 도메인의 각 데이터셋 간에 동일 클래스명을 갖는 클래스의 경우 동일 클래스로 설정하여, 각 데이터셋의 클래스 의존적 정답지의 클래스명이 동일하도록 생성할 수 있다. 즉, 클래스 의존적 정답지를 생성하기 위해서는 동일한 이름의 클래스는 동일 클래스로 간주하여 데이터셋마다 동일한 클래스 이름을 통합적으로 사용하여 정답지를 생성할 수 있다.At this time, in the case of classes having the same class name between each dataset of a similar target domain, they can be set to the same class, so that the class-dependent answer key of each dataset has the same class name. In other words, in order to generate a class-dependent answer sheet, classes with the same name are considered the same class, and the same class name can be used comprehensively for each dataset to generate the answer sheet.

일 예로, 데이터셋 1의 클래스 1과 데이터셋 2의 클래스 1은 동일한 이름의 클래스이므로, 전이학습에 사용되는 클래스는 동일하게 클래스 1로 정의할 수 있다.For example, since class 1 of dataset 1 and class 1 of dataset 2 are classes with the same name, the class used in transfer learning can be defined as class 1.

도 6은 본 발명의 일 실시예에서의 클래스 독립적 정답지를 생성하는 과정을 설명하기 위한 도면이다.Figure 6 is a diagram for explaining the process of generating a class-independent answer key in one embodiment of the present invention.

일 실시예로, 유사 타겟 도메인의 데이터셋이 타겟 도메인의 데이터셋과 비유사한 것으로 분석된 경우(S131-N), 유사 타겟 도메인의 각 데이터셋 간에 동일 클래스명을 갖는 클래스에 대하여 이종 클래스로 설정하여, 각 데이터셋의 클래스 독립적 정답지의 클래스명이 각각 상이하도록 생성할 수 있다(S133). 즉, 데이터셋의 특징 분석 결과를 확인하여 타겟 도메인과 유사 타겟 도메인의 모든 데이터셋의 클래스별 이미지가 현저히 차이가 나는 경우(S134), 동일한 이름의 클래스라 하더라도 다른 클래스와 연관이 없는 독립적인 클래스로 간주하여 유사 타겟 도메인의 데이터셋마다 새로운 클래스명을 할당하여 클래스 독립적 정답지를 생성할 수 있다.In one embodiment, when the dataset of the similar target domain is analyzed as being dissimilar to the dataset of the target domain (S131-N), classes with the same class name among each dataset of the similar target domain are set as heterogeneous classes. Thus, the class names of the class-independent answer sheets of each dataset can be generated so that they are different (S133). In other words, if the images for each class of all datasets in the target domain and similar target domain are significantly different by checking the characteristic analysis results of the dataset (S134), even if the class has the same name, it is an independent class that is not related to other classes. Considering that, a new class name can be assigned to each dataset of a similar target domain to create a class-independent answer key.

일 예로, 데이터셋 1의 클래스 1과 데이터셋 2의 클래스 1은 동일한 이름의 클래스이지만, 전이학습에 사용되는 클래스는 클래스 1과 클래스 3으로 클래스명이 각각 다르도록 생성할 수 있다.For example, class 1 of dataset 1 and class 1 of dataset 2 are classes with the same name, but the classes used in transfer learning can be created with different class names, such as class 1 and class 3.

도 7은 본 발명의 일 실시예에서의 클래스 군집화 정답지를 생성하는 과정을 설명하기 위한 도면이다.Figure 7 is a diagram for explaining the process of generating a class clustering answer key in one embodiment of the present invention.

일 실시예로, 유사 타겟 도메인의 데이터셋이 타겟 도메인의 데이터셋과 비유사한 것으로 분석된 경우로(S131-N), 타겟 도메인과 유사 타겟 도메인의 클래스별 데이터 간의 비유사 정도가 소정의 기준 조건에 따른 구분이 불가한 경우(S134-N) 클래스 군집화 정답지를 생성할 수 있다(S135). 즉, 기존에 사용하던 클래스 대신 유사 타겟 도메인의 데이터에 대하여 K-means 클러스터링 알고리즘을 적용하여 임의의 K개의 군집 데이터로 구성하고, 각 구성된 군집 데이터를 새로운 클래스로 설정하여 클래스 군집화 정답지를 생성할 수 있다.In one embodiment, in the case where a dataset of a similar target domain is analyzed as being dissimilar to a dataset of the target domain (S131-N), the degree of dissimilarity between the target domain and data for each class of the similar target domain is determined by a predetermined standard condition. If distinction according to is not possible (S134-N), the class clustering answer sheet can be created (S135). In other words, instead of the previously used class, the K-means clustering algorithm can be applied to data from a similar target domain to configure K random cluster data, and each configured cluster data can be set as a new class to generate a class clustering answer key. there is.

도 8 내지 도 10은 본 발명의 일 실시예에서 생성된 클래스 정답지가 적용된 유사 타겟 도메인을 기반으로 딥러닝 모델을 학습하는 과정을 도시한 도면이다.Figures 8 to 10 are diagrams showing the process of learning a deep learning model based on a similar target domain to which the class answer key generated in one embodiment of the present invention is applied.

다음으로 생성된 클래스 정답지를 갖는 유사 타겟 도메인의 데이터셋을 기반으로 1차 학습된 딥러닝 모델에 대하여 2차 학습을 수행한다(S140). Next, secondary learning is performed on the primary learned deep learning model based on a dataset of a similar target domain with the generated class answer key (S140).

다음으로, 타겟 도메인 데이터셋을 기반으로 2차 학습된 딥러닝 모델에 대한 3차 학습을 수행한다(S150).Next, third learning is performed on the second learning deep learning model based on the target domain dataset (S150).

이와 같이, 본 발명의 일 실시예는 보편적 특징을 갖는 데이터셋을 기반으로 전체적인 분류기의 학습을 수행하고, 그 다음 타겟 도메인과 유사한 유사 타겟 도메인을 기반으로 딥러닝 모델을 학습하되, 새롭게 생성된 클래스 정답지를 갖는 유사 타겟 도메인의 데이터셋을 기반으로 딥러닝 모델을 재학습함으로써, 타겟 이미지가 조금이라도 달라지는 경우에도 딥러닝 모델의 안정적인 출력 결과를 획득할 수 있는 장점이 있다.In this way, an embodiment of the present invention performs learning of an overall classifier based on a dataset with universal features, and then learns a deep learning model based on a similar target domain similar to the target domain, but trains the newly created class. By relearning the deep learning model based on a dataset of a similar target domain with the correct answer key, there is an advantage in obtaining stable output results of the deep learning model even if the target image changes even slightly.

한편, 상술한 설명에서, 단계 S110 내지 단계 S150은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다. 아울러, 기타 생략된 내용이라 하더라도 도 2 내지 도 10에 기술된 내용은 도 11의 딥러닝 모델 생성 시스템(100)에도 적용된다.Meanwhile, in the above description, steps S110 to S150 may be further divided into additional steps or combined into fewer steps, depending on the implementation of the present invention. Additionally, some steps may be omitted or the order between steps may be changed as needed. In addition, even if other omitted content, the content described in FIGS. 2 to 10 also applies to the deep learning model generation system 100 of FIG. 11.

이하에서는 도 11을 참조하여 본 발명의 일 실시예에 따른 딥러닝 모델 생성 시스템(100)에 대해 설명하도록 한다.Hereinafter, the deep learning model generation system 100 according to an embodiment of the present invention will be described with reference to FIG. 11.

도 11은 본 발명의 일 실시예에 따른 딥러닝 모델 생성 시스템(100)의 블록도이다.Figure 11 is a block diagram of a deep learning model generation system 100 according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 딥러닝 모델 생성 시스템(100)은 통신모듈(110), 메모리(120) 및 프로세서(130)를 포함한다.The deep learning model creation system 100 according to an embodiment of the present invention includes a communication module 110, a memory 120, and a processor 130.

통신모듈(110)은 소정의 네트워크를 통해 데이터셋을 수집한다.The communication module 110 collects data sets through a predetermined network.

메모리(120)에는 데이터셋을 기반으로 딥러닝 모델을 학습하기 위한 프로그램이 저장되며, 프로세서(130)는 메모리(120)에 저장된 프로그램을 실행시킨다. 여기에서, 메모리(120)는 전원이 공급되지 않아도 저장된 정보를 계속 유지하는 비휘발성 저장장치 및 휘발성 저장장치를 통칭하는 것이다. The memory 120 stores a program for learning a deep learning model based on the dataset, and the processor 130 executes the program stored in the memory 120. Here, the memory 120 is a general term for non-volatile storage devices and volatile storage devices that continue to retain stored information even when power is not supplied.

예를 들어, 메모리(120)는 콤팩트 플래시(compact flash; CF) 카드, SD(secure digital) 카드, 메모리 스틱(memory stick), 솔리드 스테이트 드라이브(solid-state drive; SSD) 및 마이크로(micro) SD 카드 등과 같은 낸드 플래시 메모리(NAND flash memory), 하드 디스크 드라이브(hard disk drive; HDD) 등과 같은 마그네틱 컴퓨터 기억 장치 및 CD-ROM, DVD-ROM 등과 같은 광학 디스크 드라이브(optical disc drive) 등을 포함할 수 있다.For example, memory 120 may include compact flash (CF) cards, secure digital (SD) cards, memory sticks, solid-state drives (SSD), and micro SD. This includes NAND flash memory such as cards, magnetic computer storage devices such as hard disk drives (HDD), and optical disc drives such as CD-ROM, DVD-ROM, etc. You can.

프로세서(130)는 메모리(120)에 저장된 프로그램을 실행시킴에 따라 비타겟 도메인 데이터셋을 기반으로 딥러닝 모델을 학습하고, 통신모듈(110)을 통해 수집된 타겟 도메인 및 유사 타겟 도메인의 각 데이터셋에 대한 특징 정보를 분석하며, 특징 정보 간의 유사도에 기초하여 각 데이터셋에 대한 클래스 정답지를 생성한다.As the processor 130 executes the program stored in the memory 120, it learns a deep learning model based on the non-target domain dataset, and each data of the target domain and similar target domain collected through the communication module 110 Feature information for the set is analyzed, and a class answer sheet for each dataset is generated based on the similarity between feature information.

그리고 프로세서(130)는 새롭게 생성된 클래스 정답지를 갖는 유사 타겟 도메인의 데이터셋을 기반으로 딥러닝 모델에 대한 재학습을 수행하며, 이후 타겟 도메인의 데이터셋을 기반으로 딥러닝 모델을 추가 학습하여, 타겟 도메인에 최적화됨과 동시에 타겟 도메인의 변화에 유연하면서 안정적을 동작 가능한 딥러닝 모델을 생성할 수 있다.Then, the processor 130 performs retraining of the deep learning model based on a dataset of a similar target domain with a newly created class answer key, and then additionally learns a deep learning model based on the dataset of the target domain, It is possible to create a deep learning model that is optimized for the target domain and can operate stably and flexibly in response to changes in the target domain.

상기 전술한 프로그램은, 상기 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 상기 방법들을 실행시키기 위하여, 상기 컴퓨터의 프로세서(CPU)가 상기 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 상기 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 컴퓨터의 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.The above-mentioned program is C, C++, JAVA, machine language, etc. that can be read by the processor (CPU) of the computer through the device interface of the computer in order for the computer to read the program and execute the methods implemented in the program. It may include code coded in a computer language. These codes may include functional codes related to functions that define the necessary functions for executing the methods, and include control codes related to execution procedures necessary for the computer's processor to execute the functions according to predetermined procedures. can do. In addition, these codes may further include memory reference-related codes that indicate at which location (address address) in the computer's internal or external memory additional information or media required for the computer's processor to execute the above functions should be referenced. there is. In addition, if the computer's processor needs to communicate with any other remote computer or server in order to execute the above functions, the code uses the computer's communication module to determine how to communicate with any other remote computer or server. It may further include communication-related codes regarding whether communication should be performed and what information or media should be transmitted and received during communication.

상기 저장되는 매체는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상기 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 상기 프로그램은 상기 컴퓨터가 접속할 수 있는 다양한 서버 상의 다양한 기록매체 또는 사용자의 상기 컴퓨터상의 다양한 기록매체에 저장될 수 있다. 또한, 상기 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장될 수 있다.The storage medium refers to a medium that stores data semi-permanently and can be read by a device, rather than a medium that stores data for a short period of time, such as a register, cache, or memory. Specifically, examples of the storage medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, etc., but are not limited thereto. That is, the program may be stored in various recording media on various servers that the computer can access or on various recording media on the user's computer. Additionally, the medium may be distributed to computer systems connected to a network, and computer-readable code may be stored in a distributed manner.

본 발명의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.The steps of the method or algorithm described in connection with embodiments of the present invention may be implemented directly in hardware, implemented as a software module executed by hardware, or a combination thereof. The software module may be RAM (Random Access Memory), ROM (Read Only Memory), EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable Programmable ROM), Flash Memory, hard disk, removable disk, CD-ROM, or It may reside on any type of computer-readable recording medium well known in the art to which the present invention pertains.

이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.Above, embodiments of the present invention have been described with reference to the attached drawings, but those skilled in the art will understand that the present invention can be implemented in other specific forms without changing its technical idea or essential features. You will be able to understand it. Therefore, the embodiments described above should be understood in all respects as illustrative and not restrictive.

100: 딥러닝 모델 생성 시스템
110: 통신모듈
120: 메모리
130: 프로세서
100: Deep learning model creation system
110: Communication module
120: memory
130: processor

Claims (11)

컴퓨터에 의해 수행되는 방법에 있어서,
도메인이 타겟되지 않은 데이터셋(이하, 비타겟 도메인 데이터셋)을 기반으로 딥러닝 모델을 1차 학습하는 단계;
타겟 도메인 및 상기 타겟 도메인과 유사 목적을 갖는 것으로 수집된 유사 타겟 도메인의 각 데이터셋에 대한 특징 정보를 분석하는 단계;
상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계;
상기 생성된 클래스 정답지를 갖는 유사 타겟 도메인의 데이터셋을 기반으로 상기 1차 학습된 딥러닝 모델에 대한 2차 학습을 수행하는 단계; 및
상기 타겟 도메인의 데이터셋을 기반으로 상기 2차 학습된 딥러닝 모델에 대한 3차 학습을 수행하는 단계를 포함하는,
환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 방법.
In a method performed by a computer,
A step of first learning a deep learning model based on a non-targeted domain dataset (hereinafter, non-targeted domain dataset);
Analyzing characteristic information for each dataset of a target domain and a similar target domain collected as having a similar purpose as the target domain;
generating a class answer key for each dataset of the similar target domain based on an analysis result of the feature information;
performing secondary learning on the primary learned deep learning model based on a dataset of a similar target domain having the generated class answer key; and
Comprising the step of performing third learning on the second learned deep learning model based on the dataset of the target domain,
A method for creating a deep learning model based on hierarchical transfer learning for environmental information recognition.
제1항에 있어서,
타겟 도메인 및 상기 타겟 도메인과 유사 목적을 갖는 것으로 수집된 유사 타겟 도메인의 각 데이터셋에 대한 특징 정보를 분석하는 단계는,
상기 타겟 도메인의 데이터셋 및 상기 유사 타겟 도메인의 데이터셋에 대한 클래스별 포함된 이미지의 특징 정보를 분석하는 것인,
환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 방법.
According to paragraph 1,
The step of analyzing characteristic information for each dataset of the target domain and similar target domains collected as having a similar purpose as the target domain,
Analyzing feature information of images included by class for the dataset of the target domain and the dataset of the similar target domain,
A method for creating a deep learning model based on hierarchical transfer learning for environmental information recognition.
제1항에 있어서,
상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계는,
상기 비타겟 도메인 데이터셋의 정답지를 상기 유사 타겟 도메인의 각 데이터셋에 적용하여 클래스 정답지를 생성하되, 상기 유사 타겟 도메인의 데이터셋이 상기 타겟 도메인의 데이터셋과 유사한 것으로 분석된 경우 클래스 의존적 정답지를 생성하고, 상기 유사 타겟 도메인의 데이터셋이 상기 타겟 도메인의 데이터셋과 비유사한 것으로 분석된 경우 클래스 독립적 정답지를 생성하는 것인,
환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 방법.
According to paragraph 1,
The step of generating a class answer key for each dataset of the similar target domain based on the analysis results of the feature information,
The answer key of the non-target domain data set is applied to each data set of the similar target domain to generate a class answer key. However, if the data set of the similar target domain is analyzed to be similar to the data set of the target domain, a class-dependent answer key is generated. Generating, and generating a class-independent answer key when the dataset of the similar target domain is analyzed to be dissimilar to the dataset of the target domain,
A method for creating a deep learning model based on hierarchical transfer learning for environmental information recognition.
제3항에 있어서,
상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계는,
상기 유사 타겟 도메인의 각 데이터셋 간에 동일 클래스명을 갖는 클래스의 경우 동일 클래스로 설정하여, 각 데이터셋의 상기 클래스 의존적 정답지의 클래스명이 동일하도록 생성하는 것인,
환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 방법.
According to paragraph 3,
The step of generating a class answer key for each dataset of the similar target domain based on the analysis results of the feature information,
In the case of classes having the same class name between each dataset of the similar target domain, the classes are set to the same class, and the class names of the class-dependent answer key of each dataset are generated to be the same,
A method for creating a deep learning model based on hierarchical transfer learning for environmental information recognition.
제3항에 있어서,
상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계는,
상기 유사 타겟 도메인의 각 데이터셋 간에 동일 클래스명을 갖는 클래스에 대하여 이종 클래스로 설정하여, 각 데이터셋의 상기 클래스 독립적 정답지의 클래스명이 각각 상이하도록 생성하는 것인,
환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 방법.
According to paragraph 3,
The step of generating a class answer key for each dataset of the similar target domain based on the analysis results of the feature information,
Classes with the same class name between each dataset of the similar target domain are set as heterogeneous classes, and the class names of the class independent answer key of each dataset are generated so that they are different.
A method for creating a deep learning model based on hierarchical transfer learning for environmental information recognition.
제5항에 있어서,
상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하는 단계는,
상기 타겟 도메인과 상기 유사 타겟 도메인의 클래스별 데이터 간의 비유사 정도가 소정의 기준 조건에 따른 구분이 불가한 경우, 상기 유사 타겟 도메인의 데이터에 대하여 K-means 클러스터링 알고리즘을 적용하여 K개의 군집 데이터로 구성하고, 각 구성된 군집 데이터를 새로운 클래스로 설정하여 상기 클래스 군집화 정답지를 생성하는 것인,
환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 방법.
According to clause 5,
The step of generating a class answer key for each dataset of the similar target domain based on the analysis results of the feature information,
If the degree of dissimilarity between the target domain and the data for each class of the similar target domain cannot be distinguished according to predetermined standard conditions, the K-means clustering algorithm is applied to the data of the similar target domain to form K cluster data. Constructing and setting each configured cluster data as a new class to generate the class clustering answer key,
A method for creating a deep learning model based on hierarchical transfer learning for environmental information recognition.
소정의 네트워크를 통해 데이터셋을 수집하는 통신모듈,
상기 데이터셋을 기반으로 딥러닝 모델을 학습하기 위한 프로그램이 저장된 메모리 및
상기 메모리에 저장된 프로그램을 실행시키는 프로세서를 포함하되,
상기 프로세서는 상기 프로그램을 실행시킴에 따라, 도메인이 타겟되지 않은 데이터셋(이하, 비타겟 도메인 데이터셋)을 기반으로 딥러닝 모델의 1차 학습을 수행하고, 상기 통신모듈을 통해 수집된 타겟 도메인 및 상기 타겟 도메인과 유사 목적을 갖는 것으로 수집된 유사 타겟 도메인의 각 데이터셋에 대한 특징 정보를 분석한 후, 상기 특징 정보의 분석 결과를 기반으로 상기 유사 타겟 도메인의 각 데이터셋에 대한 클래스 정답지를 생성하고, 상기 생성된 클래스 정답지를 갖는 유사 타겟 도메인의 데이터셋을 기반으로 상기 딥러닝 모델에 대한 2차 학습을 수행하며, 상기 타겟 도메인의 데이터셋을 기반으로 상기 딥러닝 모델에 대한 3차 학습을 수행하는 것인,
환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 시스템.
A communication module that collects data sets through a certain network,
A memory storing a program for learning a deep learning model based on the dataset, and
Including a processor that executes the program stored in the memory,
As the processor executes the program, the processor performs primary learning of a deep learning model based on a dataset in which the domain is not targeted (hereinafter referred to as non-target domain dataset), and the target domain collected through the communication module And after analyzing the characteristic information for each dataset of the similar target domain collected as having a similar purpose as the target domain, a class answer key for each dataset of the similar target domain is based on the analysis result of the characteristic information. Generate, perform secondary learning on the deep learning model based on a dataset of a similar target domain with the generated class answer key, and perform tertiary learning on the deep learning model based on the dataset of the target domain. To perform,
A deep learning model creation system based on hierarchical transfer learning for environmental information recognition.
제7항에 있어서,
상기 프로세서는 상기 타겟 도메인의 데이터셋 및 상기 유사 타겟 도메인의 데이터셋에 대한 클래스별 포함된 이미지의 특징 정보를 분석하고,
상기 특징 정보의 분석 결과를 기반으로 상기 비타겟 도메인 데이터셋의 정답지를 상기 유사 타겟 도메인의 각 데이터셋에 적용하여 클래스 정답지를 생성하는 것인,
환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 시스템.
In clause 7,
The processor analyzes feature information of images included by class for the dataset of the target domain and the dataset of the similar target domain,
Based on the analysis results of the feature information, the answer key of the non-target domain dataset is applied to each data set of the similar target domain to generate a class answer key,
A deep learning model creation system based on hierarchical transfer learning for environmental information recognition.
제8항에 있어서,
상기 프로세서는 상기 유사 타겟 도메인의 데이터셋이 상기 타겟 도메인의 데이터셋과 유사한 것으로 분석된 경우 클래스 의존적 정답지를 생성하되, 상기 유사 타겟 도메인의 각 데이터셋 간에 동일 클래스명을 갖는 클래스의 경우 동일 클래스로 설정하여, 각 데이터셋의 상기 클래스 의존적 정답지의 클래스명이 동일하도록 생성하는 것인,
환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 시스템.
According to clause 8,
The processor generates a class-dependent answer key when the dataset of the similar target domain is analyzed to be similar to the dataset of the target domain, but in the case of classes having the same class name between each dataset of the similar target domain, the processor generates a class-dependent answer key to the same class. By setting, the class name of the class-dependent answer key in each dataset is generated so that the class name is the same,
A deep learning model creation system based on hierarchical transfer learning for environmental information recognition.
제8항에 있어서,
상기 프로세서는 상기 유사 타겟 도메인의 데이터셋이 상기 타겟 도메인의 데이터셋과 비유사한 것으로 분석된 경우 클래스 독립적 정답지를 생성하되, 상기 유사 타겟 도메인의 각 데이터셋 간에 동일 클래스명을 갖는 클래스에 대하여 이종 클래스로 설정하여, 각 데이터셋의 상기 클래스 독립적 정답지의 클래스명이 각각 상이하도록 생성하는 것인,
환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 시스템.
According to clause 8,
The processor generates a class-independent answer key when the data set of the similar target domain is analyzed to be dissimilar to the data set of the target domain, and a heterogeneous class for classes with the same class name among each data set of the similar target domain. By setting it to , the class names of the class-independent answer sheets of each dataset are generated so that they are different from each other.
A deep learning model creation system based on hierarchical transfer learning for environmental information recognition.
제10항에 있어서,
상기 프로세서는 상기 타겟 도메인과 상기 유사 타겟 도메인의 클래스별 데이터 간의 비유사 정도가 소정의 기준 조건에 따른 구분이 불가한 경우, 상기 유사 타겟 도메인의 데이터에 대하여 K-means 클러스터링 알고리즘을 적용하여 K개의 군집 데이터로 구성하고, 각 구성된 군집 데이터를 새로운 클래스로 설정하여 상기 클래스 군집화 정답지를 생성하는 것인,
환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 시스템.
According to clause 10,
If the degree of dissimilarity between the target domain and data for each class of the similar target domain cannot be distinguished according to a predetermined standard condition, the processor applies the K-means clustering algorithm to the data of the similar target domain to obtain K It is composed of cluster data, and each configured cluster data is set as a new class to generate the class clustering answer key,
A deep learning model creation system based on hierarchical transfer learning for environmental information recognition.
KR1020220107219A 2022-08-26 2022-08-26 System and method for generating deep learning model based on hierachical transfer learning for environmental information recognition KR20240029127A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020220107219A KR20240029127A (en) 2022-08-26 2022-08-26 System and method for generating deep learning model based on hierachical transfer learning for environmental information recognition
PCT/KR2022/014926 WO2024043390A1 (en) 2022-08-26 2022-10-04 Deep learning model generation system and method based on hierarchical transfer learning for environmental information recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220107219A KR20240029127A (en) 2022-08-26 2022-08-26 System and method for generating deep learning model based on hierachical transfer learning for environmental information recognition

Publications (1)

Publication Number Publication Date
KR20240029127A true KR20240029127A (en) 2024-03-05

Family

ID=90013619

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220107219A KR20240029127A (en) 2022-08-26 2022-08-26 System and method for generating deep learning model based on hierachical transfer learning for environmental information recognition

Country Status (2)

Country Link
KR (1) KR20240029127A (en)
WO (1) WO2024043390A1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200057291A (en) 2018-11-16 2020-05-26 한국전자통신연구원 Method and apparatus for creating model based on transfer learning

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10497122B2 (en) * 2017-10-11 2019-12-03 Adobe Inc. Image crop suggestion and evaluation using deep-learning
US10956787B2 (en) * 2018-05-14 2021-03-23 Quantum-Si Incorporated Systems and methods for unifying statistical models for different data modalities
KR102176111B1 (en) * 2018-10-18 2020-11-09 부산대학교 산학협력단 Method and system for providing of naive semi-supervised deep learning using unlabeled data
KR102261187B1 (en) * 2020-02-04 2021-06-07 광주과학기술원 System and method for machine learning based surveillance video analysis
KR102421349B1 (en) * 2020-05-07 2022-07-14 에스케이텔레콤 주식회사 Method and Apparatus for Transfer Learning Using Sample-based Regularization

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200057291A (en) 2018-11-16 2020-05-26 한국전자통신연구원 Method and apparatus for creating model based on transfer learning

Also Published As

Publication number Publication date
WO2024043390A1 (en) 2024-02-29

Similar Documents

Publication Publication Date Title
KR20050054394A (en) Face recognition method and apparatus using pca learning per subgroup
US20200272726A1 (en) Method and apparatus for generating artificial intelligence resistant verification images
CN109118420B (en) Watermark identification model establishing and identifying method, device, medium and electronic equipment
JP7448562B2 (en) Dealing with rare training data for artificial intelligence
WO2021104128A1 (en) Feature library update method and apparatus, inference server and storage medium
CN113221983B (en) Training method and device for transfer learning model, image processing method and device
WO2021128846A1 (en) Electronic file control method and apparatus, and computer device and storage medium
CN114330588A (en) Picture classification method, picture classification model training method and related device
Haq et al. Automatic test suite generation for key-points detection DNNs using many-objective search (experience paper)
Jabeen et al. A deep multimodal system for provenance filtering with universal forgery detection and localization
US20230267709A1 (en) Dataset-aware and invariant learning for face recognition
JP7438365B2 (en) Learning utilization system, utilization device, learning device, program and learning utilization method
KR20170057118A (en) Method and apparatus for recognizing object, and method and apparatus for training recognition model
CN113887490A (en) DSSD neural network-based intelligent home environment control real-time recognition system and control method thereof
CN112949534A (en) Pedestrian re-identification method, intelligent terminal and computer readable storage medium
CN113609866A (en) Text marking method, device, equipment and storage medium
CN116432210B (en) File management method and system based on security protection
US11551084B2 (en) System and method of robust active learning method using noisy labels and domain adaptation
KR20240029127A (en) System and method for generating deep learning model based on hierachical transfer learning for environmental information recognition
CN112001300A (en) Building monitoring method and device based on cross entropy according to position and electronic equipment
CN113286008B (en) Edge computing intelligent gateway service processing method and intelligent gateway system
CN116324906A (en) Action object recognition in a cluttered video scene using text
CN112348045A (en) Training method and training device for neural network and electronic equipment
US11631267B1 (en) Systems and methods for utilizing a tiered processing scheme
CN114626430B (en) Emotion recognition model training method, emotion recognition device and emotion recognition medium