KR20210147443A - Method and apparatus for labeling multi-channel image training data based on crowd verification - Google Patents
Method and apparatus for labeling multi-channel image training data based on crowd verification Download PDFInfo
- Publication number
- KR20210147443A KR20210147443A KR1020200064677A KR20200064677A KR20210147443A KR 20210147443 A KR20210147443 A KR 20210147443A KR 1020200064677 A KR1020200064677 A KR 1020200064677A KR 20200064677 A KR20200064677 A KR 20200064677A KR 20210147443 A KR20210147443 A KR 20210147443A
- Authority
- KR
- South Korea
- Prior art keywords
- channel image
- labeling
- image
- verification
- image data
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
Abstract
Description
본 개시는 학습 데이터 레이블링 방법으로서, 보다 구체적으로 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법 및 장치에 관한 것이다. The present disclosure relates to a training data labeling method, and more particularly, to a crowd validation-based multi-channel image training data labeling method and apparatus.
인공지능을 학습시키기 위해서는 학습 데이터가 필요하다. 유능한 AI를 만들기 위해 양질의 학습 데이터가 필요한데, AI에 학습시키려면 해당 데이터를 원형 그대로 사용하는 것이 아니라 기계가 학습할 수 있는 형태로 부분 가공해야 할 필요가 있다. 이미지 인식 분야에 있어서, 이미지내 객체 인식을 위해서 AI 학습용 레이블링, 즉 바운딩 박스와 레이블 입력, 및 학습 데이터세트가 필요한데, 기존에는 사람이 직접 레이블링을 수행하여 학습 데이터세트를 준비해야 했기때문에 학습 데이터를 생성하는 업무는 비용이 높고 시간이 상당히 필요했다. Learning data is needed to learn artificial intelligence. To make a competent AI, high-quality learning data is needed, and in order to train the AI, it is necessary to partially process the data into a form that can be learned by a machine, rather than using the data as it is. In the field of image recognition, labeling for AI training, that is, a bounding box and label input, and a training dataset are required for object recognition within an image. The task to create was expensive and time consuming.
근래들어, 이러한 레이블링 및 학습, 추론(inference)의 주기를 반복적으로 수행하여 모델의 정확도를 높여가는 기법이 개발되고 있으며, 이는 자동화된 솔루션 및 플랫폼을 활용하여 사람이 수행해야 할 부분을 줄이고 학습과정을 최대한 자동화하여 빠른 시간에 정확도 높은 모델을 준비할 수 있도록 도움을 준다. 그러나, 현재까지 공개된 학습 데이터 레이블링 자동화 기법은 여전히 사람이 수행해야 하는 부분이 많다. 예를 들어, 학습을 완료한 기존 이미지 데이터 세트를 복사하여 추론하고, 사람이 추론 결과, 레이블 결과, 원본의 레이블 결과를 비교하고 확인하여 영상에 추가로 인식된 바운딩 박스와 레이블을 입력해야 한다. 또한, 추가로 인식할 객체는 여전히 기존의 레이블링 작업이 필요하다. Recently, a technique to increase the accuracy of a model by repeatedly performing such a cycle of labeling, learning, and inference has been developed, which reduces the part that needs to be performed by humans by using an automated solution and platform and reduces the learning process It helps to prepare a high-accuracy model in a short time by automating it as much as possible. However, the training data labeling automation technique that has been disclosed so far still has a lot of work to be performed by humans. For example, inference is made by copying an existing image data set that has completed training, and a human needs to input an additional recognized bounding box and label into the image by comparing and confirming the inference result, the label result, and the original label result. In addition, the object to be additionally recognized still requires the existing labeling operation.
즉, 새로운 이미지를 학습시키기 위해서는 기존과 동일하게 수작업 레이블링 또는 기존의 모델에서 추론한 결과를 모두 확인해야 하고, 추가로 인식할 객체의 레이블링은 기존과 동일하게 수작업 레이블링이 필요하기 때문에 여전히 많은 시간과 노력을 필요로 하고 있다. In other words, in order to train a new image, it is necessary to check all the results of manual labeling or inferred from the existing model as before, and the labeling of additional objects to be recognized still requires a lot of time and effort because manual labeling is required as before. It requires effort.
따라서, 이미지 데이터 기반의 정확도 높은 추론 모델의 효과적이고 효율적인 생성 방법이 요구되고 있다. Therefore, there is a need for an effective and efficient method of generating an inference model with high accuracy based on image data.
본 개시의 일 특징에 따르면, 컴퓨터 시스템 상에서 수행되는, 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법이 제공된다. 상기 방법은 다채널 이미지 데이터를 수신하는 단계; 상기 다채널 이미지 데이터에 대해 동일한 시간 기준으로 데이터세트를 생성하고, 해당 데이터세트의 다채널 이미지 데이터 각각에 대해 기계학습 기반으로 이미지 내 개별 가축의 자세를 추론하는 단계; 상기 추론 결과를 비교분석하여 동일 데이터세트 내의 추론 결과가 일치하는지 여부를 비교판단하는 단계; 및 상기 동일 데이터세트 내의 추론 결과가 일치하는 경우, 상기 다채널 이미지 데이터에 대해 레이블링을 수행하는 단계를 포함할 수 있다. According to one aspect of the present disclosure, there is provided a method for labeling data, which is performed on a computer system, based on crowd validation, for multi-channel image learning. The method includes receiving multi-channel image data; generating a dataset based on the same time reference for the multi-channel image data, and inferring the posture of individual livestock in the image based on machine learning for each multi-channel image data of the corresponding dataset; comparing and analyzing the inference results to compare and determine whether the inference results in the same dataset match; and performing labeling on the multi-channel image data when the inference results in the same dataset match.
본 개시의 일 실시예에 의하면, 상기 방법은 상기 동일 데이터세트 내의 추론 결과가 일치하지 않는 경우, 상기 동일 데이터세트에 포함된 이미지 데이터를 k개(k>1, k는 홀수)의 검증자 단말로 전송하고, 상기 k개의 검증자 단말로부터 상기 동일 데이터세트에 포함된 이미지 데이터의 검증 결과를 수신하여, 검증 결과가 일치하는지 여부를 판단하는 단계를 더 포함할 수 있다. According to an embodiment of the present disclosure, in the method, if the inference results in the same dataset do not match, k number of image data included in the same dataset (k>1, k is an odd number) verifier terminals The method may further include the step of transmitting to , receiving verification results of the image data included in the same dataset from the k verifier terminals, and determining whether the verification results match.
본 개시의 일 실시예에 의하면, 상기 방법은 상기 검증 결과가 일치하는 경우, 상기 다채널 이미지 데이터에 대해 레이블링을 수행하는 단계를 포함할 수 있다. According to an embodiment of the present disclosure, the method may include performing labeling on the multi-channel image data when the verification results match.
본 개시의 일 실시예에 의하면, 상기 방법은 상기 검증 결과가 일치하지 않는 경우, 상기 동일 데이터세트에 포함된 이미지 데이터를 m(m>k, m은 홀수)개의 검증자 단말로 전송하고, 상기 m개의 검증자 단말로부터 상기 동일 데이터세트에 포함된 이미지 데이터의 검증 결과를 수신하여, 검증 결과가 일치하는지 여부를 판단하는 단계를 더 포함할 수 있다. According to an embodiment of the present disclosure, when the verification results do not match, the method transmits image data included in the same dataset to m (m>k, m is an odd number) number of verifier terminals, and The method may further include receiving verification results of image data included in the same dataset from m verifier terminals, and determining whether the verification results match.
본 개시의 일 실시예에 의하면, 상기 방법은 상기 다채널 이미지 데이터에 대해 레이블링한 새로운 학습 데이터를 기초로 기계학습 모델을 재학습시키는 단계를 더 포함할 수 있다. According to an embodiment of the present disclosure, the method may further include retraining the machine learning model based on new training data labeled with respect to the multi-channel image data.
본 개시의 일 실시예에 의하면, 상기 방법은 상기 검증자 단말에 보상을 지급하는 단계를 더 포함할 수 있다. According to an embodiment of the present disclosure, the method may further include paying a reward to the verifier terminal.
본 개시의 다른 특징에 의하면, 컴퓨터에 의해 실행 가능한, 하나 이상의 컴퓨터 판독가능 명령이 수록된 컴퓨터 판독가능 기록매체로서, 상기 하나 이상의 컴퓨터 판독가능 명령은, 상기 컴퓨터에 의해 실행되는 경우, 상기 컴퓨터로 하여금, 전술한 방법 중 어느 하나의 방법을 수행하게 하는 컴퓨터 판독가능 기록매체가 제공된다. According to another feature of the present disclosure, there is provided a computer-readable recording medium containing one or more computer-readable instructions executable by a computer, wherein the one or more computer-readable instructions, when executed by the computer, cause the computer to , a computer-readable recording medium for performing any one of the methods described above is provided.
본 개시의 다른 특징에 의하면, 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 장치가 제공된다. 상기 장치는 복수의 다채널 이미지 데이터를 수신하도록 구성된 다채널 이미지 획득부; 상기 복수의 다채널 이미지 데이터 각각에 대해 기계학습 모델을 기초로 이미지에 포함된 객체를 추론하도록 구성된 다채널 이미지 추론부; 상기 추론한 결과를 비교분석하도록 구성된 다채널 이미지 추론 결과 비교분석부; 및 상기 복수의 다채널 이미지 데이터 각각에 대해 레이블링 파일을 생성하도록 구성된 레이블링 파일 생성부를 포함할 수 있다. According to another feature of the present disclosure, a crowd-verification-based multi-channel image learning data labeling apparatus is provided. The apparatus includes: a multi-channel image acquisition unit configured to receive a plurality of multi-channel image data; a multi-channel image inference unit configured to infer an object included in an image based on a machine learning model for each of the plurality of multi-channel image data; a multi-channel image inference result comparison and analysis unit configured to compare and analyze the inferred result; and a labeling file generator configured to generate a labeling file for each of the plurality of multi-channel image data.
본 개시의 일 실시예에 의하면, 상기 장치는 상기 추론한 결과를 비교분석한 결과가 일치하지 않은 경우, 상기 복수의 다채널 이미지 데이터를 복수의 검증단말로 전송하고, 상기 복수의 검증자 단말로부터 검증 결과를 수신하여 검증자로부터의 검증 결과가 일치하는지 여부를 판단하도록 구성된 크라우드 검증부를 더 포함할 수 있다. According to an embodiment of the present disclosure, the device transmits the plurality of multi-channel image data to a plurality of verification terminals when the results of comparative analysis of the inferred results do not match, and transmits the plurality of multi-channel image data to the plurality of verification terminals. It may further include a crowd verification unit configured to receive the verification result and determine whether the verification result from the verifier is consistent.
본 개시의 일 실시예에 의하면, 상기 장치는 상기 다채널 이미지 데이터에 대해 레이블링한 새로운 학습 데이터를 기초로 기계학습 모델을 재학습시키는 학습부를 더 포함할 수 있다. According to an embodiment of the present disclosure, the apparatus may further include a learning unit for re-learning the machine learning model based on the new training data labeled with respect to the multi-channel image data.
본 개시의 실시예에 따르면, 효율적이고 신속하게 이미지 추론 기계학습 모델을 개선할 수 있는 학습 데이터 레이블링 방법 및 장치를 제공할 수 있다. According to an embodiment of the present disclosure, it is possible to provide a training data labeling method and apparatus capable of efficiently and quickly improving an image inference machine learning model.
본 개시의 실시예에 따르면, 학습 데이터가 완벽히 준비되지 않은 상태에서도 다수의 크라우드 검증자를 통해 자동화된 플랫폼 기반에서 학습 데이터를 생성 및 검증할 수 있는 학습 데이터 레이블링 방법 및 장치를 제공할 수 있다. According to an embodiment of the present disclosure, it is possible to provide a training data labeling method and apparatus capable of generating and verifying training data based on an automated platform through a plurality of crowd validators even when the training data is not completely prepared.
본 개시의 일 실시예에 따르면, 복수의 다채널 이미지를 이용하여 새로운 이미지의 추론 결과를 활용하여 자동화된 플랫폼 기반으로 이미지 추론 기계학습 모델을 개선할 수 있는 학습 데이터 레이블링 방법 및 장치를 제공할 수 있다. According to an embodiment of the present disclosure, it is possible to provide a learning data labeling method and apparatus capable of improving an image inference machine learning model based on an automated platform by using an inference result of a new image using a plurality of multi-channel images. have.
이미지 추론 기계학습 모델을 개선함에 있어 레이블링 작업은 현실적으로 가장 시간과 비용이 많이 소요되는 파트 중 하나이므로, 자동화된 플랫폼 기반으로 레이블링 작업의 효율을 증가시키는 것은 이미지 추론 기계학습 모델을 매우 효과적으로 개선할 수 있다. In improving the image inference machine learning model, the labeling task is one of the most time-consuming and expensive parts in reality, so increasing the efficiency of the labeling task based on an automated platform can very effectively improve the image inference machine learning model. have.
도 1은 본 개시의 일 실시예에 따른 크라우드 기반 다채널 이미지 레이블링 시스템의 전체 구성을 개략적으로 도시한 도면이다.
도 2는 본 개시의 일 실시예에 따른 도 1의 이미지 레이블링 서버의 예시적 기능 구성을 도시한 기능 블록도이다.
도 3은 본 개시의 일 실시예에 따라 이미지 레이블링 서버가 이미지 레이블링을 처리하는 흐름을 보여주는 예시적 동작 흐름도이다.
도 4는 본 개시의 일 실시예에 따른 이미지 레이블링 서버의 학습 흐름을 보여주는 예시적 동작 흐름도이다. 1 is a diagram schematically illustrating an overall configuration of a crowd-based multi-channel image labeling system according to an embodiment of the present disclosure.
2 is a functional block diagram illustrating an exemplary functional configuration of the image labeling server of FIG. 1 according to an embodiment of the present disclosure.
3 is an exemplary operation flowchart illustrating a flow in which an image labeling server processes image labeling according to an embodiment of the present disclosure.
4 is an exemplary operation flowchart illustrating a learning flow of an image labeling server according to an embodiment of the present disclosure.
이하, 첨부 도면을 참조하여 본 개시의 실시예에 관하여 상세히 설명한다. 이하에서는, 본 개시의 요지를 불필요하게 흐릴 우려가 있다고 판단되는 경우, 이미 공지된 기능 및 구성에 관한 구체적인 설명을 생략한다. 또한, 이하에서 설명하는 내용은 어디까지나 본 개시의 일 실시예에 관한 것일 뿐 본 개시가 이로써 제한되는 것은 아님을 알아야 한다.Hereinafter, embodiments of the present disclosure will be described in detail with reference to the accompanying drawings. Hereinafter, when it is determined that there is a risk of unnecessarily obscuring the subject matter of the present disclosure, detailed descriptions of already known functions and configurations will be omitted. In addition, it should be understood that the contents described below are only related to one embodiment of the present disclosure, and the present disclosure is not limited thereto.
본 명세서에서 사용되는 용어는 단지 특정한 실시예를 설명하기 위해 사용되는 것으로 본 개시를 한정하려는 의도에서 사용된 것이 아니다. 예를 들면, 단수로 표현된 구성요소는 문맥상 명백하게 단수만을 의미하지 않는다면 복수의 구성요소를 포함하는 개념으로 이해되어야 한다. 또한, 본 개시의 명세서에서, '포함하다' 또는 '가지다' 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것일 뿐이고, 이러한 용어의 사용에 의해 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 배제하려는 것은 아니다.The terms used herein are used only to describe specific embodiments and are not intended to limit the present disclosure. For example, an element expressed in a singular should be understood as a concept including a plurality of elements unless the context clearly means only the singular. In addition, in the specification of the present disclosure, terms such as 'comprise' or 'have' are only intended to designate that the features, numbers, steps, operations, components, parts, or combinations thereof described in the specification exist, and such The use of the term is not intended to exclude the possibility of the presence or addition of one or more other features or numbers, steps, operations, components, parts, or combinations thereof.
본 명세서에 기재된 실시예에 있어서 '블록' 또는 '부'는 적어도 하나의 기능이나 동작을 수행하는 기능적 부분을 의미하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 '블록' 또는 '부'는, 특정한 하드웨어로 구현될 필요가 있는 '블록' 또는 '부'를 제외하고는, 적어도 하나의 소프트웨어 모듈로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.In the embodiments described herein, a 'block' or 'unit' means a functional part that performs at least one function or operation, and may be implemented as hardware or software, or a combination of hardware and software. In addition, the plurality of 'blocks' or 'units' may be integrated into at least one software module and implemented with at least one processor, except for 'blocks' or 'units' that need to be implemented with specific hardware. .
덧붙여, 달리 정의되지 않는 한 기술적 또는 과학적인 용어를 포함하여, 본 명세서에서 사용되는 모든 용어들은 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의된 용어들은, 관련 기술의 문맥상 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 개시의 명세서에서 명백하게 달리 정의하지 않는 한 과도하게 제한 또는 확장하여 해석되지 않는다는 점을 알아야 한다.In addition, unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this disclosure belongs. It should be noted that commonly used terms defined in the dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related art, and should not be construed as unduly limited or expanded unless explicitly defined otherwise in the specification of the present disclosure. should know
이하, 첨부된 도면을 참조하여, 본 개시의 실시예에 대해 구체적으로 설명하기로 한다.Hereinafter, with reference to the accompanying drawings, an embodiment of the present disclosure will be described in detail.
도 1은 본 개시의 일 실시예에 따른 크라우드 기반 다채널 이미지 레이블링 시스템(100)의 전체 구성을 개략적으로 도시한 도면이다. 도시된 바에 의하면, 크라우드 기반 다채널 이미지 레이블링 시스템은, 복수 개의 카메라(120a, 120b, ..., 120n), 복수 개의 검증자 단말(130a, 130b, ..., 130n), 이미지 레이블링 서버(140), 통신망(150)를 포함할 수 있다. 1 is a diagram schematically illustrating an overall configuration of a crowd-based multi-channel image labeling system 100 according to an embodiment of the present disclosure. As shown, the crowd-based multi-channel image labeling system includes a plurality of cameras (120a, 120b, ..., 120n), a plurality of verifier terminals (130a, 130b, ..., 130n), an image labeling server ( 140), and the
본 개시의 일 실시예에 의하면, 카메라(120a, 120b, ..., 120n)는 축산 농가에서 관리하는 가축의 모습을 촬영하기 위한 것으로서 유선 또는 무선 통신 기능을 구비한 이미지 촬영 카메라, 동영상 촬영 카메라, CCTV 카메라 등 임의의 전자 장치일 수 있다.According to an embodiment of the present disclosure, the cameras (120a, 120b, ..., 120n) are for photographing the appearance of livestock managed by the livestock farm, an image photographing camera, a video recording camera having a wired or wireless communication function , may be any electronic device such as a CCTV camera.
본 개시의 일 실시예에 의하면, 카메라(120a, 120b, ..., 120n)는 가축 자체의 이미지, 가축의 걸음 걸이 영상, 수면 영상, 움직임 영상, 섭취한 사료의 양, 견좌 자세 영상, 배설 영상, 토사물 영상, 축사의 청소 상태 등을 촬영할 수 있다.According to an embodiment of the present disclosure, the
본 개시의 일 실시예에 의하면, 카메라(120a, 120b, ..., 120n)는 녹화된 이미지 데이터를 네트워크 비디오 레코더(Network Video Recorder: NVR:110)에 저장하고, 통신망(150)을 통해 전송할 수 있다. 본 도면에 도시된 바에 의하면, 크라우드 기반 다채널 이미지 레이블링 시스템(100)은, 네 개의 카메라(120a, 120b, 120c, 120d)를 갖는 것으로 도시되어 있으나 본 개시가 이로써 제한되는 것은 아니다. According to an embodiment of the present disclosure, the
본 개시의 일 실시예에 의하면, 카메라(120a, 120b, ..., 120n)는 동일한 공간을 촬영할 수 있다. 설명하면, 도 1에 도시된 바와 같이, 하나의 축사에 복수 개의 카메라, 예를 들어 각 모서리에 4개의 카메라가 설치되어 축사 전체를 여러 위치에서 각각 촬영할 수 있다. According to an embodiment of the present disclosure, the
본 개시의 일 실시예에 의하면, 복수의 검증자 단말(130a, 130b, ..., 130n) 각각은, 크라우드 검증을 수행하는 각 검증자가 보유한 통신 가능 단말일 수 있다. 본 개시의 일 실시예에 의하면, 복수의 검증자 단말(130a, 130b, ..., 130n) 각각은, 예컨대 검증자의 휴대 전화, 스마트폰, 태블릿 PC, 데스크탑, 랩탑 등 다양한 유형의 전자 단말일 수 있다. 검증자는, 자신의 검증자 단말(130a, 130b, ..., 130n)을 이용해서 통신망(150)을 통해 서버(140) 등과 통신하여, 각종 정보를 제공하거나 획득할 수 있다. According to an embodiment of the present disclosure, each of the plurality of
본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 카메라(120a, 120b, ..., 120n)로부터 이미지 데이터를 송신받아 수집한 이미지 데이터를 기반으로 이미지를 추론할 수 있다. 본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 수집한 이미지 데이터를 기초로 개별 가축의 자세를 매핑할 수 있다. 본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 복수의 카메라(120a, 120b, ..., 120n) 각각이 수집한 이미지 데이터를 동시간대 촬영한 데이터를 하나의 세트로 클러스터링 하고, 동일 세트에 속한 이미지를 각각 추론하여 분석 결과를 비교할 수 있다. According to an embodiment of the present disclosure, the
표 1은 이미지 레이블링 서버(140)에서 카메라(120a, 120b, ..., 120n)로부터 이미지 데이터를 송신받아 수집한 이미지 데이터를 추론한 결과를 예시적으로 나타내는 표이다. Table 1 is a table exemplarily showing the result of inferring the image data collected by receiving the image data from the
번호camera
number
본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 일정한 주기로, 예컨대 1초마다 복수의 카메라(120a, 120b, ..., 120n)로부터 이미지를 수집하여 획득한 새로운 이미지를 대상으로 주기적으로 이미지를 분석하여 이미지에 포함된 가축의 정보를 기계학습 기반으로 추론할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 2020-03-24 14:04:32 시간에 카메라 1 내지 4에서 촬영된 이미지에 대해 기계학습 모델을 통해 분석하여 해당 이미지에 포함된 가축의 자세를 추론할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)가 다채널 동시간대 즉, 매 1초에 4개의 채널의 이미지를 수신하는 경우, 이미지 레이블링 서버(140)는 초당 4개의 이미지로 된 세트의 새로운 이미지를 대상으로 추론을 수행할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 네 대의 카메라(120a, 120b, 120c, 120d) 각각이 수집한 동일한 시간대의 이미지 데이터에 대해, 제1 카메라에서 수집한 제1 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제2 카메라에서 수집한 제2 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제3 카메라에서 수집한 제3 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제4 카메라에서 수집한 제4 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론할 수 있다. According to an embodiment of the present disclosure, the
본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 복수의 카메라(120a, 120b, ..., 120n) 각각이 수집한 이미지 데이터를 동일 세트에 속한 이미지를 각각 분석하여 동일한 시간의 이미지의 추론 결과를 비교분석 할 수 있다. 예컨대 상기 예에서 제1 내지 제4 이미지의 각 추론 결과를 분석하여 추론 결과가 일치한다고 판단할 수 있다. According to an embodiment of the present disclosure, the
본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 추론 결과를 분석하여 결과가 일치한다고 판단한 각각의 이미지, 예를 들어 상기 제1 내지 제4 이미지에 포함된 돼지의 자세 이미지에 대해 해당 자세의 레이블을 레이블링할 수 있다. 설명하면, 서 있는 돼지 이미지 부분에 대해 서 있는 돼지라는 레이블링 파일을 생성하고, 견좌 돼지 이미지 부분에 대해서는 견좌 돼지라는 레이블링 파일을 각각 생성할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 특정 객체(가축의 특정 자세)를 분석하는 지시를 입력받아 해당 객체의 추론 정확도를 높이도록 분석을 수행할 수 있다. 예를 들어, 견좌 돼지(Sitting_Pig)에 집중하여 추론 정확도를 높이도록 하는 경우, 이미지 레이블링 서버(140)는 이미지 추론 결과가 견좌 돼지 이미지를 포함하는지 분석하고 견좌 돼지 이미지를 포함하는 추론 결과에 대해 분석을 수행할 수 있다 According to an embodiment of the present disclosure, the
본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 추론 결과를 분석하여 결과가 일치하지 않는다고 판단하는 경우, 보다 정확한 검토를 위해 크라우드 기반 이미지 레이블링을 수행할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 추론 결과가 불일치한 복수의 이미지 데이터세트, 즉 4개의 이미지를 검수자 단말로 제공하고, 복수의 검수자 단말로부터 해당 이미지 데이터세트에 대한 레이블링 결과를 수신하여 검수자의 분석 결과가 일치하는지 여부를 판단할 수 있다. According to an embodiment of the present disclosure, when the
본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 레이블링 결과를 수신하는 검수자의 수를 조절할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 세 명의 검수자에게 결과가 불일치한 복수의 이미지를 제공하고, 레이블링 결과를 수신하여 분석 결과가 일치하는지 여부를 판단할 수 있다. 일 실시예에서, 모든 검수자로부터 수신한 분석 결과가 일치하는 경우, 이미지 레이블링 서버(140)는 제공한 복수의 이미지에 포함된 돼지의 자세 이미지에 대해 해당 자세의 레이블을 레이블링할 수 있다. 다른 실시예에서, 검수자로부터 수신한 분석 결과가 불일치하는 경우, 이미지 레이블링 서버(140)는 검수자의 수를 늘려 결과가 불일치한 복수의 이미지, 즉 4개의 이미지를 제공하고, 복수의 검수자로부터 레이블링 결과를 수신하여 분석 결과가 일치하는지 여부를 판단할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 레이블링 결과가 동일할 때까지 검수자의 수를 증가할 수 있고, 검수자의 수가 임계치를 넘는 경우, 더이상 검수를 진행하지 않고 해당 이미지를 이용하지 않을 수 있다. 다른 실시예에서, 이미지 레이블링 서버(140)는 레이블링 결과가 동일할 때까지 검수자의 수를 증가할 수 있고, 검수자의 수가 임계치를 넘는 경우, 검수자의 다수가 보낸 결과를 이미지 레이블링에 반영하여 복수의 이미지에 포함된 돼지의 자세 이미지에 대해 해당 자세의 레이블을 레이블링할 수 있다. According to an embodiment of the present disclosure, the
본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 올바른 레이블링 결과를 입력하는 검수자에게 보상을 지급할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 각 검증 인원이 검증한 결과를 기반으로 정산을 위한 포인트를 적립 및 차감할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 검증자가 올바르게 검증했을 경우 포인트를 지급하고, 검증이 정확하지 않은 경우 포인트를 차감할 수 있다. 예컨대, 이미지 레이블링 서버(140)는 검증자가 이미지 1장 또는 객체 1건에 대해 올바르게 검증했을 경우 1 포인트를 적립할 수 있고, 다수의 의견과 다르게 검증했을 경우 더 많은 포인트, 예컨대 20 포인트를 차감할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)가 올바른 레이블링 결과를 입력하는 검수자에게 보상을 지급하는 것은 크라우드 기반으로 이미지 레이블링을 입력하기 위한 것으로, 검증이 정확하지 않은 경우 차감하는 포인트가 정확한 검증에 대한 보상으로 부여되는 포인트보다 높은 것이 크라우드 검증자에게 신중한 검증을 유도하여 검증 결과의 품질을 높이는데 유리할 수 있다. According to an embodiment of the present disclosure, the
이미지 레이블링 서버(140)가 특정 검수자의 포인트를 차감해야 하는 경우, 이미지 레이블링 서버(140)는 관리자의 확인을 입력받은 후 해당 검수자의 포인트를 차감할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 검증이 정확하지 않은 경우라고 판단하였으나, 관리자가 포인트 차감 허락을 입력하지 않는 경우, 이미지 레이블링 서버(140)는 해당 검수자의 포인트를 차감하지 않을 수 있다. 예를 들어 이미지를 판독하기 매우 어려운 경우 검증이 정확하지 않더라도 관리자는 검수자의 포인트를 차감하지 않을 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 관리자의 지시에 따라 해당 검수자에게 포인트를 지급할 수 있다. When the
본 개시의 일 실시예에 의하면, 통신망(150)은, 임의의 유선 또는 무선 통신망, 예컨대 TCP/IP 통신망을 포함할 수 있다. 본 개시의 일 실시예에 의하면, 통신망(150)은, 예컨대 Wi-Fi망, LAN망, WAN망, 인터넷망 등을 포함할 수 있으며, 본 발명이 이로써 제한되는 것은 아니다. 본 개시의 일 실시예에 의하면, 통신망(150)은, 예컨대 이더넷, GSM, EDGE(Enhanced Data GSM Environment), CDMA, TDMA, OFDM, 블루투스, VoIP, Wi-MAX, Wibro 기타 임의의 다양한 유선 또는 무선 통신 프로토콜을 이용하여 구현될 수 있다.According to an embodiment of the present disclosure, the
도 2는 본 개시의 일 실시예에 따른 도 1의 이미지 레이블링 서버의 예시적 기능 구성을 도시한 기능 블록도이다. 2 is a functional block diagram illustrating an exemplary functional configuration of the image labeling server of FIG. 1 according to an embodiment of the present disclosure.
도시된 바에 의하면, 이미지 레이블링 서버(140)는, 다채널 이미지 획득부(201), 다채널 이미지 추론부(203), 다채널 이미지 추론 결과 비교분석부(205), 크라우드 검증부(207), 레이블링 파일 생성부(209), 학습부(211), 저장부(213) 및 통신부(215)를 포함할 수 있다. As shown, the
본 개시의 일 실시예에 의하면, 다채널 이미지 획득부(201)는 이미지 데이터를 전송받아 이미지를 획득할 수 있다. 일 실시예에서 다채널 이미지 획득부(201)는 카메라(120a, 120b, ..., 120n)로부터 이미지 데이터를 전송받아 이미지를 획득할 수 있다. 일 실시예에서 다채널 이미지 획득부(201)는 동일한 영역을 촬영하는 복수의 카메라(120a, 120b, ..., 120n)로부터 다채널 이미지 데이터를 전송받아 다채널 이미지를 획득할 수 있다. 여기서 다채널 이미지 데이터란 동시간에 동일한 영역을 다른 위치에서 촬영한 이미지 데이터를 의미할 수 있다. According to an embodiment of the present disclosure, the multi-channel
본 개시의 일 실시예에 의하면, 다채널 이미지 추론부(203)는 기계학습 모델에 기초하여 수집한 이미지 데이터에서 개별 가축의 자세를 추론할 수 있다. 본 개시의 일 실시예에 의하면, 다채널 이미지 추론부(203)는 복수의 카메라(120a, 120b, ..., 120n) 각각이 수집한 이미지 데이터에 대해 동시간대 촬영한 데이터를 하나의 세트로 클러스터링 하고, 동일 세트에 속한 이미지 각각에 대해 개별 가축의 자세를 추론할 수 있다. According to an embodiment of the present disclosure, the multi-channel
전술한 표 1은 다채널 이미지 추론부(203)에서 다채널 이미지 데이터를 추론한 결과를 예시적으로 나타내는 표이다. Table 1 described above is a table exemplarily showing a result of inferring multi-channel image data by the multi-channel
본 개시의 일 실시예에 의하면, 다채널 이미지 추론부(203)는 일정한 주기로, 예컨대 1초마다 복수의 카메라(120a, 120b, ..., 120n)로부터 이미지를 수집하여 획득한 새로운 이미지를 대상으로 주기적으로 이미지에 포함된 가축의 정보를 기계학습 기반으로 추론할 수 있다. 예컨대, 다채널 이미지 추론부(203)는 2020-03-24 14:04:32 시간에 카메라 1 내지 4에서 촬영된 이미지를 분석하여 해당 이미지에 포함된 가축의 자세, 가축의 위치 정보를 추론할 수 있다. 일 실시예에서, 다채널 이미지 획득부(201)가 다채널 동시간대 즉, 매 1초에 4개의 채널의 이미지를 수신하는 경우, 다채널 이미지 추론부(203)는 초당 4개의 이미지로 된 데이터세트의 새로운 이미지를 대상으로 추론을 수행할 수 있다. 여기서 세트란 동시간에 동일한 영역을 다른 위치에서 복수의 카메라(120a, 120b, ..., 120n) 각각에서 촬영한 다채널 이미지 데이터의 집합을 의미할 수 있다. 일 실시예에서, 다채널 이미지 추론부(203)는 네 대의 카메라(120a, 120b, 120c, 120d) 각각이 수집한 동시간에 동일한 영역을 다른 위치에서 촬영한 이미지 데이터에 대해 추론한 결과로서 제1 카메라에서 수집한 제1 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제2 카메라에서 수집한 제2 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제3 카메라에서 수집한 제3 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제4 카메라에서 수집한 제4 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 각 추론할 수 있다. According to an embodiment of the present disclosure, the multi-channel
본 개시의 일 실시예에 의하면, 다채널 이미지 추론 결과 비교분석부(205)는 동일 데이터세트에 속한 이미지들의 추론 결과를 비교분석 할 수 있다. 일 실시예에서, 다채널 이미지 추론 결과 비교분석부(205)는 상기 각 추론 결과를 비교분석하여 다채널 이미지의 추론 결과가 일치한다고 판단할 수 있다. 일 실시예에서, 다채널 이미지 추론 결과 비교분석부(205)는 추론 결과가 일치한 다채널 이미지 데이터를 레이블링 파일 생성부(209)로 전송할 수 있다. According to an embodiment of the present disclosure, the multi-channel image inference result
본 개시의 일 실시예에 의하면, 크라우드 검증부(207)는 이미지 데이터세트를 수신하고 세트에 포함된 다채널 이미지 각각에 대해 검증을 수행할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 동일한 데이터세트에 포함된 이미지의 추론 결과가 일치하지 않은 이미지 데이터세트를 수신하고 해당 이미지를 복수의 검증자 단말(130a, 130b, ... , 130n)로 전송하여 검수 결과를 수신할 수 있다. 예컨대, 상기 예에서 일 실시예에서, 크라우드 검증부(207)는 결과가 불일치한 복수의 이미지, 즉 4개의 이미지를 검증자 단말(130a, 130b, ... , 130n)에 제공하고, 복수의 검증자 단말(130a, 130b, ... , 130n)로부터 검증 결과를 수신하여, 검증자 단말(130a, 130b, ... , 130n)로부터 수신한 결과가 일치하는지 여부를 판단할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 검증 결과가 일치한 다채널 이미지 데이터를 레이블링 파일 생성부(209)로 전송할 수 있다. According to an embodiment of the present disclosure, the
본 개시의 일 실시예에 의하면, 크라우드 검증부(207)는 검증자 단말(130a, 130b, ... , 130n)의 수를 조절할 수 있다. 일 실시예에서, 복수의 검증자 단말(130a, 130b, ... , 130n)로부터 검증 결과가 서로 일치하는 않은 경우, 크라우드 검증부(207)는 검증을 의뢰하는 검증자 단말의 수를 늘릴 수 있다. 예컨대, 1차 검증은 3개의 검증자 단말로 요청을 하고, 3개의 검증자 단말로 부터 수신한 검증 결과가 불일치하는 경우, 2차 검증은 5개의 검증자 단말로 검증을 요청하여 검증 결과를 수신할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 검증 결과가 일치할 때까지 검증자 단말의 수를 증가할 수 있고, 검증자 단말의 수가 임계치를 넘는 경우, 더이상 검증을 진행하지 않고 해당 이미지를 이용하지 않을 수 있다. 다른 실시예에서, 크라우드 검증부(207)는 검증 결과가 동일할 때까지 검증자 단말의 수를 증가시킬 수 있고, 검증자 단말의 수가 임계치를 넘는 경우, 다수결 원칙으로, 즉 검증자 단말이 보낸 검증 결과 중 다수가 일치하게 보낸 결과를 올바른 검증 결과로 간주하여 다수의 검증 결과 및 다채널 이미지 데이터세트를 레이블링 파일 생성부(209)로 전송할 수 있다. According to an embodiment of the present disclosure, the
본 개시의 일 실시예에 의하면, 크라우드 검증부(207)는 올바른 레이블링 결과를 입력하는 검증자 단말에게 보상을 지급할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 각 검증자 단말이 검증한 결과를 기반으로 정산을 위한 포인트를 적립 및 차감할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 검증자 단말이 올바르게 검증했을 경우 포인트를 지급하고, 검증이 정확하지 않은 경우 포인트를 차감할 수 있다. 예컨대, 크라우드 검증부(207)는 검증자 단말이 이미지 1장 또는 객체 1건에 대해 올바르게 검증했을 경우 1 포인트를 적립할 수 있고, 다수의 의견과 다르게 검증했을 경우 20 포인트를 차감할 수 있다. 일 실시예에서, 크라우드 검증부(207)이 올바른 레이블링 결과를 입력하는 검증자 단말에게 보상을 지급하는 것은 크라우드 기반으로 검증을 수행하기 입력하기 위한 것으로, 검증이 정확하지 않은 경우 차감하는 포인트가 정확한 검증에 따라 부여되는 포인트보다 높은 것이 크라우트 검증자에게 신중한 검증을 유도하여 검증 결과의 품질을 높이는데 유리할 수 있다. According to an embodiment of the present disclosure, the
크라우드 검증부(207)가 특정 검증자 단말의 포인트를 차감하는 경우, 크라우드 검증부(207)는 관리자의 확인을 입력받은 후 해당 검증자 단말의 포인트를 차감할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 특정 검증자 단말의 검증 결과가 정확하지 않은 경우라고 판단하였으나, 관리자가 포인트 차감 허락하지 않는 경우, 크라우드 검증부(207)는 해당 검증자 단말의 포인트를 차감하지 않을 수 있다. 일 실시예에서, 크라우드 검증부(207)는 해당 검증자 단말에게 관리자의 지시에 따라 포인트를 지급할 수 있다. When the
본 개시의 일 실시예에 의하면, 레이블링 파일 생성부(209)는 다채널 이미지 추론 결과 비교분석 결과 및 해당 이미지 데이터를 기초로 레이블링 파일을 생성할 수 있다. 일 실시예에서, 이미지 내 가축의 자세를 레이블링 하는 경우, 레이블(클래스)은 서 있는 돼지(Standing_Pig), 누워 있는 돼지(Lying_Pig), 겹쳐있는 돼지(Multiple_Pig), 견좌자세 돼지(Sitting_Pig), 구토 돼지(Vomiting_Pig), 설사 돼지(Diarrhea_Pig), 기침 돼지(Cough_Pig)를 포함할 수 있다. According to an embodiment of the present disclosure, the labeling
일 실시예에서, 레이블링 파일 생성부(209)는 추론 결과를 분석하여 결과가 일치한다고 판단된 각각의 이미지, 예를 들어 상기 제1 내지 제4 이미지에 포함된 돼지의 자세 이미지에 대해 해당 자세의 레이블로 레이블링할 수 있다. 설명하면, 서 있는 돼지 이미지 부분에 대해 서 있는 돼지라는 레이블링 파일을 생성하고, 견좌 돼지 이미지 부분에 대해서는 견좌 돼지라는 레이블링 파일을 각각 생성할 수 있다. 일 실시예에서, 레이블링 파일은 이미지 파일이 저장된 경로, 이미지가 저장된 폴더명, 이미지 파일명, 이미지의 크기 및 객체 정보 목록을 포함할 수 있으나 이에 한정되는 것은 아니다. 일 실시예에서, 객체 정보 목록은 레이블명과 바운드 박스(xmin, ymin, xmat ymax)를 의미할 수 있으나 이에 한정되는 것은 아니다. In one embodiment, the labeling
본 개시의 일 실시예에 의하면, 학습부(211)는 생성된 모델을 기초로 기계학습을 수행하여 이미지를 추론하는 역할 수행할 수 있다. 일 실시예에서, 학습부(211)는 새로운 학습 데이터, 즉 새롭게 레이블링된 이미지 데이터로 기계학습 모델을 업데이트할 수 있다. 학습부(211)는 인공신경망, 예를 들어, CNN(Convolutional Neural Network), RNN(Recurrent Neural Network), DBN(Deep Belief Network) 등 심층신경망(Deep Neural Network: DNN)을 포함할 수 있다. According to an embodiment of the present disclosure, the
본 개시의 일 실시예에 의하면 저장부(213)는 서버(140) 상에서 실행될 수 있는 각종 프로그램 및 관련 데이터 등이 저장된 임의의 저장 매체일 수 있다. 본 개시의 일 실시예에 의하면, 저장부(213)는 센서 데이터, 이미지 데이터 및 분석 모듈의 실행과 관련된 데이터들이 저장될 수 있다. 본 개시의 일 실시예에 의하면, 저장부(213)는 DRAM, SRAM, DDR, RAM, ROM, 자기디스크, 광 디스크, 플래시 메모리 등 다양한 형태의 휘발성 또는 비휘발성 메모리를 포함하도록 구성될 수 있다. According to an embodiment of the present disclosure, the
본 개시의 일 실시예에 의하면 통신부(215)는 이미지 레이블링 서버(140)가, 통신망(150)을 통해 외부와 통신할 수 있도록 지원할 수 있다. 본 개시의 일 실시예에 의하면, 통신부(215)는 소정의 프로토콜에 따라 통신망(150)으로부터 데이터를 수신할 수 있고, 통신망(150)을 통하여 이미지 레이블링 서버(140)로부터 외부로 데이터가 전송되도록 필요한 절차를 수행할 수 있다.According to an embodiment of the present disclosure, the
도 3은 본 개시의 일 실시예에 따라 이미지 레이블링 서버가 이미지 레이블링을 처리하는 흐름을 보여주는 예시적 동작 흐름도이다. 3 is an exemplary operation flowchart illustrating a flow in which an image labeling server processes image labeling according to an embodiment of the present disclosure.
본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 사전에 이미지 학습 데이터를 수집하고 데이터 레이블링 등의 학습 과정을 통해 분류 모델을 적어도 하나 생성할 수 있으며, 생성한 모델의 성능을 향상시키기 위해 학습 데이터의 추가 레이블링 작업을 수행할 수 있다. According to an embodiment of the present disclosure, the
도시된 바에 의하면, 단계(S302)에서, 이미지 레이블링 서버(140)는 소정의 다채널 이미지를 수신할 수 있다. 여기서 다채널 이미지 데이터란 동시간에 동일한 영역을 다른 위치에서 촬영한 이미지 데이터를 의미할 수 있다. 그런 다음, 단계(S304)에서, 이미지 레이블링 서버(140)는 수집한 다채널 이미지 데이터를 기계학습 기반으로 이미지 내 개별 가축의 자세를 추론할 수 있다. 본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 다채널 이미지 데이터에 대해 동시간대 촬영한 데이터를 하나의 데이터세트로 클러스터링 하고, 동일 데이터 세트에 속한 이미지 각각에 대해 개별 가축의 자세를 추론할 수 있다. 여기서 데이터세트란 동시간에 동일한 영역을 다른 위치에서 복수의 카메라(120a, 120b, ..., 120n) 각각에서 촬영한 다채널 이미지 데이터의 집합을 의미할 수 있다. 예를 들어, 이미지 레이블링 서버(140)는 네 대의 카메라(120a, 120b, 120c, 120d) 각각이 수집한 동시간에 동일한 영역을 다른 위치에서 촬영한 이미지 데이터에 대해 추론한 결과로서 제1 카메라에서 수집한 제1 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제2 카메라에서 수집한 제2 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제3 카메라에서 수집한 제3 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제4 카메라에서 수집한 제4 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 각 추론할 수 있다. As shown, in step S302, the
이후, 단계(S306)에서 이미지 레이블링 서버(140)는 동일 데이터세트에 속한 이미지들의 추론 결과를 비교분석할 수 있다. 예를 들어, 위 추론 결과를 비교분석하여 다채널 이미지의 추론 결과가 일치한다고 판단할 수 있다. Thereafter, in step S306 , the
만약, 추론 결과가 일치하는 경우, 이미지 레이블링 서버(140)는 해당 다채널 이미지 데이터를 기초로 레이블링 파일을 생성할 수 있다(단계(S308)). 이미지 레이블링 서버(140)는 새롭게 생성된 레이블링 파일을 새로운 학습 데이터로 하여 기계학습 분류 모델을 재학습시킬 수 있다. If the inference results match, the
만약, 추론 결과가 일치하지 않는 경우, 이미지 레이블링 서버(140)는 해당 데이터세트에 대해 크라우드 검증을 수행할 수 있다(단계(S312)). 일 실시예에서, 크라우드 검증이란 다수의 검증자로부터 특정 이미지 데이터세트에 대해 검증 결과, 즉 해당 이미지에 검출 대상이 있는지 및 검출 대상의 분류를 수동으로 레이블링한 결과를 수신하는 것을 의미할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 추론 결과가 일치하지 않는 데이터세트를 복수의 검증자 단말(130a, 130b, ... , 130n)로 전송하고, 다시 복수의 검증자 단말(130a, 130b, ... , 130n)로부터 검증 결과를 수신할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 추론 결과가 일치하지 않는 데이터세트, 예컨대 4개의 이미지를 검증자 단말(130a, 130b, ... , 130n)에 제공하고, 복수의 검증자 단말(130a, 130b, ... , 130n)로부터 검증 결과를 수신하여, 검증자 단말(130a, 130b, ... , 130n)로부터 수신한 결과가 일치하는지 여부를 판단할 수 있다. If the inference results do not match, the
본 개시의 일 실시예에 의하면, 단계(S314)에서, 이미지 레이블링 서버(140)는 검증자 단말(130a, 130b, ... , 130n)의 수를 조절할 수 있다. 일 실시예에서, 복수의 검증자 단말(130a, 130b, ... , 130n)로부터 검증 결과가 서로 일치하지 않은 경우, 이미지 레이블링 서버(140)는 검증을 의뢰하는 검증자 단말의 수를 늘릴 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 검증 결과가 일치할 때까지 검증자 단말의 수를 증가할 수 있고, 검증자 단말의 수가 임계치를 넘는 경우, 더이상 검증을 진행하지 않고 해당 이미지를 이용하지 않을 수 있다. 다른 실시예에서, 이미지 레이블링 서버(140)는 검증 결과가 동일할 때까지 검증자 단말의 수를 증가시킬 수 있고, 검증자 단말의 수가 임계치를 넘는 경우, 검증자 단말이 보낸 검증 결과 중 다수가 보낸 결과를 검증 결과로 간주하여, 해당 이미지에 대해 단계(S308)을 수행할 수 있다 According to an embodiment of the present disclosure, in step S314, the
다음으로, 단계(S316)에서, 이미지 레이블링 서버(140)는 올바른 레이블링 결과를 입력하는 검증자 단말에게 보상을 지급할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 각 검증자 단말이 검증한 결과를 기반으로 정산을 위한 포인트를 적립 및 차감할 수 있다. Next, in step S316 , the
도 4는 본 개시의 일 실시예에 따른 이미지 레이블링 서버의 학습 흐름을 보여주는 예시적 동작 흐름도이다. 4 is an exemplary operation flowchart illustrating a learning flow of an image labeling server according to an embodiment of the present disclosure.
단계(S401) 내지 단계(S409)는 이미지내 객체 인식을 위한 일반적인 기계학습 흐름과 유사하다. 단계(S401)에서 학습용 데이터세트가 준비되고, 학습용 데이터세트에 대해 1차 레이블링을 수행한다(S403). 일반적으로 기계학습 학습용 데이터세트 레이블링은, 즉 바운딩 박스 및 레이블 입력은 사람이 직접 수행하게 된다. 이후, 단계(S405)에서는 단계(S403)에서 준비한 학습용 데이터세트를 기초로 기계학습을 수행하여 학습 결과 모델을 생성하고, 단계(S407)에서는 실제 이미지 데이터세트를 입력받아, 해당 학습 결과 모델을 이용하여 실제 이미지 데이터세트에 객체 인식을 수행한다(단계(S409)). Steps S401 to S409 are similar to the general machine learning flow for object recognition in an image. A training dataset is prepared in step S401, and primary labeling is performed on the training dataset (S403). In general, the labeling of datasets for machine learning learning, that is, the input of bounding boxes and labels, is performed by humans. Thereafter, in step S405, machine learning is performed based on the training dataset prepared in step S403 to generate a learning result model, and in step S407, the actual image dataset is received and the corresponding learning result model is used. to perform object recognition on the actual image dataset (step S409).
본 개시의 일 실시예에 있어서, 단계(S411)에서는 다채널 이미지 데이터에 대해 기계학습을 수행한 객체 인식 결과, 즉 단계(S409)의 결과를 비교분석하여 인식결과의 정확도를 판단할 수 있다. 만약, 인식결과가 정확하다고 판단하는 경우, 해당 다채널 이미지 데이터를 학습데이터로 레이블링하여(단계(S413)), 기계학습 모델을 업데이트할 수 있다. In one embodiment of the present disclosure, in step S411, the object recognition result obtained by performing machine learning on multi-channel image data, that is, the result of step S409, may be compared and analyzed to determine the accuracy of the recognition result. If it is determined that the recognition result is correct, the multi-channel image data may be labeled as training data (step S413), and the machine learning model may be updated.
당업자라면 알 수 있듯이 본 개시는 본 명세서에서 기술된 예시에 한정되는 것이 아니라 본 개시의 범주를 벗어나지 않는 범위 내에서 다양하게 변형, 재구성 및 대체될 수 있다. 예를 들어, 본원에 기술된 다양한 기술들은 하드웨어 또는 소프트웨어, 또는 하드웨어와 소프트웨어의 조합에 의해 구현될 수 있다. 따라서, 본원에 따른 소프트웨어 안전성 분석을 위한 분석 머신의 특정한 양태나 부분은 범용 또는 전용 마이크로프로세서, 마이크로-컨트롤러 등에 의해 실행 가능한 하나 이상의 컴퓨터 프로그램으로 구현될 수 있다. 본 개시의 일 실시예에 따른 컴퓨터 프로그램은, 컴퓨터 프로세서 등에 의해 판독 가능한 저장 매체, 예컨대 EPROM, EEPROM, 플래시 메모리장치와 같은 비휘발성 메모리, 내장형 하드 디스크와 착탈식 디스크 같은 자기 디스크, 광자기 디스크, 및 CDROM 디스크 등을 포함한 다양한 유형의 저장 매체에 저장된 형태로 구현될 수 있다. 또한, 프로그램 코드(들)는 어셈블리어나 기계어로 구현될 수 있고, 전기 배선이나 케이블링, 광섬유, 또는 기타 임의의 다른 형태의 전송 매체를 통해 전송되는 형태로 구현될 수도 있다. As will be appreciated by those skilled in the art, the present disclosure is not limited to the examples described herein, and various modifications, reconstructions, and substitutions may be made without departing from the scope of the present disclosure. For example, the various techniques described herein may be implemented by hardware or software, or a combination of hardware and software. Accordingly, certain aspects or portions of the analysis machine for software safety analysis according to the present disclosure may be implemented as one or more computer programs executable by a general-purpose or dedicated microprocessor, micro-controller, or the like. A computer program according to an embodiment of the present disclosure includes a storage medium readable by a computer processor or the like, such as EPROM, EEPROM, nonvolatile memory such as a flash memory device, a magnetic disk such as an internal hard disk and a removable disk, a magneto-optical disk, and It may be implemented in a form stored in various types of storage media including a CDROM disk and the like. In addition, the program code(s) may be implemented in assembly language or machine language, and may be implemented in a form transmitted through electric wiring, cabling, optical fiber, or any other type of transmission medium.
본 명세서에서는, 예시적인 실시예에 대해 다양한 도면을 참조하여 주로 기술했지만, 다른 유사한 실시예들이 이용될 수 있다. 본 개시의 진정한 사상 및 범주에 속하는 모든 변형 및 변경을 이하의 특허청구범위에 의해 모두 포괄하고자 한다.Although exemplary embodiments have been primarily described herein with reference to various drawings, other similar embodiments may be utilized. All modifications and variations falling within the true spirit and scope of the present disclosure are intended to be embraced by the following claims.
110: NVR
120: 카메라
130: 검증자 단말
140: 이미지 레이블링 서버
150: 통신망110: NVR
120: camera
130: verifier terminal
140: image labeling server
150: communication network
Claims (10)
다채널 이미지 데이터를 수신하는 단계;
상기 다채널 이미지 데이터에 대해 동일한 시간 기준으로 데이터세트를 생성하고, 해당 데이터세트의 다채널 이미지 데이터 각각에 대해 기계학습 기반으로 이미지 내 개별 가축의 자세를 추론하는 단계;
상기 추론 결과를 비교분석하여 동일 데이터세트 내의 추론 결과가 일치하는지 여부를 비교판단하는 단계; 및
상기 동일 데이터세트 내의 추론 결과가 일치하는 경우, 상기 다채널 이미지 데이터에 대해 레이블링을 수행하는 단계
를 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법. A crowd validation-based multi-channel image learning data labeling method performed on a computer system, comprising:
receiving multi-channel image data;
generating a dataset based on the same time reference for the multi-channel image data, and inferring the posture of individual livestock in the image based on machine learning for each multi-channel image data of the corresponding dataset;
comparing and analyzing the inference results to compare and determine whether the inference results in the same dataset match; and
performing labeling on the multi-channel image data when the inference results in the same dataset match
A crowd validation-based multi-channel image training data labeling method comprising a.
상기 방법은
상기 동일 데이터세트 내의 추론 결과가 일치하지 않는 경우, 상기 동일 데이터세트에 포함된 이미지 데이터를 k개(k>1, k는 홀수)의 검증자 단말로 전송하고, 상기 k개의 검증자 단말로부터 상기 동일 데이터세트에 포함된 이미지 데이터의 검증 결과를 수신하여, 검증 결과가 일치하는지 여부를 판단하는 단계를 더 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법. According to claim 1,
the method
When the inference results in the same dataset do not match, the image data included in the same dataset is transmitted to k (k>1, k is an odd number) verifier terminals, and the k verifier terminals Crowd-verification-based multi-channel image learning data labeling method further comprising the step of receiving a verification result of the image data included in the same dataset, and determining whether the verification result is consistent.
상기 방법은
상기 검증 결과가 일치하는 경우, 상기 다채널 이미지 데이터에 대해 레이블링을 수행하는 단계를 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법. 3. The method of claim 2,
the method
and performing labeling on the multi-channel image data when the verification results match.
상기 방법은
상기 검증 결과가 일치하지 않는 경우, 상기 동일 데이터세트에 포함된 이미지 데이터를 m(m>k, m은 홀수)개의 검증자 단말로 전송하고, 상기 m개의 검증자 단말로부터 상기 동일 데이터세트에 포함된 이미지 데이터의 검증 결과를 수신하여, 검증 결과가 일치하는지 여부를 판단하는 단계를 더 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법. 4. The method of claim 3,
the method
When the verification results do not match, the image data included in the same dataset is transmitted to m (m>k, m is an odd number) number of validator terminals, and included in the same dataset from the m validator terminals. Crowd verification-based multi-channel image learning data labeling method further comprising the step of receiving the verification result of the image data, and determining whether the verification result is consistent.
상기 방법은 상기 다채널 이미지 데이터에 대해 레이블링한 새로운 학습 데이터를 기초로 기계학습 모델을 재학습시키는 단계를 더 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법. 3. The method of claim 2,
The method further comprises the step of retraining a machine learning model based on the new training data labeled for the multi-channel image data.
상기 방법은 상기 검증자 단말에 보상을 지급하는 단계를 더 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법. 4. The method of claim 3,
The method is a crowd-verification-based multi-channel image learning data labeling method further comprising the step of providing a reward to the verifier terminal.
복수의 다채널 이미지 데이터를 수신하도록 구성된 다채널 이미지 획득부;
상기 복수의 다채널 이미지 데이터 각각에 대해 기계학습 모델을 기초로 이미지에 포함된 객체를 추론하도록 구성된 다채널 이미지 추론부;
상기 추론한 결과를 비교분석하도록 구성된 다채널 이미지 추론 결과 비교분석부; 및
상기 복수의 다채널 이미지 데이터 각각에 대해 레이블링 파일을 생성하도록 구성된 레이블링 파일 생성부
를 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 장치.A crowd validation-based multi-channel image learning data labeling device, comprising:
a multi-channel image acquisition unit configured to receive a plurality of multi-channel image data;
a multi-channel image inference unit configured to infer an object included in an image based on a machine learning model for each of the plurality of multi-channel image data;
a multi-channel image inference result comparison and analysis unit configured to comparatively analyze the inferred result; and
A labeling file generating unit configured to generate a labeling file for each of the plurality of multi-channel image data
Crowd validation-based multi-channel image learning data labeling device comprising a.
상기 추론한 결과를 비교분석한 결과가 일치하지 않은 경우, 상기 복수의 다채널 이미지 데이터를 복수의 검증단말로 전송하고, 상기 복수의 검증자 단말로부터 검증 결과를 수신하여 검증자로부터의 검증 결과가 일치하는지 여부를 판단하도록 구성된 크라우드 검증부를 더 포함하는 크라우드 검증 기반 다채널 이미지 학습데이터 레이블링 장치.9. The method of claim 8,
If the results of comparison and analysis of the inferred results do not match, the plurality of multi-channel image data is transmitted to a plurality of verification terminals, the verification results are received from the plurality of verifier terminals, and the verification results from the verifiers are Crowd verification-based multi-channel image training data labeling apparatus further comprising a crowd verification unit configured to determine whether they match.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200064677A KR102423844B1 (en) | 2020-05-29 | 2020-05-29 | Method and apparatus for labeling multi-channel image training data based on crowd verification |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200064677A KR102423844B1 (en) | 2020-05-29 | 2020-05-29 | Method and apparatus for labeling multi-channel image training data based on crowd verification |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210147443A true KR20210147443A (en) | 2021-12-07 |
KR102423844B1 KR102423844B1 (en) | 2022-07-22 |
Family
ID=78867936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200064677A KR102423844B1 (en) | 2020-05-29 | 2020-05-29 | Method and apparatus for labeling multi-channel image training data based on crowd verification |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102423844B1 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013120556A (en) * | 2011-12-08 | 2013-06-17 | Kddi Corp | Object attribute estimation device and video plotting device |
WO2019021369A1 (en) * | 2017-07-25 | 2019-01-31 | 三菱電機株式会社 | Data analysis device |
KR20190124559A (en) * | 2018-04-26 | 2019-11-05 | 주식회사 슈퍼브에이아이 | Computing device and artificial intelligence based image processing service system using the same |
JP2019211969A (en) * | 2018-06-04 | 2019-12-12 | オリンパス株式会社 | Learning management device, learning management server, and learning management method |
-
2020
- 2020-05-29 KR KR1020200064677A patent/KR102423844B1/en active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013120556A (en) * | 2011-12-08 | 2013-06-17 | Kddi Corp | Object attribute estimation device and video plotting device |
WO2019021369A1 (en) * | 2017-07-25 | 2019-01-31 | 三菱電機株式会社 | Data analysis device |
KR20190124559A (en) * | 2018-04-26 | 2019-11-05 | 주식회사 슈퍼브에이아이 | Computing device and artificial intelligence based image processing service system using the same |
JP2019211969A (en) * | 2018-06-04 | 2019-12-12 | オリンパス株式会社 | Learning management device, learning management server, and learning management method |
Non-Patent Citations (1)
Title |
---|
Ezatzadeh, Shabnam and Keyvanpour, Mohammad. ViFa: an analytical framework for vision-based fall detection in a surveillance environment. Multimedia Tools and Applications. 78. 2019.5.28.* * |
Also Published As
Publication number | Publication date |
---|---|
KR102423844B1 (en) | 2022-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180189609A1 (en) | Training data for machine-based object recognition | |
CN109145781B (en) | Method and apparatus for processing image | |
CN111598190B (en) | Training method of image target recognition model, image recognition method and device | |
CN105518711A (en) | In-vivo detection method, in-vivo detection system, and computer program product | |
CN110427819B (en) | Method for identifying PPT frame in image and related equipment | |
KR20200087310A (en) | System and method for generation and augmentation of annotation learning data for deep learning in artificial intelligence picture reading | |
US20220237917A1 (en) | Video comparison method and apparatus, computer device, and storage medium | |
US20180197287A1 (en) | Process of using machine learning for cannabis plant health diagnostics | |
CN112699758B (en) | Sign language translation method, device, computer equipment and medium for dynamic gesture recognition | |
CN111291773A (en) | Feature identification method and device | |
CN115546692A (en) | Remote education data acquisition and analysis method, equipment and computer storage medium | |
Rusdi et al. | Student attendance using face recognition technology | |
CN112529548B (en) | Online education platform cloud resource management system | |
KR102423844B1 (en) | Method and apparatus for labeling multi-channel image training data based on crowd verification | |
JPWO2021079792A5 (en) | ||
EP3973525A1 (en) | Method of delivering webinars with certified participation | |
CN110569707A (en) | identity recognition method and electronic equipment | |
CN108021353B (en) | Device, method, equipment and storage medium for generating description document of software product | |
CN116546304A (en) | Parameter configuration method, device, equipment, storage medium and product | |
CN112101303B (en) | Image data processing method and device and computer readable storage medium | |
CN112580578A (en) | Binocular living camera face ranging method and system | |
CN114764948A (en) | Living body detection method, living body detection device, living body detection equipment and storage medium | |
CN112270313A (en) | Online claims settlement method, device, equipment and storage medium | |
CN112364736A (en) | Dynamic facial expression recognition method, device and equipment | |
KR20230105814A (en) | Apparatus and method for generating images using generative adversarial network and quality filtering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |