KR20210147443A - Method and apparatus for labeling multi-channel image training data based on crowd verification - Google Patents

Method and apparatus for labeling multi-channel image training data based on crowd verification Download PDF

Info

Publication number
KR20210147443A
KR20210147443A KR1020200064677A KR20200064677A KR20210147443A KR 20210147443 A KR20210147443 A KR 20210147443A KR 1020200064677 A KR1020200064677 A KR 1020200064677A KR 20200064677 A KR20200064677 A KR 20200064677A KR 20210147443 A KR20210147443 A KR 20210147443A
Authority
KR
South Korea
Prior art keywords
channel image
labeling
image
verification
image data
Prior art date
Application number
KR1020200064677A
Other languages
Korean (ko)
Other versions
KR102423844B1 (en
Inventor
박지환
천선일
Original Assignee
(주)씽크포비엘
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)씽크포비엘 filed Critical (주)씽크포비엘
Priority to KR1020200064677A priority Critical patent/KR102423844B1/en
Publication of KR20210147443A publication Critical patent/KR20210147443A/en
Application granted granted Critical
Publication of KR102423844B1 publication Critical patent/KR102423844B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Abstract

According to an embodiment of the present invention, it is possible to provide a method and device for labeling learning data capable of efficiently and quickly improving an image inference machine learning model. Disclosed is the method for labeling multi-channel image learning data based on crowd verification which is running on a computer system. The disclosed method comprises: a step of receiving multi-channel image data; a step of generating a dataset based on the same time reference for the multi-channel image data, and inferring posture of individual livestock in an image based on machine learning for each multi-channel image data of corresponding dataset; a step of comparing and analyzing an inference result to compare and determine whether the inference result in the same dataset matches; and a step of performing labeling on the multi-channel image data when the inference result in the same dataset matches.

Description

크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법 및 장치{Method and apparatus for labeling multi-channel image training data based on crowd verification}Crowd verification-based multi-channel image training data labeling method and apparatus {Method and apparatus for labeling multi-channel image training data based on crowd verification}

본 개시는 학습 데이터 레이블링 방법으로서, 보다 구체적으로 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법 및 장치에 관한 것이다. The present disclosure relates to a training data labeling method, and more particularly, to a crowd validation-based multi-channel image training data labeling method and apparatus.

인공지능을 학습시키기 위해서는 학습 데이터가 필요하다. 유능한 AI를 만들기 위해 양질의 학습 데이터가 필요한데, AI에 학습시키려면 해당 데이터를 원형 그대로 사용하는 것이 아니라 기계가 학습할 수 있는 형태로 부분 가공해야 할 필요가 있다. 이미지 인식 분야에 있어서, 이미지내 객체 인식을 위해서 AI 학습용 레이블링, 즉 바운딩 박스와 레이블 입력, 및 학습 데이터세트가 필요한데, 기존에는 사람이 직접 레이블링을 수행하여 학습 데이터세트를 준비해야 했기때문에 학습 데이터를 생성하는 업무는 비용이 높고 시간이 상당히 필요했다. Learning data is needed to learn artificial intelligence. To make a competent AI, high-quality learning data is needed, and in order to train the AI, it is necessary to partially process the data into a form that can be learned by a machine, rather than using the data as it is. In the field of image recognition, labeling for AI training, that is, a bounding box and label input, and a training dataset are required for object recognition within an image. The task to create was expensive and time consuming.

근래들어, 이러한 레이블링 및 학습, 추론(inference)의 주기를 반복적으로 수행하여 모델의 정확도를 높여가는 기법이 개발되고 있으며, 이는 자동화된 솔루션 및 플랫폼을 활용하여 사람이 수행해야 할 부분을 줄이고 학습과정을 최대한 자동화하여 빠른 시간에 정확도 높은 모델을 준비할 수 있도록 도움을 준다. 그러나, 현재까지 공개된 학습 데이터 레이블링 자동화 기법은 여전히 사람이 수행해야 하는 부분이 많다. 예를 들어, 학습을 완료한 기존 이미지 데이터 세트를 복사하여 추론하고, 사람이 추론 결과, 레이블 결과, 원본의 레이블 결과를 비교하고 확인하여 영상에 추가로 인식된 바운딩 박스와 레이블을 입력해야 한다. 또한, 추가로 인식할 객체는 여전히 기존의 레이블링 작업이 필요하다. Recently, a technique to increase the accuracy of a model by repeatedly performing such a cycle of labeling, learning, and inference has been developed, which reduces the part that needs to be performed by humans by using an automated solution and platform and reduces the learning process It helps to prepare a high-accuracy model in a short time by automating it as much as possible. However, the training data labeling automation technique that has been disclosed so far still has a lot of work to be performed by humans. For example, inference is made by copying an existing image data set that has completed training, and a human needs to input an additional recognized bounding box and label into the image by comparing and confirming the inference result, the label result, and the original label result. In addition, the object to be additionally recognized still requires the existing labeling operation.

즉, 새로운 이미지를 학습시키기 위해서는 기존과 동일하게 수작업 레이블링 또는 기존의 모델에서 추론한 결과를 모두 확인해야 하고, 추가로 인식할 객체의 레이블링은 기존과 동일하게 수작업 레이블링이 필요하기 때문에 여전히 많은 시간과 노력을 필요로 하고 있다. In other words, in order to train a new image, it is necessary to check all the results of manual labeling or inferred from the existing model as before, and the labeling of additional objects to be recognized still requires a lot of time and effort because manual labeling is required as before. It requires effort.

따라서, 이미지 데이터 기반의 정확도 높은 추론 모델의 효과적이고 효율적인 생성 방법이 요구되고 있다. Therefore, there is a need for an effective and efficient method of generating an inference model with high accuracy based on image data.

본 개시의 일 특징에 따르면, 컴퓨터 시스템 상에서 수행되는, 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법이 제공된다. 상기 방법은 다채널 이미지 데이터를 수신하는 단계; 상기 다채널 이미지 데이터에 대해 동일한 시간 기준으로 데이터세트를 생성하고, 해당 데이터세트의 다채널 이미지 데이터 각각에 대해 기계학습 기반으로 이미지 내 개별 가축의 자세를 추론하는 단계; 상기 추론 결과를 비교분석하여 동일 데이터세트 내의 추론 결과가 일치하는지 여부를 비교판단하는 단계; 및 상기 동일 데이터세트 내의 추론 결과가 일치하는 경우, 상기 다채널 이미지 데이터에 대해 레이블링을 수행하는 단계를 포함할 수 있다. According to one aspect of the present disclosure, there is provided a method for labeling data, which is performed on a computer system, based on crowd validation, for multi-channel image learning. The method includes receiving multi-channel image data; generating a dataset based on the same time reference for the multi-channel image data, and inferring the posture of individual livestock in the image based on machine learning for each multi-channel image data of the corresponding dataset; comparing and analyzing the inference results to compare and determine whether the inference results in the same dataset match; and performing labeling on the multi-channel image data when the inference results in the same dataset match.

본 개시의 일 실시예에 의하면, 상기 방법은 상기 동일 데이터세트 내의 추론 결과가 일치하지 않는 경우, 상기 동일 데이터세트에 포함된 이미지 데이터를 k개(k>1, k는 홀수)의 검증자 단말로 전송하고, 상기 k개의 검증자 단말로부터 상기 동일 데이터세트에 포함된 이미지 데이터의 검증 결과를 수신하여, 검증 결과가 일치하는지 여부를 판단하는 단계를 더 포함할 수 있다. According to an embodiment of the present disclosure, in the method, if the inference results in the same dataset do not match, k number of image data included in the same dataset (k>1, k is an odd number) verifier terminals The method may further include the step of transmitting to , receiving verification results of the image data included in the same dataset from the k verifier terminals, and determining whether the verification results match.

본 개시의 일 실시예에 의하면, 상기 방법은 상기 검증 결과가 일치하는 경우, 상기 다채널 이미지 데이터에 대해 레이블링을 수행하는 단계를 포함할 수 있다. According to an embodiment of the present disclosure, the method may include performing labeling on the multi-channel image data when the verification results match.

본 개시의 일 실시예에 의하면, 상기 방법은 상기 검증 결과가 일치하지 않는 경우, 상기 동일 데이터세트에 포함된 이미지 데이터를 m(m>k, m은 홀수)개의 검증자 단말로 전송하고, 상기 m개의 검증자 단말로부터 상기 동일 데이터세트에 포함된 이미지 데이터의 검증 결과를 수신하여, 검증 결과가 일치하는지 여부를 판단하는 단계를 더 포함할 수 있다. According to an embodiment of the present disclosure, when the verification results do not match, the method transmits image data included in the same dataset to m (m>k, m is an odd number) number of verifier terminals, and The method may further include receiving verification results of image data included in the same dataset from m verifier terminals, and determining whether the verification results match.

본 개시의 일 실시예에 의하면, 상기 방법은 상기 다채널 이미지 데이터에 대해 레이블링한 새로운 학습 데이터를 기초로 기계학습 모델을 재학습시키는 단계를 더 포함할 수 있다. According to an embodiment of the present disclosure, the method may further include retraining the machine learning model based on new training data labeled with respect to the multi-channel image data.

본 개시의 일 실시예에 의하면, 상기 방법은 상기 검증자 단말에 보상을 지급하는 단계를 더 포함할 수 있다. According to an embodiment of the present disclosure, the method may further include paying a reward to the verifier terminal.

본 개시의 다른 특징에 의하면, 컴퓨터에 의해 실행 가능한, 하나 이상의 컴퓨터 판독가능 명령이 수록된 컴퓨터 판독가능 기록매체로서, 상기 하나 이상의 컴퓨터 판독가능 명령은, 상기 컴퓨터에 의해 실행되는 경우, 상기 컴퓨터로 하여금, 전술한 방법 중 어느 하나의 방법을 수행하게 하는 컴퓨터 판독가능 기록매체가 제공된다. According to another feature of the present disclosure, there is provided a computer-readable recording medium containing one or more computer-readable instructions executable by a computer, wherein the one or more computer-readable instructions, when executed by the computer, cause the computer to , a computer-readable recording medium for performing any one of the methods described above is provided.

본 개시의 다른 특징에 의하면, 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 장치가 제공된다. 상기 장치는 복수의 다채널 이미지 데이터를 수신하도록 구성된 다채널 이미지 획득부; 상기 복수의 다채널 이미지 데이터 각각에 대해 기계학습 모델을 기초로 이미지에 포함된 객체를 추론하도록 구성된 다채널 이미지 추론부; 상기 추론한 결과를 비교분석하도록 구성된 다채널 이미지 추론 결과 비교분석부; 및 상기 복수의 다채널 이미지 데이터 각각에 대해 레이블링 파일을 생성하도록 구성된 레이블링 파일 생성부를 포함할 수 있다. According to another feature of the present disclosure, a crowd-verification-based multi-channel image learning data labeling apparatus is provided. The apparatus includes: a multi-channel image acquisition unit configured to receive a plurality of multi-channel image data; a multi-channel image inference unit configured to infer an object included in an image based on a machine learning model for each of the plurality of multi-channel image data; a multi-channel image inference result comparison and analysis unit configured to compare and analyze the inferred result; and a labeling file generator configured to generate a labeling file for each of the plurality of multi-channel image data.

본 개시의 일 실시예에 의하면, 상기 장치는 상기 추론한 결과를 비교분석한 결과가 일치하지 않은 경우, 상기 복수의 다채널 이미지 데이터를 복수의 검증단말로 전송하고, 상기 복수의 검증자 단말로부터 검증 결과를 수신하여 검증자로부터의 검증 결과가 일치하는지 여부를 판단하도록 구성된 크라우드 검증부를 더 포함할 수 있다. According to an embodiment of the present disclosure, the device transmits the plurality of multi-channel image data to a plurality of verification terminals when the results of comparative analysis of the inferred results do not match, and transmits the plurality of multi-channel image data to the plurality of verification terminals. It may further include a crowd verification unit configured to receive the verification result and determine whether the verification result from the verifier is consistent.

본 개시의 일 실시예에 의하면, 상기 장치는 상기 다채널 이미지 데이터에 대해 레이블링한 새로운 학습 데이터를 기초로 기계학습 모델을 재학습시키는 학습부를 더 포함할 수 있다. According to an embodiment of the present disclosure, the apparatus may further include a learning unit for re-learning the machine learning model based on the new training data labeled with respect to the multi-channel image data.

본 개시의 실시예에 따르면, 효율적이고 신속하게 이미지 추론 기계학습 모델을 개선할 수 있는 학습 데이터 레이블링 방법 및 장치를 제공할 수 있다. According to an embodiment of the present disclosure, it is possible to provide a training data labeling method and apparatus capable of efficiently and quickly improving an image inference machine learning model.

본 개시의 실시예에 따르면, 학습 데이터가 완벽히 준비되지 않은 상태에서도 다수의 크라우드 검증자를 통해 자동화된 플랫폼 기반에서 학습 데이터를 생성 및 검증할 수 있는 학습 데이터 레이블링 방법 및 장치를 제공할 수 있다. According to an embodiment of the present disclosure, it is possible to provide a training data labeling method and apparatus capable of generating and verifying training data based on an automated platform through a plurality of crowd validators even when the training data is not completely prepared.

본 개시의 일 실시예에 따르면, 복수의 다채널 이미지를 이용하여 새로운 이미지의 추론 결과를 활용하여 자동화된 플랫폼 기반으로 이미지 추론 기계학습 모델을 개선할 수 있는 학습 데이터 레이블링 방법 및 장치를 제공할 수 있다. According to an embodiment of the present disclosure, it is possible to provide a learning data labeling method and apparatus capable of improving an image inference machine learning model based on an automated platform by using an inference result of a new image using a plurality of multi-channel images. have.

이미지 추론 기계학습 모델을 개선함에 있어 레이블링 작업은 현실적으로 가장 시간과 비용이 많이 소요되는 파트 중 하나이므로, 자동화된 플랫폼 기반으로 레이블링 작업의 효율을 증가시키는 것은 이미지 추론 기계학습 모델을 매우 효과적으로 개선할 수 있다. In improving the image inference machine learning model, the labeling task is one of the most time-consuming and expensive parts in reality, so increasing the efficiency of the labeling task based on an automated platform can very effectively improve the image inference machine learning model. have.

도 1은 본 개시의 일 실시예에 따른 크라우드 기반 다채널 이미지 레이블링 시스템의 전체 구성을 개략적으로 도시한 도면이다.
도 2는 본 개시의 일 실시예에 따른 도 1의 이미지 레이블링 서버의 예시적 기능 구성을 도시한 기능 블록도이다.
도 3은 본 개시의 일 실시예에 따라 이미지 레이블링 서버가 이미지 레이블링을 처리하는 흐름을 보여주는 예시적 동작 흐름도이다.
도 4는 본 개시의 일 실시예에 따른 이미지 레이블링 서버의 학습 흐름을 보여주는 예시적 동작 흐름도이다.
1 is a diagram schematically illustrating an overall configuration of a crowd-based multi-channel image labeling system according to an embodiment of the present disclosure.
2 is a functional block diagram illustrating an exemplary functional configuration of the image labeling server of FIG. 1 according to an embodiment of the present disclosure.
3 is an exemplary operation flowchart illustrating a flow in which an image labeling server processes image labeling according to an embodiment of the present disclosure.
4 is an exemplary operation flowchart illustrating a learning flow of an image labeling server according to an embodiment of the present disclosure.

이하, 첨부 도면을 참조하여 본 개시의 실시예에 관하여 상세히 설명한다. 이하에서는, 본 개시의 요지를 불필요하게 흐릴 우려가 있다고 판단되는 경우, 이미 공지된 기능 및 구성에 관한 구체적인 설명을 생략한다. 또한, 이하에서 설명하는 내용은 어디까지나 본 개시의 일 실시예에 관한 것일 뿐 본 개시가 이로써 제한되는 것은 아님을 알아야 한다.Hereinafter, embodiments of the present disclosure will be described in detail with reference to the accompanying drawings. Hereinafter, when it is determined that there is a risk of unnecessarily obscuring the subject matter of the present disclosure, detailed descriptions of already known functions and configurations will be omitted. In addition, it should be understood that the contents described below are only related to one embodiment of the present disclosure, and the present disclosure is not limited thereto.

본 명세서에서 사용되는 용어는 단지 특정한 실시예를 설명하기 위해 사용되는 것으로 본 개시를 한정하려는 의도에서 사용된 것이 아니다. 예를 들면, 단수로 표현된 구성요소는 문맥상 명백하게 단수만을 의미하지 않는다면 복수의 구성요소를 포함하는 개념으로 이해되어야 한다. 또한, 본 개시의 명세서에서, '포함하다' 또는 '가지다' 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것일 뿐이고, 이러한 용어의 사용에 의해 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 배제하려는 것은 아니다.The terms used herein are used only to describe specific embodiments and are not intended to limit the present disclosure. For example, an element expressed in a singular should be understood as a concept including a plurality of elements unless the context clearly means only the singular. In addition, in the specification of the present disclosure, terms such as 'comprise' or 'have' are only intended to designate that the features, numbers, steps, operations, components, parts, or combinations thereof described in the specification exist, and such The use of the term is not intended to exclude the possibility of the presence or addition of one or more other features or numbers, steps, operations, components, parts, or combinations thereof.

본 명세서에 기재된 실시예에 있어서 '블록' 또는 '부'는 적어도 하나의 기능이나 동작을 수행하는 기능적 부분을 의미하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 '블록' 또는 '부'는, 특정한 하드웨어로 구현될 필요가 있는 '블록' 또는 '부'를 제외하고는, 적어도 하나의 소프트웨어 모듈로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.In the embodiments described herein, a 'block' or 'unit' means a functional part that performs at least one function or operation, and may be implemented as hardware or software, or a combination of hardware and software. In addition, the plurality of 'blocks' or 'units' may be integrated into at least one software module and implemented with at least one processor, except for 'blocks' or 'units' that need to be implemented with specific hardware. .

덧붙여, 달리 정의되지 않는 한 기술적 또는 과학적인 용어를 포함하여, 본 명세서에서 사용되는 모든 용어들은 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의된 용어들은, 관련 기술의 문맥상 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 개시의 명세서에서 명백하게 달리 정의하지 않는 한 과도하게 제한 또는 확장하여 해석되지 않는다는 점을 알아야 한다.In addition, unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this disclosure belongs. It should be noted that commonly used terms defined in the dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related art, and should not be construed as unduly limited or expanded unless explicitly defined otherwise in the specification of the present disclosure. should know

이하, 첨부된 도면을 참조하여, 본 개시의 실시예에 대해 구체적으로 설명하기로 한다.Hereinafter, with reference to the accompanying drawings, an embodiment of the present disclosure will be described in detail.

도 1은 본 개시의 일 실시예에 따른 크라우드 기반 다채널 이미지 레이블링 시스템(100)의 전체 구성을 개략적으로 도시한 도면이다. 도시된 바에 의하면, 크라우드 기반 다채널 이미지 레이블링 시스템은, 복수 개의 카메라(120a, 120b, ..., 120n), 복수 개의 검증자 단말(130a, 130b, ..., 130n), 이미지 레이블링 서버(140), 통신망(150)를 포함할 수 있다. 1 is a diagram schematically illustrating an overall configuration of a crowd-based multi-channel image labeling system 100 according to an embodiment of the present disclosure. As shown, the crowd-based multi-channel image labeling system includes a plurality of cameras (120a, 120b, ..., 120n), a plurality of verifier terminals (130a, 130b, ..., 130n), an image labeling server ( 140), and the communication network 150 may be included.

본 개시의 일 실시예에 의하면, 카메라(120a, 120b, ..., 120n)는 축산 농가에서 관리하는 가축의 모습을 촬영하기 위한 것으로서 유선 또는 무선 통신 기능을 구비한 이미지 촬영 카메라, 동영상 촬영 카메라, CCTV 카메라 등 임의의 전자 장치일 수 있다.According to an embodiment of the present disclosure, the cameras (120a, 120b, ..., 120n) are for photographing the appearance of livestock managed by the livestock farm, an image photographing camera, a video recording camera having a wired or wireless communication function , may be any electronic device such as a CCTV camera.

본 개시의 일 실시예에 의하면, 카메라(120a, 120b, ..., 120n)는 가축 자체의 이미지, 가축의 걸음 걸이 영상, 수면 영상, 움직임 영상, 섭취한 사료의 양, 견좌 자세 영상, 배설 영상, 토사물 영상, 축사의 청소 상태 등을 촬영할 수 있다.According to an embodiment of the present disclosure, the cameras 120a, 120b, ..., 120n are images of livestock themselves, gait images of livestock, sleep images, motion images, amount of feed ingested, shoulder posture image, excretion You can shoot video, vomit video, and the cleaning status of the livestock.

본 개시의 일 실시예에 의하면, 카메라(120a, 120b, ..., 120n)는 녹화된 이미지 데이터를 네트워크 비디오 레코더(Network Video Recorder: NVR:110)에 저장하고, 통신망(150)을 통해 전송할 수 있다. 본 도면에 도시된 바에 의하면, 크라우드 기반 다채널 이미지 레이블링 시스템(100)은, 네 개의 카메라(120a, 120b, 120c, 120d)를 갖는 것으로 도시되어 있으나 본 개시가 이로써 제한되는 것은 아니다. According to an embodiment of the present disclosure, the cameras 120a, 120b, ..., 120n store recorded image data in a network video recorder (NVR:110), and transmit the recorded image data through the communication network 150 . can As shown in this figure, the crowd-based multi-channel image labeling system 100 is illustrated as having four cameras 120a, 120b, 120c, and 120d, but the present disclosure is not limited thereto.

본 개시의 일 실시예에 의하면, 카메라(120a, 120b, ..., 120n)는 동일한 공간을 촬영할 수 있다. 설명하면, 도 1에 도시된 바와 같이, 하나의 축사에 복수 개의 카메라, 예를 들어 각 모서리에 4개의 카메라가 설치되어 축사 전체를 여러 위치에서 각각 촬영할 수 있다. According to an embodiment of the present disclosure, the cameras 120a, 120b, ..., 120n may photograph the same space. To explain, as shown in FIG. 1 , a plurality of cameras, for example, four cameras at each corner, are installed in one barn, so that the entire barn can be photographed at various locations.

본 개시의 일 실시예에 의하면, 복수의 검증자 단말(130a, 130b, ..., 130n) 각각은, 크라우드 검증을 수행하는 각 검증자가 보유한 통신 가능 단말일 수 있다. 본 개시의 일 실시예에 의하면, 복수의 검증자 단말(130a, 130b, ..., 130n) 각각은, 예컨대 검증자의 휴대 전화, 스마트폰, 태블릿 PC, 데스크탑, 랩탑 등 다양한 유형의 전자 단말일 수 있다. 검증자는, 자신의 검증자 단말(130a, 130b, ..., 130n)을 이용해서 통신망(150)을 통해 서버(140) 등과 통신하여, 각종 정보를 제공하거나 획득할 수 있다. According to an embodiment of the present disclosure, each of the plurality of verifier terminals 130a, 130b, ..., 130n may be a communication-capable terminal possessed by each verifier performing crowd verification. According to an embodiment of the present disclosure, each of the plurality of verifier terminals 130a, 130b, ..., 130n is, for example, various types of electronic terminals such as a mobile phone, a smartphone, a tablet PC, a desktop, and a laptop of the verifier. can The verifier communicates with the server 140 through the communication network 150 using his/her verifier terminals 130a, 130b, ..., 130n to provide or obtain various types of information.

본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 카메라(120a, 120b, ..., 120n)로부터 이미지 데이터를 송신받아 수집한 이미지 데이터를 기반으로 이미지를 추론할 수 있다. 본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 수집한 이미지 데이터를 기초로 개별 가축의 자세를 매핑할 수 있다. 본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 복수의 카메라(120a, 120b, ..., 120n) 각각이 수집한 이미지 데이터를 동시간대 촬영한 데이터를 하나의 세트로 클러스터링 하고, 동일 세트에 속한 이미지를 각각 추론하여 분석 결과를 비교할 수 있다. According to an embodiment of the present disclosure, the image labeling server 140 may receive image data from the cameras 120a, 120b, ..., 120n and infer an image based on the collected image data. According to an embodiment of the present disclosure, the image labeling server 140 may map the postures of individual livestock based on the collected image data. According to an embodiment of the present disclosure, the image labeling server 140 clusters the image data collected by each of the plurality of cameras 120a, 120b, ..., 120n into one set of data captured at the same time, The analysis results can be compared by inferring each image belonging to the same set.

표 1은 이미지 레이블링 서버(140)에서 카메라(120a, 120b, ..., 120n)로부터 이미지 데이터를 송신받아 수집한 이미지 데이터를 추론한 결과를 예시적으로 나타내는 표이다. Table 1 is a table exemplarily showing the result of inferring the image data collected by receiving the image data from the cameras 120a, 120b, ..., 120n from the image labeling server 140 .

번호number 시간hour 카메라
번호
camera
number
분석 결과Analysis
1One 2020-03-24 14:04:322020-03-24 14:04:32 1One [{“label”:“Standing_Pig”, “bndbox”:{“xmin”:54, “ymin”:46, “xmax”:128, “ymax”:241}}, {“label”:“Sitting_Pig”, “bndbox”:{“xmin”:564, “ymin”:80, “xmax”:945, “ymax”:312}}][{“label”:“Standing_Pig”, “bndbox”:{“xmin”:54, “ymin”:46, “xmax”:128, “ymax”:241}}, {“label”:“Sitting_Pig”, “bndbox”:{“xmin”:564, “ymin”:80, “xmax”:945, “ymax”:312}}] 22 2020-03-24 14:04:322020-03-24 14:04:32 22 [{“label”:“Standing_Pig”, “bndbox”:{“xmin”:68, “ymin”:86, “xmax”:382, “ymax”:514}}, {“label”:“Lying_Pig”, “bndbox”:{“xmin”:165, “ymin”:169, “xmax”:255, “ymax”:324}}][{“label”:“Standing_Pig”, “bndbox”:{“xmin”:68, “ymin”:86, “xmax”:382, “ymax”:514}}, {“label”:“Lying_Pig”, “bndbox”:{“xmin”:165, “ymin”:169, “xmax”:255, “ymax”:324}}] 33 2020-03-24 14:04:322020-03-24 14:04:32 33 [{“label”:“Standing_Pig”, “bndbox”:{“xmin”:272, “ymin”:154, “xmax”:365, “ymax”:297}}, {“label”:“Sitting_Pig”, “bndbox”:{“xmin”:457, “ymin”:134, “xmax”:631, “ymax”:246}}][{“label”:“Standing_Pig”, “bndbox”:{“xmin”:272, “ymin”:154, “xmax”:365, “ymax”:297}}, {“label”:“Sitting_Pig”, “bndbox”:{“xmin”:457, “ymin”:134, “xmax”:631, “ymax”:246}}] 44 2020-03-24 14:04:322020-03-24 14:04:32 44 [{“label”:“Standing_Pig”, “bndbox”:{“xmin”:1729, “ymin”:232, “xmax”:1822, “ymax”:361}}, {“label”:“Sitting_Pig”, “bndbox”:{“xmin”:1488, “ymin”:173, “xmax”:1596, “ymax”:291}}][{“label”:“Standing_Pig”, “bndbox”:{“xmin”:1729, “ymin”:232, “xmax”:1822, “ymax”:361}}, {“label”:“Sitting_Pig”, “bndbox”:{“xmin”:1488, “ymin”:173, “xmax”:1596, “ymax”:291}}]

본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 일정한 주기로, 예컨대 1초마다 복수의 카메라(120a, 120b, ..., 120n)로부터 이미지를 수집하여 획득한 새로운 이미지를 대상으로 주기적으로 이미지를 분석하여 이미지에 포함된 가축의 정보를 기계학습 기반으로 추론할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 2020-03-24 14:04:32 시간에 카메라 1 내지 4에서 촬영된 이미지에 대해 기계학습 모델을 통해 분석하여 해당 이미지에 포함된 가축의 자세를 추론할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)가 다채널 동시간대 즉, 매 1초에 4개의 채널의 이미지를 수신하는 경우, 이미지 레이블링 서버(140)는 초당 4개의 이미지로 된 세트의 새로운 이미지를 대상으로 추론을 수행할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 네 대의 카메라(120a, 120b, 120c, 120d) 각각이 수집한 동일한 시간대의 이미지 데이터에 대해, 제1 카메라에서 수집한 제1 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제2 카메라에서 수집한 제2 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제3 카메라에서 수집한 제3 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제4 카메라에서 수집한 제4 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론할 수 있다. According to an embodiment of the present disclosure, the image labeling server 140 collects images from a plurality of cameras 120a, 120b, ..., 120n at a constant cycle, for example, every second, periodically targeting a new image acquired By analyzing the image, information on livestock included in the image can be inferred based on machine learning. In one embodiment, the image labeling server 140 analyzes the images taken by cameras 1 to 4 at the time of 2020-03-24 14:04:32 through a machine learning model to determine the posture of the livestock included in the image can be inferred. In one embodiment, when the image labeling server 140 receives images of 4 channels in a multi-channel time zone, that is, every 1 second, the image labeling server 140 processes a new set of 4 images per second. Inference can be performed on the target. In one embodiment, the image labeling server 140 for the image data of the same time period collected by each of the four cameras (120a, 120b, 120c, 120d), a standing pig in the first image collected by the first camera It is inferred that there is one pig, one pig sitting, inferred that there is one standing pig and one pig sitting in the second image collected from the second camera, and in the third image collected by the third camera, there is one pig sitting. It can be inferred that there is one standing pig and one sitting pig, and that there are one standing pig and one sitting pig in the fourth image collected by the fourth camera.

본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 복수의 카메라(120a, 120b, ..., 120n) 각각이 수집한 이미지 데이터를 동일 세트에 속한 이미지를 각각 분석하여 동일한 시간의 이미지의 추론 결과를 비교분석 할 수 있다. 예컨대 상기 예에서 제1 내지 제4 이미지의 각 추론 결과를 분석하여 추론 결과가 일치한다고 판단할 수 있다. According to an embodiment of the present disclosure, the image labeling server 140 analyzes the image data collected by each of the plurality of cameras 120a, 120b, ..., 120n, and images belonging to the same set to obtain images of the same time. of inference results can be comparatively analyzed. For example, in the above example, by analyzing the inference results of the first to fourth images, it may be determined that the inference results match.

본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 추론 결과를 분석하여 결과가 일치한다고 판단한 각각의 이미지, 예를 들어 상기 제1 내지 제4 이미지에 포함된 돼지의 자세 이미지에 대해 해당 자세의 레이블을 레이블링할 수 있다. 설명하면, 서 있는 돼지 이미지 부분에 대해 서 있는 돼지라는 레이블링 파일을 생성하고, 견좌 돼지 이미지 부분에 대해서는 견좌 돼지라는 레이블링 파일을 각각 생성할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 특정 객체(가축의 특정 자세)를 분석하는 지시를 입력받아 해당 객체의 추론 정확도를 높이도록 분석을 수행할 수 있다. 예를 들어, 견좌 돼지(Sitting_Pig)에 집중하여 추론 정확도를 높이도록 하는 경우, 이미지 레이블링 서버(140)는 이미지 추론 결과가 견좌 돼지 이미지를 포함하는지 분석하고 견좌 돼지 이미지를 포함하는 추론 결과에 대해 분석을 수행할 수 있다 According to an embodiment of the present disclosure, the image labeling server 140 analyzes the inference result and determines that the result matches each image, for example, a corresponding posture image of a pig included in the first to fourth images. Labels of postures can be labeled. To explain, a labeling file called a standing pig may be generated for the image of a standing pig, and a labeling file called a pig who is sitting on the shoulder may be generated for the part of the image of the pig sitting on the shoulder. In an embodiment, the image labeling server 140 may receive an instruction to analyze a specific object (a specific posture of livestock) and perform analysis to increase inference accuracy of the corresponding object. For example, when focusing on the sitting pig (Sitting_Pig) to increase the inference accuracy, the image labeling server 140 analyzes whether the image inference result includes the sitting pig image, and analyzes the inference result including the sitting pig image can perform

본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 추론 결과를 분석하여 결과가 일치하지 않는다고 판단하는 경우, 보다 정확한 검토를 위해 크라우드 기반 이미지 레이블링을 수행할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 추론 결과가 불일치한 복수의 이미지 데이터세트, 즉 4개의 이미지를 검수자 단말로 제공하고, 복수의 검수자 단말로부터 해당 이미지 데이터세트에 대한 레이블링 결과를 수신하여 검수자의 분석 결과가 일치하는지 여부를 판단할 수 있다. According to an embodiment of the present disclosure, when the image labeling server 140 analyzes the inference result and determines that the results do not match, crowd-based image labeling may be performed for more accurate review. In one embodiment, the image labeling server 140 provides a plurality of image datasets, that is, four images, with inconsistent inference results to the inspector terminal, and receives the labeling results for the image dataset from the plurality of inspector terminals, It can be determined whether the analysis results of the inspector are consistent.

본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 레이블링 결과를 수신하는 검수자의 수를 조절할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 세 명의 검수자에게 결과가 불일치한 복수의 이미지를 제공하고, 레이블링 결과를 수신하여 분석 결과가 일치하는지 여부를 판단할 수 있다. 일 실시예에서, 모든 검수자로부터 수신한 분석 결과가 일치하는 경우, 이미지 레이블링 서버(140)는 제공한 복수의 이미지에 포함된 돼지의 자세 이미지에 대해 해당 자세의 레이블을 레이블링할 수 있다. 다른 실시예에서, 검수자로부터 수신한 분석 결과가 불일치하는 경우, 이미지 레이블링 서버(140)는 검수자의 수를 늘려 결과가 불일치한 복수의 이미지, 즉 4개의 이미지를 제공하고, 복수의 검수자로부터 레이블링 결과를 수신하여 분석 결과가 일치하는지 여부를 판단할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 레이블링 결과가 동일할 때까지 검수자의 수를 증가할 수 있고, 검수자의 수가 임계치를 넘는 경우, 더이상 검수를 진행하지 않고 해당 이미지를 이용하지 않을 수 있다. 다른 실시예에서, 이미지 레이블링 서버(140)는 레이블링 결과가 동일할 때까지 검수자의 수를 증가할 수 있고, 검수자의 수가 임계치를 넘는 경우, 검수자의 다수가 보낸 결과를 이미지 레이블링에 반영하여 복수의 이미지에 포함된 돼지의 자세 이미지에 대해 해당 자세의 레이블을 레이블링할 수 있다. According to an embodiment of the present disclosure, the image labeling server 140 may adjust the number of inspectors receiving the labeling result. In an embodiment, the image labeling server 140 may provide a plurality of images with inconsistent results to three inspectors, and receive the labeling results to determine whether the analysis results match. In an embodiment, when the analysis results received from all inspectors match, the image labeling server 140 may label a corresponding posture label with respect to a posture image of a pig included in a plurality of provided images. In another embodiment, when the analysis results received from the inspectors are inconsistent, the image labeling server 140 increases the number of inspectors to provide a plurality of images with inconsistent results, that is, four images, and the labeling results from the plurality of inspectors can be received to determine whether the analysis results match. In one embodiment, the image labeling server 140 may increase the number of inspectors until the labeling result is the same, and when the number of inspectors exceeds a threshold, the image may not be used without further inspection. . In another embodiment, the image labeling server 140 may increase the number of inspectors until the labeling results are the same. For a posture image of a pig included in the image, a label for that posture can be labeled.

본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 올바른 레이블링 결과를 입력하는 검수자에게 보상을 지급할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 각 검증 인원이 검증한 결과를 기반으로 정산을 위한 포인트를 적립 및 차감할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 검증자가 올바르게 검증했을 경우 포인트를 지급하고, 검증이 정확하지 않은 경우 포인트를 차감할 수 있다. 예컨대, 이미지 레이블링 서버(140)는 검증자가 이미지 1장 또는 객체 1건에 대해 올바르게 검증했을 경우 1 포인트를 적립할 수 있고, 다수의 의견과 다르게 검증했을 경우 더 많은 포인트, 예컨대 20 포인트를 차감할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)가 올바른 레이블링 결과를 입력하는 검수자에게 보상을 지급하는 것은 크라우드 기반으로 이미지 레이블링을 입력하기 위한 것으로, 검증이 정확하지 않은 경우 차감하는 포인트가 정확한 검증에 대한 보상으로 부여되는 포인트보다 높은 것이 크라우드 검증자에게 신중한 검증을 유도하여 검증 결과의 품질을 높이는데 유리할 수 있다. According to an embodiment of the present disclosure, the image labeling server 140 may pay a reward to an inspector who inputs a correct labeling result. In an embodiment, the image labeling server 140 may accumulate and deduct points for settlement based on a result verified by each verification person. In an embodiment, the image labeling server 140 may award points if the verifier correctly verifies, and may deduct points if the verifier is not correct. For example, the image labeling server 140 can earn 1 point when the verifier correctly verifies one image or one object, and can deduct more points, for example, 20 points, if the verifier is verified differently from a majority of opinions. can In one embodiment, the image labeling server 140 pays a reward to the inspector who enters the correct labeling result for inputting image labeling based on a crowd, and if the verification is not accurate, the points subtracted for the correct verification It may be advantageous to increase the quality of the verification result by inducing careful verification to the crowd validator if it is higher than the points awarded as a reward.

이미지 레이블링 서버(140)가 특정 검수자의 포인트를 차감해야 하는 경우, 이미지 레이블링 서버(140)는 관리자의 확인을 입력받은 후 해당 검수자의 포인트를 차감할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 검증이 정확하지 않은 경우라고 판단하였으나, 관리자가 포인트 차감 허락을 입력하지 않는 경우, 이미지 레이블링 서버(140)는 해당 검수자의 포인트를 차감하지 않을 수 있다. 예를 들어 이미지를 판독하기 매우 어려운 경우 검증이 정확하지 않더라도 관리자는 검수자의 포인트를 차감하지 않을 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 관리자의 지시에 따라 해당 검수자에게 포인트를 지급할 수 있다. When the image labeling server 140 needs to subtract the points of a specific inspector, the image labeling server 140 may subtract the inspector's points after receiving the administrator's confirmation. In one embodiment, the image labeling server 140 determines that the verification is inaccurate, but if the administrator does not input a point deduction permission, the image labeling server 140 may not deduct the inspector's points. . For example, if the image is very difficult to read, the administrator may not deduct the inspector's points even if the verification is not accurate. In one embodiment, the image labeling server 140 may pay a point to the inspector according to the manager's instructions.

본 개시의 일 실시예에 의하면, 통신망(150)은, 임의의 유선 또는 무선 통신망, 예컨대 TCP/IP 통신망을 포함할 수 있다. 본 개시의 일 실시예에 의하면, 통신망(150)은, 예컨대 Wi-Fi망, LAN망, WAN망, 인터넷망 등을 포함할 수 있으며, 본 발명이 이로써 제한되는 것은 아니다. 본 개시의 일 실시예에 의하면, 통신망(150)은, 예컨대 이더넷, GSM, EDGE(Enhanced Data GSM Environment), CDMA, TDMA, OFDM, 블루투스, VoIP, Wi-MAX, Wibro 기타 임의의 다양한 유선 또는 무선 통신 프로토콜을 이용하여 구현될 수 있다.According to an embodiment of the present disclosure, the communication network 150 may include any wired or wireless communication network, for example, a TCP/IP communication network. According to an embodiment of the present disclosure, the communication network 150 may include, for example, a Wi-Fi network, a LAN network, a WAN network, an Internet network, and the like, but the present invention is not limited thereto. According to an embodiment of the present disclosure, the communication network 150 is, for example, Ethernet, GSM, EDGE (Enhanced Data GSM Environment), CDMA, TDMA, OFDM, Bluetooth, VoIP, Wi-MAX, Wibro and any other various wired or wireless wired or wireless It can be implemented using a communication protocol.

도 2는 본 개시의 일 실시예에 따른 도 1의 이미지 레이블링 서버의 예시적 기능 구성을 도시한 기능 블록도이다. 2 is a functional block diagram illustrating an exemplary functional configuration of the image labeling server of FIG. 1 according to an embodiment of the present disclosure.

도시된 바에 의하면, 이미지 레이블링 서버(140)는, 다채널 이미지 획득부(201), 다채널 이미지 추론부(203), 다채널 이미지 추론 결과 비교분석부(205), 크라우드 검증부(207), 레이블링 파일 생성부(209), 학습부(211), 저장부(213) 및 통신부(215)를 포함할 수 있다. As shown, the image labeling server 140 includes a multi-channel image acquisition unit 201, a multi-channel image inference unit 203, a multi-channel image inference result comparison analysis unit 205, a crowd verification unit 207, It may include a labeling file generating unit 209 , a learning unit 211 , a storage unit 213 , and a communication unit 215 .

본 개시의 일 실시예에 의하면, 다채널 이미지 획득부(201)는 이미지 데이터를 전송받아 이미지를 획득할 수 있다. 일 실시예에서 다채널 이미지 획득부(201)는 카메라(120a, 120b, ..., 120n)로부터 이미지 데이터를 전송받아 이미지를 획득할 수 있다. 일 실시예에서 다채널 이미지 획득부(201)는 동일한 영역을 촬영하는 복수의 카메라(120a, 120b, ..., 120n)로부터 다채널 이미지 데이터를 전송받아 다채널 이미지를 획득할 수 있다. 여기서 다채널 이미지 데이터란 동시간에 동일한 영역을 다른 위치에서 촬영한 이미지 데이터를 의미할 수 있다. According to an embodiment of the present disclosure, the multi-channel image acquisition unit 201 may acquire an image by receiving image data. In an embodiment, the multi-channel image acquisition unit 201 may acquire an image by receiving image data from the cameras 120a, 120b, ..., 120n. In an embodiment, the multi-channel image acquisition unit 201 may acquire multi-channel images by receiving multi-channel image data from a plurality of cameras 120a, 120b, ..., 120n that photograph the same area. Here, the multi-channel image data may refer to image data obtained by photographing the same area at different locations at the same time.

본 개시의 일 실시예에 의하면, 다채널 이미지 추론부(203)는 기계학습 모델에 기초하여 수집한 이미지 데이터에서 개별 가축의 자세를 추론할 수 있다. 본 개시의 일 실시예에 의하면, 다채널 이미지 추론부(203)는 복수의 카메라(120a, 120b, ..., 120n) 각각이 수집한 이미지 데이터에 대해 동시간대 촬영한 데이터를 하나의 세트로 클러스터링 하고, 동일 세트에 속한 이미지 각각에 대해 개별 가축의 자세를 추론할 수 있다. According to an embodiment of the present disclosure, the multi-channel image inference unit 203 may infer the posture of individual livestock from the image data collected based on the machine learning model. According to an embodiment of the present disclosure, the multi-channel image inference unit 203 sets the data captured at the same time with respect to the image data collected by each of the plurality of cameras 120a, 120b, ..., 120n as one set. We can cluster and infer the poses of individual animals for each image belonging to the same set.

전술한 표 1은 다채널 이미지 추론부(203)에서 다채널 이미지 데이터를 추론한 결과를 예시적으로 나타내는 표이다. Table 1 described above is a table exemplarily showing a result of inferring multi-channel image data by the multi-channel image inference unit 203 .

본 개시의 일 실시예에 의하면, 다채널 이미지 추론부(203)는 일정한 주기로, 예컨대 1초마다 복수의 카메라(120a, 120b, ..., 120n)로부터 이미지를 수집하여 획득한 새로운 이미지를 대상으로 주기적으로 이미지에 포함된 가축의 정보를 기계학습 기반으로 추론할 수 있다. 예컨대, 다채널 이미지 추론부(203)는 2020-03-24 14:04:32 시간에 카메라 1 내지 4에서 촬영된 이미지를 분석하여 해당 이미지에 포함된 가축의 자세, 가축의 위치 정보를 추론할 수 있다. 일 실시예에서, 다채널 이미지 획득부(201)가 다채널 동시간대 즉, 매 1초에 4개의 채널의 이미지를 수신하는 경우, 다채널 이미지 추론부(203)는 초당 4개의 이미지로 된 데이터세트의 새로운 이미지를 대상으로 추론을 수행할 수 있다. 여기서 세트란 동시간에 동일한 영역을 다른 위치에서 복수의 카메라(120a, 120b, ..., 120n) 각각에서 촬영한 다채널 이미지 데이터의 집합을 의미할 수 있다. 일 실시예에서, 다채널 이미지 추론부(203)는 네 대의 카메라(120a, 120b, 120c, 120d) 각각이 수집한 동시간에 동일한 영역을 다른 위치에서 촬영한 이미지 데이터에 대해 추론한 결과로서 제1 카메라에서 수집한 제1 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제2 카메라에서 수집한 제2 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제3 카메라에서 수집한 제3 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제4 카메라에서 수집한 제4 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 각 추론할 수 있다. According to an embodiment of the present disclosure, the multi-channel image inference unit 203 collects images from a plurality of cameras 120a, 120b, ..., 120n at a constant cycle, for example, every second, and applies a new image acquired In this way, the information of livestock included in the image can be periodically inferred based on machine learning. For example, the multi-channel image inference unit 203 analyzes the images taken by cameras 1 to 4 at the time of 2020-03-24 14:04:32 to infer the posture and position information of the livestock included in the image. can In one embodiment, when the multi-channel image acquisition unit 201 receives images of 4 channels in the multi-channel time zone, that is, every 1 second, the multi-channel image inference unit 203 receives data of 4 images per second Inference can be performed on new images in the set. Here, the set may mean a set of multi-channel image data captured by each of the plurality of cameras 120a, 120b, ..., 120n in the same area at different locations at the same time. In one embodiment, the multi-channel image inference unit 203 is a result of inferring the image data captured by each of the four cameras 120a, 120b, 120c, and 120d at the same time and at a different location in the same area. 1 It is inferred that there are 1 standing pig and 1 sitting pig in the first image collected from the camera, and 1 standing pig and 1 sitting pig in the second image collected from the second camera. inferring, inferring that there are 1 standing pig and 1 pig sitting in the third image collected from the third camera, and 1 standing pig and 1 pig sitting in the fourth image collected from the fourth camera Each can be inferred that there is one.

본 개시의 일 실시예에 의하면, 다채널 이미지 추론 결과 비교분석부(205)는 동일 데이터세트에 속한 이미지들의 추론 결과를 비교분석 할 수 있다. 일 실시예에서, 다채널 이미지 추론 결과 비교분석부(205)는 상기 각 추론 결과를 비교분석하여 다채널 이미지의 추론 결과가 일치한다고 판단할 수 있다. 일 실시예에서, 다채널 이미지 추론 결과 비교분석부(205)는 추론 결과가 일치한 다채널 이미지 데이터를 레이블링 파일 생성부(209)로 전송할 수 있다. According to an embodiment of the present disclosure, the multi-channel image inference result comparison analysis unit 205 may compare and analyze the inference result of images belonging to the same dataset. In an embodiment, the multi-channel image inference result comparison analysis unit 205 may compare and analyze each of the inference results to determine that the inference results of the multi-channel images match. In an embodiment, the multi-channel image inference result comparison analysis unit 205 may transmit the multi-channel image data having the same inference result to the labeling file generation unit 209 .

본 개시의 일 실시예에 의하면, 크라우드 검증부(207)는 이미지 데이터세트를 수신하고 세트에 포함된 다채널 이미지 각각에 대해 검증을 수행할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 동일한 데이터세트에 포함된 이미지의 추론 결과가 일치하지 않은 이미지 데이터세트를 수신하고 해당 이미지를 복수의 검증자 단말(130a, 130b, ... , 130n)로 전송하여 검수 결과를 수신할 수 있다. 예컨대, 상기 예에서 일 실시예에서, 크라우드 검증부(207)는 결과가 불일치한 복수의 이미지, 즉 4개의 이미지를 검증자 단말(130a, 130b, ... , 130n)에 제공하고, 복수의 검증자 단말(130a, 130b, ... , 130n)로부터 검증 결과를 수신하여, 검증자 단말(130a, 130b, ... , 130n)로부터 수신한 결과가 일치하는지 여부를 판단할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 검증 결과가 일치한 다채널 이미지 데이터를 레이블링 파일 생성부(209)로 전송할 수 있다. According to an embodiment of the present disclosure, the crowd verification unit 207 may receive an image dataset and perform verification on each of the multi-channel images included in the set. In one embodiment, the crowd verifier 207 receives an image dataset in which the inference result of the images included in the same dataset does not match, and compares the image to a plurality of verifier terminals 130a, 130b, ..., 130n ) to receive the inspection result. For example, in one embodiment in the above example, the crowd verifying unit 207 provides a plurality of images, that is, four images, with inconsistent results to the verifier terminals 130a, 130b, ..., 130n, and a plurality of The verification result may be received from the verifier terminals 130a, 130b, ..., 130n, and it may be determined whether the results received from the verifier terminals 130a, 130b, ..., 130n match. In an embodiment, the crowd verifying unit 207 may transmit multi-channel image data whose verification results match to the labeling file generating unit 209 .

본 개시의 일 실시예에 의하면, 크라우드 검증부(207)는 검증자 단말(130a, 130b, ... , 130n)의 수를 조절할 수 있다. 일 실시예에서, 복수의 검증자 단말(130a, 130b, ... , 130n)로부터 검증 결과가 서로 일치하는 않은 경우, 크라우드 검증부(207)는 검증을 의뢰하는 검증자 단말의 수를 늘릴 수 있다. 예컨대, 1차 검증은 3개의 검증자 단말로 요청을 하고, 3개의 검증자 단말로 부터 수신한 검증 결과가 불일치하는 경우, 2차 검증은 5개의 검증자 단말로 검증을 요청하여 검증 결과를 수신할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 검증 결과가 일치할 때까지 검증자 단말의 수를 증가할 수 있고, 검증자 단말의 수가 임계치를 넘는 경우, 더이상 검증을 진행하지 않고 해당 이미지를 이용하지 않을 수 있다. 다른 실시예에서, 크라우드 검증부(207)는 검증 결과가 동일할 때까지 검증자 단말의 수를 증가시킬 수 있고, 검증자 단말의 수가 임계치를 넘는 경우, 다수결 원칙으로, 즉 검증자 단말이 보낸 검증 결과 중 다수가 일치하게 보낸 결과를 올바른 검증 결과로 간주하여 다수의 검증 결과 및 다채널 이미지 데이터세트를 레이블링 파일 생성부(209)로 전송할 수 있다. According to an embodiment of the present disclosure, the crowd verifier 207 may adjust the number of verifier terminals 130a, 130b, ..., 130n. In an embodiment, if the verification results from the plurality of verifier terminals 130a, 130b, ..., 130n do not match each other, the crowd verifier 207 may increase the number of verifier terminals requesting verification. have. For example, in the first verification, a request is made to three verifier terminals, and when the verification results received from the three verifier terminals do not match, the second verification requests verification to five verifier terminals and receives the verification result. can do. In an embodiment, the crowd verifier 207 may increase the number of verifier terminals until the verification results match, and when the number of verifier terminals exceeds a threshold, the image is used without further verification. may not In another embodiment, the crowd verifier 207 may increase the number of verifier terminals until the verification results are the same, and when the number of verifier terminals exceeds a threshold, in a majority rule, that is, The plurality of verification results and the multi-channel image dataset may be transmitted to the labeling file generating unit 209 by considering a result that a plurality of verification results agree with each other as a correct verification result.

본 개시의 일 실시예에 의하면, 크라우드 검증부(207)는 올바른 레이블링 결과를 입력하는 검증자 단말에게 보상을 지급할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 각 검증자 단말이 검증한 결과를 기반으로 정산을 위한 포인트를 적립 및 차감할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 검증자 단말이 올바르게 검증했을 경우 포인트를 지급하고, 검증이 정확하지 않은 경우 포인트를 차감할 수 있다. 예컨대, 크라우드 검증부(207)는 검증자 단말이 이미지 1장 또는 객체 1건에 대해 올바르게 검증했을 경우 1 포인트를 적립할 수 있고, 다수의 의견과 다르게 검증했을 경우 20 포인트를 차감할 수 있다. 일 실시예에서, 크라우드 검증부(207)이 올바른 레이블링 결과를 입력하는 검증자 단말에게 보상을 지급하는 것은 크라우드 기반으로 검증을 수행하기 입력하기 위한 것으로, 검증이 정확하지 않은 경우 차감하는 포인트가 정확한 검증에 따라 부여되는 포인트보다 높은 것이 크라우트 검증자에게 신중한 검증을 유도하여 검증 결과의 품질을 높이는데 유리할 수 있다. According to an embodiment of the present disclosure, the crowd verifier 207 may pay a reward to a verifier terminal that inputs a correct labeling result. In an embodiment, the crowd verifier 207 may accumulate and deduct points for settlement based on a result verified by each verifier terminal. In an embodiment, the crowd verifier 207 may pay points when the verifier terminal correctly verifies, and deduct points when the verifier is not correct. For example, the crowd verification unit 207 may accumulate 1 point if the verifier terminal correctly verifies one image or one object, and may deduct 20 points if the verification is different from a majority of opinions. In one embodiment, the crowd verification unit 207 pays a reward to the verifier terminal for inputting the correct labeling result is to input to perform the verification based on the crowd, and if the verification is not accurate, the point to be subtracted is correct It may be advantageous to increase the quality of the verification result by inducing careful verification to the crook verifier if it is higher than the points awarded according to verification.

크라우드 검증부(207)가 특정 검증자 단말의 포인트를 차감하는 경우, 크라우드 검증부(207)는 관리자의 확인을 입력받은 후 해당 검증자 단말의 포인트를 차감할 수 있다. 일 실시예에서, 크라우드 검증부(207)는 특정 검증자 단말의 검증 결과가 정확하지 않은 경우라고 판단하였으나, 관리자가 포인트 차감 허락하지 않는 경우, 크라우드 검증부(207)는 해당 검증자 단말의 포인트를 차감하지 않을 수 있다. 일 실시예에서, 크라우드 검증부(207)는 해당 검증자 단말에게 관리자의 지시에 따라 포인트를 지급할 수 있다. When the crowd verifier 207 deducts the points of a specific verifier terminal, the crowd verifier 207 may subtract the points of the verifier terminal after receiving the manager's confirmation. In an embodiment, the crowd verifier 207 determines that the verification result of the specific verifier terminal is not accurate, but if the manager does not allow the point deduction, the crowd verifier 207 determines the point of the verifier terminal. may not be deducted. In an embodiment, the crowd verifier 207 may provide points to the verifier terminal according to the manager's instruction.

본 개시의 일 실시예에 의하면, 레이블링 파일 생성부(209)는 다채널 이미지 추론 결과 비교분석 결과 및 해당 이미지 데이터를 기초로 레이블링 파일을 생성할 수 있다. 일 실시예에서, 이미지 내 가축의 자세를 레이블링 하는 경우, 레이블(클래스)은 서 있는 돼지(Standing_Pig), 누워 있는 돼지(Lying_Pig), 겹쳐있는 돼지(Multiple_Pig), 견좌자세 돼지(Sitting_Pig), 구토 돼지(Vomiting_Pig), 설사 돼지(Diarrhea_Pig), 기침 돼지(Cough_Pig)를 포함할 수 있다. According to an embodiment of the present disclosure, the labeling file generation unit 209 may generate a labeling file based on the multi-channel image inference result comparative analysis result and the corresponding image data. In one embodiment, when labeling the posture of the livestock in the image, the label (class) is a standing pig (Standing_Pig), a lying pig (Lying_Pig), a stacked pig (Multiple_Pig), a sitting posture pig (Sitting_Pig), a vomiting pig (Vomiting_Pig), Diarrhea_Pig, and Cough_Pig.

일 실시예에서, 레이블링 파일 생성부(209)는 추론 결과를 분석하여 결과가 일치한다고 판단된 각각의 이미지, 예를 들어 상기 제1 내지 제4 이미지에 포함된 돼지의 자세 이미지에 대해 해당 자세의 레이블로 레이블링할 수 있다. 설명하면, 서 있는 돼지 이미지 부분에 대해 서 있는 돼지라는 레이블링 파일을 생성하고, 견좌 돼지 이미지 부분에 대해서는 견좌 돼지라는 레이블링 파일을 각각 생성할 수 있다. 일 실시예에서, 레이블링 파일은 이미지 파일이 저장된 경로, 이미지가 저장된 폴더명, 이미지 파일명, 이미지의 크기 및 객체 정보 목록을 포함할 수 있으나 이에 한정되는 것은 아니다. 일 실시예에서, 객체 정보 목록은 레이블명과 바운드 박스(xmin, ymin, xmat ymax)를 의미할 수 있으나 이에 한정되는 것은 아니다. In one embodiment, the labeling file generating unit 209 analyzes the inference result and determines that the result matches the corresponding posture for each image, for example, a posture image of a pig included in the first to fourth images. You can label it with a label. To explain, a labeling file called a standing pig may be generated for the image of a standing pig, and a labeling file called a pig who is sitting on the shoulder may be generated for the part of the image of the pig sitting on the shoulder. In an embodiment, the labeling file may include, but is not limited to, a path in which an image file is stored, a folder name in which an image is stored, an image file name, a size of an image, and a list of object information. In an embodiment, the object information list may mean a label name and a bound box (xmin, ymin, xmat ymax), but is not limited thereto.

본 개시의 일 실시예에 의하면, 학습부(211)는 생성된 모델을 기초로 기계학습을 수행하여 이미지를 추론하는 역할 수행할 수 있다. 일 실시예에서, 학습부(211)는 새로운 학습 데이터, 즉 새롭게 레이블링된 이미지 데이터로 기계학습 모델을 업데이트할 수 있다. 학습부(211)는 인공신경망, 예를 들어, CNN(Convolutional Neural Network), RNN(Recurrent Neural Network), DBN(Deep Belief Network) 등 심층신경망(Deep Neural Network: DNN)을 포함할 수 있다. According to an embodiment of the present disclosure, the learning unit 211 may perform a role of inferring an image by performing machine learning based on the generated model. In an embodiment, the learner 211 may update the machine learning model with new training data, that is, newly labeled image data. The learning unit 211 may include an artificial neural network, for example, a deep neural network (DNN) such as a convolutional neural network (CNN), a recurrent neural network (RNN), or a deep belief network (DBN).

본 개시의 일 실시예에 의하면 저장부(213)는 서버(140) 상에서 실행될 수 있는 각종 프로그램 및 관련 데이터 등이 저장된 임의의 저장 매체일 수 있다. 본 개시의 일 실시예에 의하면, 저장부(213)는 센서 데이터, 이미지 데이터 및 분석 모듈의 실행과 관련된 데이터들이 저장될 수 있다. 본 개시의 일 실시예에 의하면, 저장부(213)는 DRAM, SRAM, DDR, RAM, ROM, 자기디스크, 광 디스크, 플래시 메모리 등 다양한 형태의 휘발성 또는 비휘발성 메모리를 포함하도록 구성될 수 있다. According to an embodiment of the present disclosure, the storage unit 213 may be any storage medium in which various programs executable on the server 140 and related data are stored. According to an embodiment of the present disclosure, the storage unit 213 may store sensor data, image data, and data related to the execution of the analysis module. According to an embodiment of the present disclosure, the storage unit 213 may be configured to include various types of volatile or nonvolatile memory such as DRAM, SRAM, DDR, RAM, ROM, magnetic disk, optical disk, flash memory, and the like.

본 개시의 일 실시예에 의하면 통신부(215)는 이미지 레이블링 서버(140)가, 통신망(150)을 통해 외부와 통신할 수 있도록 지원할 수 있다. 본 개시의 일 실시예에 의하면, 통신부(215)는 소정의 프로토콜에 따라 통신망(150)으로부터 데이터를 수신할 수 있고, 통신망(150)을 통하여 이미지 레이블링 서버(140)로부터 외부로 데이터가 전송되도록 필요한 절차를 수행할 수 있다.According to an embodiment of the present disclosure, the communication unit 215 may support the image labeling server 140 to communicate with the outside through the communication network 150 . According to an embodiment of the present disclosure, the communication unit 215 may receive data from the communication network 150 according to a predetermined protocol, and transmit data from the image labeling server 140 to the outside through the communication network 150 . You can perform the necessary procedures.

도 3은 본 개시의 일 실시예에 따라 이미지 레이블링 서버가 이미지 레이블링을 처리하는 흐름을 보여주는 예시적 동작 흐름도이다. 3 is an exemplary operation flowchart illustrating a flow in which an image labeling server processes image labeling according to an embodiment of the present disclosure.

본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 사전에 이미지 학습 데이터를 수집하고 데이터 레이블링 등의 학습 과정을 통해 분류 모델을 적어도 하나 생성할 수 있으며, 생성한 모델의 성능을 향상시키기 위해 학습 데이터의 추가 레이블링 작업을 수행할 수 있다. According to an embodiment of the present disclosure, the image labeling server 140 may collect image learning data in advance and generate at least one classification model through a learning process such as data labeling, and to improve the performance of the generated model. For this purpose, additional labeling of the training data can be performed.

도시된 바에 의하면, 단계(S302)에서, 이미지 레이블링 서버(140)는 소정의 다채널 이미지를 수신할 수 있다. 여기서 다채널 이미지 데이터란 동시간에 동일한 영역을 다른 위치에서 촬영한 이미지 데이터를 의미할 수 있다. 그런 다음, 단계(S304)에서, 이미지 레이블링 서버(140)는 수집한 다채널 이미지 데이터를 기계학습 기반으로 이미지 내 개별 가축의 자세를 추론할 수 있다. 본 개시의 일 실시예에 의하면, 이미지 레이블링 서버(140)는 다채널 이미지 데이터에 대해 동시간대 촬영한 데이터를 하나의 데이터세트로 클러스터링 하고, 동일 데이터 세트에 속한 이미지 각각에 대해 개별 가축의 자세를 추론할 수 있다. 여기서 데이터세트란 동시간에 동일한 영역을 다른 위치에서 복수의 카메라(120a, 120b, ..., 120n) 각각에서 촬영한 다채널 이미지 데이터의 집합을 의미할 수 있다. 예를 들어, 이미지 레이블링 서버(140)는 네 대의 카메라(120a, 120b, 120c, 120d) 각각이 수집한 동시간에 동일한 영역을 다른 위치에서 촬영한 이미지 데이터에 대해 추론한 결과로서 제1 카메라에서 수집한 제1 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제2 카메라에서 수집한 제2 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제3 카메라에서 수집한 제3 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 추론하고, 제4 카메라에서 수집한 제4 이미지에는 서 있는 돼지가 1마리, 견좌 돼지가 1마리가 있다고 각 추론할 수 있다. As shown, in step S302, the image labeling server 140 may receive a predetermined multi-channel image. Here, the multi-channel image data may refer to image data obtained by photographing the same area at different locations at the same time. Then, in step S304, the image labeling server 140 may infer the posture of individual livestock in the image based on machine learning based on the collected multi-channel image data. According to an embodiment of the present disclosure, the image labeling server 140 clusters data captured at the same time for multi-channel image data into one dataset, and determines the posture of individual livestock for each image belonging to the same data set. can be inferred. Here, the data set may mean a set of multi-channel image data captured by each of the plurality of cameras 120a, 120b, ..., 120n in the same area at different locations at the same time. For example, the image labeling server 140 infers the image data captured by the four cameras 120a , 120b , 120c , and 120d at the same time and at a different location from the first camera. Inferring that there are 1 standing pig and 1 pig sitting in the first image collected, and inferring that there are 1 standing pig and 1 pig sitting in the second image collected from the second camera, It is inferred that there are 1 standing pig and 1 ponytail pig in the third image collected from the 3rd camera, and 1 standing pig and 1 croup pig in the 4th image acquired from the 4th camera. It can be inferred that each

이후, 단계(S306)에서 이미지 레이블링 서버(140)는 동일 데이터세트에 속한 이미지들의 추론 결과를 비교분석할 수 있다. 예를 들어, 위 추론 결과를 비교분석하여 다채널 이미지의 추론 결과가 일치한다고 판단할 수 있다. Thereafter, in step S306 , the image labeling server 140 may compare and analyze the inference results of images belonging to the same dataset. For example, it can be determined that the inference results of the multi-channel images are consistent by comparing and analyzing the above inference results.

만약, 추론 결과가 일치하는 경우, 이미지 레이블링 서버(140)는 해당 다채널 이미지 데이터를 기초로 레이블링 파일을 생성할 수 있다(단계(S308)). 이미지 레이블링 서버(140)는 새롭게 생성된 레이블링 파일을 새로운 학습 데이터로 하여 기계학습 분류 모델을 재학습시킬 수 있다. If the inference results match, the image labeling server 140 may generate a labeling file based on the corresponding multi-channel image data (step S308). The image labeling server 140 may retrain the machine learning classification model by using the newly created labeling file as new learning data.

만약, 추론 결과가 일치하지 않는 경우, 이미지 레이블링 서버(140)는 해당 데이터세트에 대해 크라우드 검증을 수행할 수 있다(단계(S312)). 일 실시예에서, 크라우드 검증이란 다수의 검증자로부터 특정 이미지 데이터세트에 대해 검증 결과, 즉 해당 이미지에 검출 대상이 있는지 및 검출 대상의 분류를 수동으로 레이블링한 결과를 수신하는 것을 의미할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 추론 결과가 일치하지 않는 데이터세트를 복수의 검증자 단말(130a, 130b, ... , 130n)로 전송하고, 다시 복수의 검증자 단말(130a, 130b, ... , 130n)로부터 검증 결과를 수신할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 추론 결과가 일치하지 않는 데이터세트, 예컨대 4개의 이미지를 검증자 단말(130a, 130b, ... , 130n)에 제공하고, 복수의 검증자 단말(130a, 130b, ... , 130n)로부터 검증 결과를 수신하여, 검증자 단말(130a, 130b, ... , 130n)로부터 수신한 결과가 일치하는지 여부를 판단할 수 있다. If the inference results do not match, the image labeling server 140 may perform crowd verification on the corresponding dataset (step S312). In an embodiment, the crowd verification may mean receiving verification results for a specific image dataset from a plurality of verifiers, that is, whether there is a detection target in the image and manually labeling the classification of the detection target. In one embodiment, the image labeling server 140 transmits the dataset in which the inference result does not match to the plurality of verifier terminals 130a, 130b, ... , 130n, and again to the plurality of verifier terminals 130a, 130b, ..., 130n) may receive the verification result. In an embodiment, the image labeling server 140 provides a dataset with inconsistent inference results, for example, four images to the verifier terminals 130a, 130b, ... , 130n, and a plurality of verifier terminals ( By receiving the verification results from 130a, 130b, ..., 130n), it is possible to determine whether the results received from the verifier terminals 130a, 130b, ..., 130n match.

본 개시의 일 실시예에 의하면, 단계(S314)에서, 이미지 레이블링 서버(140)는 검증자 단말(130a, 130b, ... , 130n)의 수를 조절할 수 있다. 일 실시예에서, 복수의 검증자 단말(130a, 130b, ... , 130n)로부터 검증 결과가 서로 일치하지 않은 경우, 이미지 레이블링 서버(140)는 검증을 의뢰하는 검증자 단말의 수를 늘릴 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 검증 결과가 일치할 때까지 검증자 단말의 수를 증가할 수 있고, 검증자 단말의 수가 임계치를 넘는 경우, 더이상 검증을 진행하지 않고 해당 이미지를 이용하지 않을 수 있다. 다른 실시예에서, 이미지 레이블링 서버(140)는 검증 결과가 동일할 때까지 검증자 단말의 수를 증가시킬 수 있고, 검증자 단말의 수가 임계치를 넘는 경우, 검증자 단말이 보낸 검증 결과 중 다수가 보낸 결과를 검증 결과로 간주하여, 해당 이미지에 대해 단계(S308)을 수행할 수 있다 According to an embodiment of the present disclosure, in step S314, the image labeling server 140 may adjust the number of verifier terminals 130a, 130b, ..., 130n. In an embodiment, if the verification results from the plurality of verifier terminals 130a, 130b, ..., 130n do not match each other, the image labeling server 140 may increase the number of verifier terminals requesting verification. have. In one embodiment, the image labeling server 140 may increase the number of verifier terminals until the verification results match, and when the number of verifier terminals exceeds a threshold, the image is used without further verification. may not In another embodiment, the image labeling server 140 may increase the number of verifier terminals until the verification results are the same, and when the number of verifier terminals exceeds a threshold, many of the verification results sent by the verifier terminals are Considering the sent result as a verification result, step S308 may be performed on the image.

다음으로, 단계(S316)에서, 이미지 레이블링 서버(140)는 올바른 레이블링 결과를 입력하는 검증자 단말에게 보상을 지급할 수 있다. 일 실시예에서, 이미지 레이블링 서버(140)는 각 검증자 단말이 검증한 결과를 기반으로 정산을 위한 포인트를 적립 및 차감할 수 있다. Next, in step S316 , the image labeling server 140 may pay a reward to the verifier terminal inputting the correct labeling result. In an embodiment, the image labeling server 140 may accumulate and deduct points for settlement based on a result verified by each verifier terminal.

도 4는 본 개시의 일 실시예에 따른 이미지 레이블링 서버의 학습 흐름을 보여주는 예시적 동작 흐름도이다. 4 is an exemplary operation flowchart illustrating a learning flow of an image labeling server according to an embodiment of the present disclosure.

단계(S401) 내지 단계(S409)는 이미지내 객체 인식을 위한 일반적인 기계학습 흐름과 유사하다. 단계(S401)에서 학습용 데이터세트가 준비되고, 학습용 데이터세트에 대해 1차 레이블링을 수행한다(S403). 일반적으로 기계학습 학습용 데이터세트 레이블링은, 즉 바운딩 박스 및 레이블 입력은 사람이 직접 수행하게 된다. 이후, 단계(S405)에서는 단계(S403)에서 준비한 학습용 데이터세트를 기초로 기계학습을 수행하여 학습 결과 모델을 생성하고, 단계(S407)에서는 실제 이미지 데이터세트를 입력받아, 해당 학습 결과 모델을 이용하여 실제 이미지 데이터세트에 객체 인식을 수행한다(단계(S409)). Steps S401 to S409 are similar to the general machine learning flow for object recognition in an image. A training dataset is prepared in step S401, and primary labeling is performed on the training dataset (S403). In general, the labeling of datasets for machine learning learning, that is, the input of bounding boxes and labels, is performed by humans. Thereafter, in step S405, machine learning is performed based on the training dataset prepared in step S403 to generate a learning result model, and in step S407, the actual image dataset is received and the corresponding learning result model is used. to perform object recognition on the actual image dataset (step S409).

본 개시의 일 실시예에 있어서, 단계(S411)에서는 다채널 이미지 데이터에 대해 기계학습을 수행한 객체 인식 결과, 즉 단계(S409)의 결과를 비교분석하여 인식결과의 정확도를 판단할 수 있다. 만약, 인식결과가 정확하다고 판단하는 경우, 해당 다채널 이미지 데이터를 학습데이터로 레이블링하여(단계(S413)), 기계학습 모델을 업데이트할 수 있다. In one embodiment of the present disclosure, in step S411, the object recognition result obtained by performing machine learning on multi-channel image data, that is, the result of step S409, may be compared and analyzed to determine the accuracy of the recognition result. If it is determined that the recognition result is correct, the multi-channel image data may be labeled as training data (step S413), and the machine learning model may be updated.

당업자라면 알 수 있듯이 본 개시는 본 명세서에서 기술된 예시에 한정되는 것이 아니라 본 개시의 범주를 벗어나지 않는 범위 내에서 다양하게 변형, 재구성 및 대체될 수 있다. 예를 들어, 본원에 기술된 다양한 기술들은 하드웨어 또는 소프트웨어, 또는 하드웨어와 소프트웨어의 조합에 의해 구현될 수 있다. 따라서, 본원에 따른 소프트웨어 안전성 분석을 위한 분석 머신의 특정한 양태나 부분은 범용 또는 전용 마이크로프로세서, 마이크로-컨트롤러 등에 의해 실행 가능한 하나 이상의 컴퓨터 프로그램으로 구현될 수 있다. 본 개시의 일 실시예에 따른 컴퓨터 프로그램은, 컴퓨터 프로세서 등에 의해 판독 가능한 저장 매체, 예컨대 EPROM, EEPROM, 플래시 메모리장치와 같은 비휘발성 메모리, 내장형 하드 디스크와 착탈식 디스크 같은 자기 디스크, 광자기 디스크, 및 CDROM 디스크 등을 포함한 다양한 유형의 저장 매체에 저장된 형태로 구현될 수 있다. 또한, 프로그램 코드(들)는 어셈블리어나 기계어로 구현될 수 있고, 전기 배선이나 케이블링, 광섬유, 또는 기타 임의의 다른 형태의 전송 매체를 통해 전송되는 형태로 구현될 수도 있다. As will be appreciated by those skilled in the art, the present disclosure is not limited to the examples described herein, and various modifications, reconstructions, and substitutions may be made without departing from the scope of the present disclosure. For example, the various techniques described herein may be implemented by hardware or software, or a combination of hardware and software. Accordingly, certain aspects or portions of the analysis machine for software safety analysis according to the present disclosure may be implemented as one or more computer programs executable by a general-purpose or dedicated microprocessor, micro-controller, or the like. A computer program according to an embodiment of the present disclosure includes a storage medium readable by a computer processor or the like, such as EPROM, EEPROM, nonvolatile memory such as a flash memory device, a magnetic disk such as an internal hard disk and a removable disk, a magneto-optical disk, and It may be implemented in a form stored in various types of storage media including a CDROM disk and the like. In addition, the program code(s) may be implemented in assembly language or machine language, and may be implemented in a form transmitted through electric wiring, cabling, optical fiber, or any other type of transmission medium.

본 명세서에서는, 예시적인 실시예에 대해 다양한 도면을 참조하여 주로 기술했지만, 다른 유사한 실시예들이 이용될 수 있다. 본 개시의 진정한 사상 및 범주에 속하는 모든 변형 및 변경을 이하의 특허청구범위에 의해 모두 포괄하고자 한다.Although exemplary embodiments have been primarily described herein with reference to various drawings, other similar embodiments may be utilized. All modifications and variations falling within the true spirit and scope of the present disclosure are intended to be embraced by the following claims.

110: NVR
120: 카메라
130: 검증자 단말
140: 이미지 레이블링 서버
150: 통신망
110: NVR
120: camera
130: verifier terminal
140: image labeling server
150: communication network

Claims (10)

컴퓨터 시스템 상에서 수행되는, 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법으로서,
다채널 이미지 데이터를 수신하는 단계;
상기 다채널 이미지 데이터에 대해 동일한 시간 기준으로 데이터세트를 생성하고, 해당 데이터세트의 다채널 이미지 데이터 각각에 대해 기계학습 기반으로 이미지 내 개별 가축의 자세를 추론하는 단계;
상기 추론 결과를 비교분석하여 동일 데이터세트 내의 추론 결과가 일치하는지 여부를 비교판단하는 단계; 및
상기 동일 데이터세트 내의 추론 결과가 일치하는 경우, 상기 다채널 이미지 데이터에 대해 레이블링을 수행하는 단계
를 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법.
A crowd validation-based multi-channel image learning data labeling method performed on a computer system, comprising:
receiving multi-channel image data;
generating a dataset based on the same time reference for the multi-channel image data, and inferring the posture of individual livestock in the image based on machine learning for each multi-channel image data of the corresponding dataset;
comparing and analyzing the inference results to compare and determine whether the inference results in the same dataset match; and
performing labeling on the multi-channel image data when the inference results in the same dataset match
A crowd validation-based multi-channel image training data labeling method comprising a.
제1항에 있어서,
상기 방법은
상기 동일 데이터세트 내의 추론 결과가 일치하지 않는 경우, 상기 동일 데이터세트에 포함된 이미지 데이터를 k개(k>1, k는 홀수)의 검증자 단말로 전송하고, 상기 k개의 검증자 단말로부터 상기 동일 데이터세트에 포함된 이미지 데이터의 검증 결과를 수신하여, 검증 결과가 일치하는지 여부를 판단하는 단계를 더 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법.
According to claim 1,
the method
When the inference results in the same dataset do not match, the image data included in the same dataset is transmitted to k (k>1, k is an odd number) verifier terminals, and the k verifier terminals Crowd-verification-based multi-channel image learning data labeling method further comprising the step of receiving a verification result of the image data included in the same dataset, and determining whether the verification result is consistent.
제2항에 있어서,
상기 방법은
상기 검증 결과가 일치하는 경우, 상기 다채널 이미지 데이터에 대해 레이블링을 수행하는 단계를 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법.
3. The method of claim 2,
the method
and performing labeling on the multi-channel image data when the verification results match.
제3항에 있어서,
상기 방법은
상기 검증 결과가 일치하지 않는 경우, 상기 동일 데이터세트에 포함된 이미지 데이터를 m(m>k, m은 홀수)개의 검증자 단말로 전송하고, 상기 m개의 검증자 단말로부터 상기 동일 데이터세트에 포함된 이미지 데이터의 검증 결과를 수신하여, 검증 결과가 일치하는지 여부를 판단하는 단계를 더 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법.
4. The method of claim 3,
the method
When the verification results do not match, the image data included in the same dataset is transmitted to m (m>k, m is an odd number) number of validator terminals, and included in the same dataset from the m validator terminals. Crowd verification-based multi-channel image learning data labeling method further comprising the step of receiving the verification result of the image data, and determining whether the verification result is consistent.
제2항에 있어서,
상기 방법은 상기 다채널 이미지 데이터에 대해 레이블링한 새로운 학습 데이터를 기초로 기계학습 모델을 재학습시키는 단계를 더 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법.
3. The method of claim 2,
The method further comprises the step of retraining a machine learning model based on the new training data labeled for the multi-channel image data.
제3항에 있어서,
상기 방법은 상기 검증자 단말에 보상을 지급하는 단계를 더 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 방법.
4. The method of claim 3,
The method is a crowd-verification-based multi-channel image learning data labeling method further comprising the step of providing a reward to the verifier terminal.
컴퓨터에 의해 실행 가능한, 하나 이상의 컴퓨터 판독가능 명령이 수록된 컴퓨터 판독가능 기록매체로서, 상기 하나 이상의 컴퓨터 판독가능 명령은, 상기 컴퓨터에 의해 실행되는 경우, 상기 컴퓨터로 하여금, 제1항 내지 제6항 중 어느 한 항에 따른 방법을 수행하게 하는 컴퓨터 판도가능 기록매체. A computer-readable recording medium containing one or more computer-readable instructions executable by a computer, wherein the one or more computer-readable instructions, when executed by the computer, cause the computer to: A computer readable recording medium for performing the method according to any one of the preceding claims. 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 장치로서,
복수의 다채널 이미지 데이터를 수신하도록 구성된 다채널 이미지 획득부;
상기 복수의 다채널 이미지 데이터 각각에 대해 기계학습 모델을 기초로 이미지에 포함된 객체를 추론하도록 구성된 다채널 이미지 추론부;
상기 추론한 결과를 비교분석하도록 구성된 다채널 이미지 추론 결과 비교분석부; 및
상기 복수의 다채널 이미지 데이터 각각에 대해 레이블링 파일을 생성하도록 구성된 레이블링 파일 생성부
를 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 장치.
A crowd validation-based multi-channel image learning data labeling device, comprising:
a multi-channel image acquisition unit configured to receive a plurality of multi-channel image data;
a multi-channel image inference unit configured to infer an object included in an image based on a machine learning model for each of the plurality of multi-channel image data;
a multi-channel image inference result comparison and analysis unit configured to comparatively analyze the inferred result; and
A labeling file generating unit configured to generate a labeling file for each of the plurality of multi-channel image data
Crowd validation-based multi-channel image learning data labeling device comprising a.
제8항에 있어서,
상기 추론한 결과를 비교분석한 결과가 일치하지 않은 경우, 상기 복수의 다채널 이미지 데이터를 복수의 검증단말로 전송하고, 상기 복수의 검증자 단말로부터 검증 결과를 수신하여 검증자로부터의 검증 결과가 일치하는지 여부를 판단하도록 구성된 크라우드 검증부를 더 포함하는 크라우드 검증 기반 다채널 이미지 학습데이터 레이블링 장치.
9. The method of claim 8,
If the results of comparison and analysis of the inferred results do not match, the plurality of multi-channel image data is transmitted to a plurality of verification terminals, the verification results are received from the plurality of verifier terminals, and the verification results from the verifiers are Crowd verification-based multi-channel image training data labeling apparatus further comprising a crowd verification unit configured to determine whether they match.
제9항에 있어서, 상기 다채널 이미지 데이터에 대해 레이블링한 새로운 학습 데이터를 기초로 기계학습 모델을 재학습시키는 학습부를 더 포함하는 크라우드 검증 기반 다채널 이미지 학습 데이터 레이블링 장치.[Claim 10] The apparatus of claim 9, further comprising a learning unit for re-learning a machine learning model based on the new training data labeled with respect to the multi-channel image data.
KR1020200064677A 2020-05-29 2020-05-29 Method and apparatus for labeling multi-channel image training data based on crowd verification KR102423844B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200064677A KR102423844B1 (en) 2020-05-29 2020-05-29 Method and apparatus for labeling multi-channel image training data based on crowd verification

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200064677A KR102423844B1 (en) 2020-05-29 2020-05-29 Method and apparatus for labeling multi-channel image training data based on crowd verification

Publications (2)

Publication Number Publication Date
KR20210147443A true KR20210147443A (en) 2021-12-07
KR102423844B1 KR102423844B1 (en) 2022-07-22

Family

ID=78867936

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200064677A KR102423844B1 (en) 2020-05-29 2020-05-29 Method and apparatus for labeling multi-channel image training data based on crowd verification

Country Status (1)

Country Link
KR (1) KR102423844B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013120556A (en) * 2011-12-08 2013-06-17 Kddi Corp Object attribute estimation device and video plotting device
WO2019021369A1 (en) * 2017-07-25 2019-01-31 三菱電機株式会社 Data analysis device
KR20190124559A (en) * 2018-04-26 2019-11-05 주식회사 슈퍼브에이아이 Computing device and artificial intelligence based image processing service system using the same
JP2019211969A (en) * 2018-06-04 2019-12-12 オリンパス株式会社 Learning management device, learning management server, and learning management method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013120556A (en) * 2011-12-08 2013-06-17 Kddi Corp Object attribute estimation device and video plotting device
WO2019021369A1 (en) * 2017-07-25 2019-01-31 三菱電機株式会社 Data analysis device
KR20190124559A (en) * 2018-04-26 2019-11-05 주식회사 슈퍼브에이아이 Computing device and artificial intelligence based image processing service system using the same
JP2019211969A (en) * 2018-06-04 2019-12-12 オリンパス株式会社 Learning management device, learning management server, and learning management method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ezatzadeh, Shabnam and Keyvanpour, Mohammad. ViFa: an analytical framework for vision-based fall detection in a surveillance environment. Multimedia Tools and Applications. 78. 2019.5.28.* *

Also Published As

Publication number Publication date
KR102423844B1 (en) 2022-07-22

Similar Documents

Publication Publication Date Title
US20180189609A1 (en) Training data for machine-based object recognition
CN109145781B (en) Method and apparatus for processing image
CN111598190B (en) Training method of image target recognition model, image recognition method and device
CN105518711A (en) In-vivo detection method, in-vivo detection system, and computer program product
CN110427819B (en) Method for identifying PPT frame in image and related equipment
KR20200087310A (en) System and method for generation and augmentation of annotation learning data for deep learning in artificial intelligence picture reading
US20220237917A1 (en) Video comparison method and apparatus, computer device, and storage medium
US20180197287A1 (en) Process of using machine learning for cannabis plant health diagnostics
CN112699758B (en) Sign language translation method, device, computer equipment and medium for dynamic gesture recognition
CN111291773A (en) Feature identification method and device
CN115546692A (en) Remote education data acquisition and analysis method, equipment and computer storage medium
Rusdi et al. Student attendance using face recognition technology
CN112529548B (en) Online education platform cloud resource management system
KR102423844B1 (en) Method and apparatus for labeling multi-channel image training data based on crowd verification
JPWO2021079792A5 (en)
EP3973525A1 (en) Method of delivering webinars with certified participation
CN110569707A (en) identity recognition method and electronic equipment
CN108021353B (en) Device, method, equipment and storage medium for generating description document of software product
CN116546304A (en) Parameter configuration method, device, equipment, storage medium and product
CN112101303B (en) Image data processing method and device and computer readable storage medium
CN112580578A (en) Binocular living camera face ranging method and system
CN114764948A (en) Living body detection method, living body detection device, living body detection equipment and storage medium
CN112270313A (en) Online claims settlement method, device, equipment and storage medium
CN112364736A (en) Dynamic facial expression recognition method, device and equipment
KR20230105814A (en) Apparatus and method for generating images using generative adversarial network and quality filtering

Legal Events

Date Code Title Description
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant