KR20210105775A - Method and apparatus for cloud outsorcing task checking by using artificial intelligent - Google Patents
Method and apparatus for cloud outsorcing task checking by using artificial intelligent Download PDFInfo
- Publication number
- KR20210105775A KR20210105775A KR1020200020688A KR20200020688A KR20210105775A KR 20210105775 A KR20210105775 A KR 20210105775A KR 1020200020688 A KR1020200020688 A KR 1020200020688A KR 20200020688 A KR20200020688 A KR 20200020688A KR 20210105775 A KR20210105775 A KR 20210105775A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- work
- artificial intelligence
- worker
- task
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06316—Sequencing of tasks or work
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Image Analysis (AREA)
Abstract
Description
본 발명은 인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법 및 장치에 관한 것이다. 보다 상세하게는 아웃소싱 작업 결과물을 기초로 작업자 및 작업결과물의 평가 및 선별을 수행하는 인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for inspecting crowd outsourcing tasks using artificial intelligence. More specifically, it relates to a method and apparatus for crowd-outsourcing work inspection using artificial intelligence that performs evaluation and selection of workers and work results based on the outsourcing work results.
최근 인공지능(Artificial Intelligence, AI) 기술이 발달함에 따라 이미지, 음성, 텍스트 등 디지털 형태의 컨텐츠에 포함된 특정 객체를 인식하는 인공지능에 대한 연구가 활발하게 진행되고 있다. 특히, 디지털 카메라를 통해 생성된 디지털 이미지 내에서 특정 객체를 인식하여 촬영된 지역의 상황을 판단하는 인공지능 기술은 감시카메라, 자율주행 자동차에 적용되는 등 다양한 산업분야에 활용되고 있다.Recently, with the development of artificial intelligence (AI) technology, research on artificial intelligence for recognizing specific objects included in digital content such as images, voices, and texts is being actively conducted. In particular, artificial intelligence technology that recognizes a specific object within a digital image generated by a digital camera and determines the situation of a photographed area is being used in various industrial fields, such as applied to surveillance cameras and autonomous vehicles.
인공지능을 사용하여 디지털 컨텐츠 내의 특정 객체를 인식하기 위해서는 인식하고자 하는 객체가 포함된 다양한 학습 데이터들을 사용하여 인공지능을 미리 학습시켜야 한다. In order to recognize a specific object in digital content using artificial intelligence, it is necessary to train artificial intelligence in advance using various learning data including the object to be recognized.
학습 데이터는 인공지능으로 하여금 디지털 컨텐츠 내의 객체와 비객체를 구별할 수 있도록, 디지털 컨텐츠 내에 존재하는 객체의 윤곽, 영역 등을 표시하여 제공될 수 있다. 그러나, 객체와 비객체가 구별되어 있는 데이터는 존재하지 않으므로, 디지털 컨텐츠 내에서 객체의 윤곽, 영역 등을 표시하는 작업은 사람에 의해서 수행될 수밖에 없다.The learning data may be provided by displaying an outline, a region, etc. of an object existing in the digital content so that the artificial intelligence can distinguish between an object and a non-object in the digital content. However, since there is no data in which objects and non-objects are distinguished, an operation of displaying an outline, an area, etc. of an object in digital content is inevitably performed by a human.
인공지능은 다양하고 많은 학습 데이터를 학습할수록 인식 정확도가 향상되므로, 되도록 많은 학습 데이터를 학습시키는 것이 중요하다. 최근에는 학습 데이터를 용이하게 생성하도록 인터넷을 통해 다수의 작업자들을 모집하여 디지털 컨텐츠 내의 객체의 윤곽, 영역 등을 표시하는 작업을 의뢰하는 크라우드 아웃소싱 방식의 학습 데이터를 생성 방법이 사용되고 있다. As artificial intelligence learns a lot of diverse and learning data, the recognition accuracy improves, so it is important to learn as much learning data as possible. Recently, a crowd-outsourcing method of generating learning data has been used in which a plurality of workers are recruited through the Internet to easily generate the learning data and the task of displaying the outline, area, etc. of an object in digital content is requested.
이때, 작업자들마다 객체가 포함된 영역을 다르게 판단할 수 있으며, 작업자들이 성실하지 않게 작업을 진행하여 바람직하지 않은 학습 데이터가 생성되는 문제가 발생될 수 있다. 이 경우, 학습 데이터 생성 작업이 제대로 완료되었는지를 검수자가 개별로 검수를 해야 하는 불편함이 존재하며, 바람직하지 못한 학습 데이터에 기반하여 학습된 인공지능이 실제 상황에서 객체를 제대로 인식하지 못하는 문제가 발생될 수 있다. At this time, each worker may determine the area including the object differently, and the worker may work insincerely, thereby generating undesirable learning data. In this case, there is the inconvenience that the inspector has to individually inspect whether the learning data creation task has been properly completed, and the problem that the artificial intelligence learned based on undesirable learning data does not properly recognize the object in the real situation can occur.
이에, 인공지능 학습을 효율적으로 수행할 수 있도록 크라우드 아웃소싱 방식의 작업 결과물을 검수할 수 있는 관리 기술에 대한 개발이 요구된다. Accordingly, it is required to develop a management technology that can inspect the work results of the crowd-outsourcing method so that AI learning can be performed efficiently.
본 발명은 우수한 품질의 아웃소싱 작업된 학습 데이터가 선별되거나 검수되어 학습될 수 있도록 설계된 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치 및 방법을 제공한다.The present invention provides an apparatus and method for inspecting a crowd outsourcing operation using artificial intelligence designed so that outsourced learning data of excellent quality can be selected or inspected and learned.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예에 따른 인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법은, 통신부가 인터넷을 통해 복수의 작업자 단말로부터 학습 데이터 형성 작업에 대한 완료 데이터를 수신하는 데이터 수신 단계; 인공지능 모듈에 의해 제어되는 프로세서가 상기 완료 데이터를 중첩 가능한 데이터로 재구성하는 데이터 재구성 단계; 및 상기 인공지능 모듈에 의해 제어되는 프로세서가 상기 재구성된 데이터를 복수의 작업자 별로 분석하여 상기 복수의 작업자별 성향, 정확도, 상기 학습 데이터 형성 작업의 난이도 중 적어도 하나를 결정하는 성향 결정 단계를 포함한다.As a technical means for achieving the above-described technical problem, the method of inspecting a crowd outsourcing operation using artificial intelligence according to an embodiment of the present invention, the communication unit receives the completed data for the learning data formation operation from a plurality of worker terminals through the Internet receiving data; a data reconstruction step in which the processor controlled by the artificial intelligence module reconstructs the completed data into superimposable data; and a propensity determining step in which the processor controlled by the artificial intelligence module analyzes the reconstructed data for each of a plurality of workers and determines at least one of the propensity, accuracy, and difficulty of the learning data formation task for each of the plurality of workers. .
상기 데이터 재구성 단계는 상기 완료 데이터의 종류에 따라, 1차원 데이터인 경우 벡터로 재구성하고, 2차원 데이터인 경우 전체 면을 분할한 분할된 면을 가진 메트리스로 재구성할 수 있다.In the data reconstruction step, depending on the type of the completed data, one-dimensional data may be reconstructed into a vector, and in the case of two-dimensional data, the entire surface may be reconstructed into a matrix having a divided surface.
상기 성향 결정 단계는 상기 복수의 작업자 단말별 상기 재구성 데이터로부터 상기 분할된 면에 해당하는 원소를 가진 메트리스로 상기 복수의 작업자 단말별 마스크를 생성하는 마스크 생성 단계 및 상기 마스크를 분석하여 상기 복수의 작업자별 성향, 정확도, 상기 학습 데이터 형성 작업의 난이도 중 적어도 하나를 결정하는 성향 분석 단계일 수 있다.The tendency determining step is a mask generating step of generating a mask for each of the plurality of worker terminals with a matrix having an element corresponding to the divided surface from the reconstruction data for each of the plurality of operator terminals, and analyzing the mask to analyze the plurality of workers It may be a propensity analysis step of determining at least one of star propensity, accuracy, and difficulty of the learning data forming task.
상기 성향 분석 단계는 작업에 대한 상기 복수의 작업자 단말별 마스크 사이의 편차로부터 상기 작업에 대한 상기 학습 데이터 형성 작업의 난이도를 결정할 있다.The tendency analysis step may determine the difficulty of the learning data forming task for the task from the deviation between the masks for each of the plurality of worker terminals for the task.
상기 성향 결정 단계는 상기 마스크 생성단계와 상기 성향 분석 단계 사이에 상기 복수의 작업자 단말별 마스크를 병합하여 Trimap을 생성하는 Trimap 생성단계를 더 포함할 수 있다.The propensity determining step may further include a Trimap generating step of generating a Trimap by merging the masks for each of the plurality of worker terminals between the mask generating step and the propensity analyzing step.
상기 Trimap 생성 단계에서 상기 복수의 작업자 단말별 마스크를 병합하는 방법은 상기 Trimap에 상기 복수의 작업자 단말별 마스크의 상기 원소의 값의 평균을 나타내는 방법일 수 있다.The method of merging the masks for each of the plurality of worker terminals in the Trimap generation step may be a method of indicating an average of the values of the elements of the masks for each of the plurality of operator terminals in the Trimap.
상기 성향 결정 단계는 상기 복수의 작업자 단말 중 대상 작업자 단말의 마스크와 상기 Trimap의 유사도를 산출함으로써, 상기 대상 작업자 단말의 상기 정확도를 결정할 수 있다.The tendency determining step may determine the accuracy of the target worker terminal by calculating a similarity between the mask of the target worker terminal and the Trimap among the plurality of worker terminals.
상기 성향 결정 단계는 상기 유사도를 산출하는 방법으로서, 상기 대상 작업자 단말의 마스크 전체에 대하여 각 원소별로 계산된 코사인 유사도(cosine similarity)를 사용하며, 상기 코사인 유사도에 대입하는 일변수로 원소별 차를 사용하고, 다른 변수로 상기 대상 작업자 단말의 마스크에 표시된 인식으로 표시된 원소의 값을 사용하며, 상기 원소별 차는 상기 Trimap에 표시된 상기 원소의 값과 상기 대상 작업자 단말의 마스크에 표시된 상기 원소의 값의 차일 수 있다.The propensity determining step is a method of calculating the similarity, using a cosine similarity calculated for each element with respect to the entire mask of the target worker terminal, and determining the difference between elements as one variable to be substituted for the cosine similarity. using, as another variable, the value of the element indicated by the recognition displayed on the mask of the target operator terminal, and the difference for each element is the value of the element displayed on the Trimap and the value of the element displayed on the mask of the target operator terminal it could be a car
상기 성향 결정 단계는 상기 유사도를 산출하는 방법으로서, 원소별 차의 총합을 상기 Trimap에서 값이 0보다 큰 원소의 수로 나눈 값의 1에 대한 보수로 특정하며 상기 원소별 차는 상기 Trimap에 표시된 상기 원소의 값과 상기 대상 작업자 단말의 마스크에 표시된 상기 원소의 값의 차일 수 있다.The tendency determining step is a method of calculating the degree of similarity, wherein the sum of differences for each element is specified as a complement of 1 of a value obtained by dividing the number of elements with a value greater than 0 in the Trimap, and the difference for each element is the element displayed in the Trimap. It may be a difference between the value of and the value of the element displayed on the mask of the target worker terminal.
상기 성향 결정 단계는 대상 작업자 단말의 마스크 중 선택 원소에 대응되는 상기 Trimap에서 원소의 평균을 산출함으로써, 상기 대상 작업자 단말의 작업 성향을 결정할 수 있다.The tendency determining step may determine the working tendency of the target worker terminal by calculating an average of elements in the Trimap corresponding to the selected element among the masks of the target worker terminal.
상기 성향 결정 단계는 상기 Trimap에서 대상 작업자 단말의 마스크에 대응되는 원소의 값의 합을 선택 원소의 수로 나눈 OMS(Opacity Mask Score) 값을 작업 성향으로 결정할 수 있다.The tendency determining step may determine an Opacity Mask Score (OMS) value obtained by dividing the sum of values of elements corresponding to the mask of the target worker terminal by the number of selected elements in the Trimap as the work tendency.
상기 성향 결정 단계는 상기 작업 난이도를 산출하는 방법으로서, 상기 Trimap에서 표시된 상기 원소의 값의 합을 상기 원소의 값이 0보다 큰 상기 원소의 수로 나눈 값으로 결정할 수 있다.The tendency determining step is a method of calculating the work difficulty, and may be determined as a value obtained by dividing the sum of the values of the elements displayed in the Trimap by the number of the elements in which the value of the element is greater than zero.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예에 따른 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치는 복수의 작업자 단말로부터 작업 데이터에 대한 작업이 완료된 완료 데이터를 수신하는 통신부, 상기 복수의 작업자 단말로부터 수신된 상기 완료 데이터들을 검수하는 연산을 수행하도록 구성된 프로세서 및 상기 프로세서의 연산 동작을 제어하는 인공지능 모듈이 저장된 메모리를 포함하고, 상기 인공지능 모듈은 2 이상의 상기 완료 데이터를 분석하여, 작업자의 정확도, 작업자의 성향, 작업의 난이도 중 적어도 하나 이상을 결정할 수 있다.As a technical means for achieving the above-described technical problem, the crowd outsourcing work inspection apparatus using artificial intelligence according to an embodiment of the present invention is a communication unit for receiving the work completion data for the work data from a plurality of worker terminals, the A processor configured to perform an operation for inspecting the completed data received from a plurality of worker terminals and a memory in which an artificial intelligence module for controlling an operation operation of the processor is stored, wherein the artificial intelligence module analyzes two or more of the completed data Thus, it is possible to determine at least one or more of the accuracy of the operator, the tendency of the operator, and the difficulty of the operation.
본 발명의 일 실시예에 따르면, 완료 데이터로부터 작업자의 성향 또는 정확도가 산출되어, 크라우드 아웃소싱 작업의 품질을 보다 정확히 측정할 수 있다.According to an embodiment of the present invention, the propensity or accuracy of the worker is calculated from the completed data, so that the quality of the crowd outsourcing work can be measured more accurately.
본 발명의 실시예에 따르면, 학습 데이터의 작업 난이도가 산출되고, 이를 완료 데이터의 품질 판단에 반영하여, 대부분의 검수는 인공지능 모듈을 통해 수행되므로, 전문가들의 업무 부하가 충분히 감소될 수 있으며, 크라우드 아웃소싱 작업의 효율성이 향상될 수 있다.According to an embodiment of the present invention, the task difficulty of the learning data is calculated, and this is reflected in the quality determination of the completed data, so that most of the inspection is performed through the artificial intelligence module, the work load of experts can be sufficiently reduced, The efficiency of crowd outsourcing operations can be improved.
도 1은 본 발명의 일 실시예에 따른 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치를 나타낸 블럭도이다.
도 2는 본 발명의 일 실시예에 따른 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치를 사용한 작업 관리 방법을 설명하기 위한 흐름도이다.
도 3은 도 2의 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치에서 데이터를 처리하는 방법을 설명하기 위한 흐름도이다.
도 4는 도 2 및 3의 인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법에서 작업 데이터를 생성하고 분배되는 과정을 설명하기 위한 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 작업자별 성향 등 결정 단계를 설명하기 위한 흐름도이다.
도 6 내지 도 11은 도 2의 인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법에서 작업자별 정확도, 성향 및 작업 난이도를 판단하는 일 예를 설명하기 위한 예시도들이다.
도 12는 도 2의 인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법에서 작업자별 반영률을 결정하는 일 예를 설명하기 위한 예시도이다. 1 is a block diagram showing an apparatus for inspecting a crowd outsourcing operation using artificial intelligence according to an embodiment of the present invention.
2 is a flowchart illustrating a job management method using a crowd outsourcing job inspection device using artificial intelligence according to an embodiment of the present invention.
Figure 3 is a flowchart for explaining a method of processing data in the crowd outsourcing operation inspection device using artificial intelligence of Figure 2;
4 is a flowchart for explaining a process of generating and distributing job data in the method of inspecting crowd outsourcing jobs using artificial intelligence of FIGS. 2 and 3 .
5 is a flowchart illustrating a determination step, such as a propensity for each worker, according to an embodiment of the present invention.
6 to 11 are exemplary views for explaining an example of determining the accuracy, propensity, and work difficulty for each worker in the crowd outsourcing work inspection method using artificial intelligence of FIG. 2 .
FIG. 12 is an exemplary diagram for explaining an example of determining a reflection rate for each worker in the method of inspecting crowd outsourcing work using artificial intelligence of FIG. 2 .
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art can easily implement them. However, the present invention may be embodied in many different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.
본 문서의 다양한 실시 예들은 기기(machine)(예: 컴퓨터)로 읽을 수 있는 저장 매체(machine-readable storage media))에 저장된 명령어를 포함하는 소프트웨어(예: 프로그램)로 구현될 수 있다. 기기는, 저장 매체로부터 저장된 명령어를 호출하고, 호출된 명령어에 따라 동작이 가능한 장치로서, 개시된 실시 예들에 따른 전자 장치(예: 서버)를 포함할 수 있다. 명령은 컴파일러 또는 인터프리터에 의해 생성 또는 실행되는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, ‘비일시적’은 저장매체가 신호(signal)를 포함하지 않으며 실재(tangible)한다는 것을 의미할 뿐 데이터가 저장매체에 반영구적 또는 임시적으로 저장됨을 구분하지 않는다.Various embodiments of the present document may be implemented as software (eg, a program) including instructions stored in a machine-readable storage medium (eg, a computer). A device is a device capable of calling a stored command from a storage medium and operating according to the called command, and may include an electronic device (eg, a server) according to the disclosed embodiments. Instructions may include code generated or executed by a compiler or interpreter. The device-readable storage medium may be provided in the form of a non-transitory storage medium. Here, 'non-transitory' means that the storage medium does not include a signal and is tangible, and does not distinguish that data is semi-permanently or temporarily stored in the storage medium.
일 실시 예에 따르면, 본 문서에 개시된 다양한 실시 예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 온라인으로 배포될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중개 서버의 메모리와 같은 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.According to an embodiment, the method according to various embodiments disclosed in this document may be included and provided in a computer program product. Computer program products may be traded between sellers and buyers as commodities. The computer program product may be distributed in the form of a machine-readable storage medium (eg, compact disc read only memory (CD-ROM)) or online through an application store (eg, Play Store™). In the case of online distribution, at least a portion of the computer program product may be temporarily stored or temporarily created in a storage medium such as a memory of a server of a manufacturer, a server of an application store, or a mediation server.
다양한 실시 예들에 따른 구성 요소(예: 모듈 또는 프로그램) 각각은 단수 또는 복수의 개체로 구성될 수 있으며, 전술한 해당 서브 구성 요소들 중 일부 서브 구성 요소가 생략되거나, 또는 다른 서브 구성 요소가 다양한 실시 예에 더 포함될 수 있다. 대체적으로 또는 추가적으로, 일부 구성 요소들(예: 모듈 또는 프로그램)은 하나의 개체로 통합되어, 통합되기 이전의 각각의 해당 구성 요소에 의해 수행되는 기능을 동일 또는 유사하게 수행할 수 있다. 다양한 실시 예들에 따른, 모듈, 프로그램 또는 다른 구성 요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱하게 실행되거나, 적어도 일부 동작이 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.Each of the components (eg, a module or a program) according to various embodiments may be composed of a singular or a plurality of entities, and some sub-components of the aforementioned sub-components may be omitted, or other sub-components may be various. It may be further included in the embodiment. Alternatively or additionally, some components (eg, a module or a program) may be integrated into a single entity to perform the same or similar functions performed by each corresponding component prior to integration. According to various embodiments, operations performed by a module, program, or other component may be sequentially, parallel, repetitively or heuristically executed, or at least some operations may be executed in a different order, omitted, or other operations may be added. can
본 명세서에서 “정보 또는 데이터를 송신, 수신, 수집, 추출, 업로드 또는 갱신한다”는 의미는 정보 또는 데이터를 직접 송신, 수신, 수집, 추출, 업로드 또는 갱신하거나 다른 중계 서버를 통해 간접적으로 송신, 수신, 수집, 추출, 업로드 또는 갱신한다는 의미를 포함한다.As used herein, the meaning of “sending, receiving, collecting, extracting, uploading or updating information or data” means directly sending, receiving, collecting, extracting, uploading or updating information or data, or indirectly transmitting, through another relay server; includes the meaning of receiving, collecting, extracting, uploading or updating.
이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.
본 발명은 크라우드 아웃소싱 작업 검수 방법 및 장치로서, 인공지능을 이용한 크라우드 아웃소싱 작업 관리 장치에 활용될 수 있다. 본 명세서에서는 본 발명의 실제 활용 모습을 보이기 위해 크라우드 아웃소싱 작업 관리 장치 및 방법 전체를 개략적으로 설명하면서, 검수 과정을 구체적으로 설명한다.The present invention is a method and apparatus for inspecting a crowd outsourcing task, and may be utilized in a device for managing a crowd outsourcing task using artificial intelligence. In this specification, while schematically explaining the entire crowd outsourcing operation management apparatus and method to show the actual application of the present invention, the inspection process will be described in detail.
크라우드 아웃소싱 작업 관리 방법은 크라우드 아웃소싱 작업 데이터를 생성하고 작업자에게 분배한 후 그 작업 결과물을 취합하는 단계, 취합된 작업물을 검수하는 단계, 검수된 결과물을 그 가치에 따라 인공지능에 학습시키는 단계로 나누어 파악할 수 있다. 크라우드 아웃소싱 작업 검수 방법은 그 중 두번째 단계에 해당한다. 크라우드 아웃소싱 작업 검수 장치는 크라우드 아웃소싱 작업 관리 장치와 동일한 프로세서를 사용하므로, 이들은 실질적으로 동일한 개체를 지칭할 수 있다. 본 명세서에서는 크라우드 아웃소싱 작업 검수 장치로 통칭하며, 해당 장치가 크라우드 아웃소싱 작업 관리 기능을 더 할 수 있는 것으로 기술한다.The crowd outsourcing job management method is a step of creating and distributing crowd outsourcing job data to workers, collecting the job results, inspecting the collected work, and learning the inspected results to AI according to its value. can be divided. Crowd-outsourcing work inspection method is the second step among them. Since the crowd-outsourced job review device uses the same processor as the crowd-outsourced job management device, they may refer to substantially the same entity. In this specification, it is collectively referred to as a crowd outsourcing work inspection device, and the device is described as being capable of adding a crowd outsourcing work management function.
도 1은 본 발명의 일 실시예에 따른 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치를 나타낸 블럭도이다.1 is a block diagram showing an apparatus for inspecting a crowd outsourcing operation using artificial intelligence according to an embodiment of the present invention.
도 1을 참조하면, 본 발명의 일 실시예에 따른 크라우드 아웃소싱 작업 검수 장치(400)는 인공지능 모듈을 학습시키기 위한 학습 데이터를 생성하는 데이터 전처리 작업들을 관리하는 시스템의 장치를 의미할 수 있다. 구체적으로, 크라우드 아웃소싱 작업 검수 장치(400)는 복수의 작업자 단말들(100, 200, 300)로부터 작업에 대한 완료 데이터가 수신되는 경우, 완료 데이터의 일부를 검수하여 바람직한 학습 데이터를 생성하며, 검수가 어려운 나머지 완료 데이터를 검수자 단말(500)로 송신하여 전문 검수자의 검수가 수행되도록 학습 데이터 생성 작업을 관리하는 장치일 수 있다. 그러나, 크라우드 아웃소싱 작업 검수 장치(400)는 완료된 작업 데이터만을 대상으로 검수작업을 수행할 수 있으므로, 본 데이터 전처리 작업 및 데이터 송신 기능은 없어도 무방하다.Referring to FIG. 1 , an
크라우드 아웃소싱 작업 검수 장치(400)는 네트워크 서버, 웹 서버, 파일 서버, 슈퍼컴퓨터, 데스크탑 컴퓨터 등과 같은 컴퓨팅 장치들의 임의의 유형 또는 유형들의 조합일 수 있다.The crowd outsourced
크라우드 아웃소싱 작업 검수 장치(400)는 통신부(410), 프로세서(420), 메모리(430)를 포함한다. The crowd outsourcing
통신부(410)는 복수의 작업자 단말들(100, 200, 300)로 작업 데이터를 송신할 수 있으며, 작업 데이터에 대한 작업이 완료된 경우, 복수의 작업자 단말들(100, 200, 300)로부터 완료 데이터를 수신하도록 구성된다. 이때, 작업 데이터는 복수의 작업자 단말들(100, 200, 300)의 일부씩 그룹을 지어서 순차적으로 송신할 수 있으며, 완료 데이터 역시 완료되는 순서에 따라 순차적으로 수신할 수 있다. 또한, 송신과 수신은 동시에 이루어질 수 있다. 다만, 크라우드 아웃소싱 작업 검수 장치(400)가 검수 작업만을 수행할 경우 복수의 작업자 단말들(100, 200, 300)로 데이터를 송신하는 기능이 없어도 무방하다.The
통신부(410)는 인터넷에 접속되어 인터넷을 통해 작업자 단말들(100, 200, 300) 및 검수자 단말(500)과 데이터를 송수신할 수 있는 네트워크 어댑터로 구성될 수 있다. 통신부(410)는 유선 (LAN 또는 WAN) 또는 무선 (블루투스, WiFi, IrDA(Infrared data association) 방식을 통해 인터넷에 접속되도록 구성될 수 있다. The
프로세서(420)는 복수의 작업자 단말들(100, 200, 300)로 송신할 작업 데이터를 생성할 수 있으며, 복수의 작업자 단말들(100, 200, 300)로부터 수신된 완료 데이터를 검수하는 연산을 수행하도록 구성된다. The
프로세서(420)는 상술한 연산 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU, GPU(graphical processing units), 싱글 코어 프로세서, 멀티 코어 프로세서, ASIC(application specific integrated circuits) 등), 또는 커뮤니케이션 프로세서(communication processor) (CP) 중 하나 또는 그 이상을 포함할 수 있다.The
메모리(430)는 프로세서(420)의 연산 동작을 제어하는 인공지능 모듈이 저장된 장치로서, 예를 들어, SSD(solid state drive), 하드디스크(hard disk drive), 카드 타입의 메모리(SD 또는 XD 메모리 등), 램(random access memory, RAM), SRAM(static random access memory), 롬(read-only memory, ROM), EEPROM(electrically erasable programmable read-only memory), PROM(programmable read-only memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체 및 이에 대한 식별 가능한 물리적 위치 정보를 저장할 수 있는 다양한 저장매체로 구현될 수 있다. 도 1에서는 메모리(430)가 크라우드 아웃소싱 작업 검수 장치(400) 내에 위치된 것으로 도시되어 있으나, 몇몇 실시예에서, 메모리(430)는 크라우드 아웃소싱 작업 검수 장치(400)와 물리적으로 분리된 별도의 장치로 구성될 수 있다. 이 경우, 메모리(430)와 크라우드 아웃소싱 작업 검수 장치(400)는 네트워크를 통해 연결될 수 있다.The
인공지능 모듈은 크라우드 아웃소싱 작업 검수 장치(400)의 동작을 제어하기 위한 명령어들의 집합으로서, 임의의 적절한 프로그래밍 언어로 기술되어 전술한 다양한 기능을 수행하는 컴퓨터- 또는 머신- 실행가능 명령어를 포함할 수 있다. The artificial intelligence module is a set of instructions for controlling the operation of the crowd-outsourced
통신부가 인터넷을 통해 복수의 작업자 단말들(100, 200, 300)로부터 작업 데이터에 대한 작업이 완료된 완료 데이터를 수신하는 경우, 인공지능 모듈에 의해 제어되는 프로세서가 완료 데이터를 중첩 가능한 데이터로 재구성한다.When the communication unit receives the completed data on which the work for the work data is completed from the plurality of
또한, 인공지능 모듈에 의해 제어되는 프로세서는 복수의 작업자별 작업에 대한 정확도, 성향 및 작업 난이도를 판단하고, 복수의 작업자별 정확도 및 작업 난이도에 기초하여 복수의 작업자별 반영률을 결정하고, 반영률에 기초하여 복수의 작업자별 완료 데이터 검수를 위한 검수 기준 데이터를 결정하도록 구성된다. 인공지능 모듈의 동작들에 대해서는 도 2 내지 도 12를 참조하여 좀더 자세히 설명하기로 한다. In addition, the processor controlled by the artificial intelligence module determines the accuracy, propensity and work difficulty for the work for each worker, and determines the reflection rate for each worker based on the accuracy and difficulty level for the plurality of workers, and to the reflection rate. It is configured to determine the inspection reference data for the inspection of the completed data by a plurality of workers based on it. Operations of the artificial intelligence module will be described in more detail with reference to FIGS. 2 to 12 .
한편, 작업자 단말들(100, 200, 300)은 작업자들이 사용하는 단말로서, 작업 데이터를 처리하여 완료 데이터를 생성하기 위한 컴퓨팅 장치로 구현될 수 있다. 또한, 검수자 단말(500)은 검수자가 사용하는 단말로서, 완료 데이터들 중 전문 검수가 필요한 완료 데이터에 대한 검수를 수행하기 위한 컴퓨팅 장치로 구현될 수 있다. 예를 들어, 작업자 단말들(100, 200, 300) 및 검수자 단말(500)은 스마트폰, 태블릿 PC, 이동 전화기, 영상 전화기, 전자책 리더기, 데스크탑 PC, 랩탑 PC, 넷북 컴퓨터, 워크스테이션, 서버, PDA, PMP, MP3 플레이어, 모바일 의료기기, 카메라, 또는 웨어러블 장치 중 적어도 하나로 구현될 수 있다.Meanwhile, the
도 2는 본 발명의 일 실시예에 따른 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치를 사용한 작업 관리 방법을 설명하기 위한 흐름도이며, 도 3은 도 2의 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치에서 데이터를 처리하는 방법을 설명하기 위한 흐름도이다.Figure 2 is a flowchart for explaining a job management method using the crowd outsourcing job inspection device using artificial intelligence according to an embodiment of the present invention, Figure 3 is the data from the crowd outsourcing job inspection device using the artificial intelligence of Figure 2 It is a flowchart for explaining the processing method.
도 2 및 3을 참조하면, 먼저, 크라우드 아웃소싱 검수 장치는 작업 대상 데이터의 작업 대상 영역을 설정하여 작업 데이터를 생성(S210)할 수 있다. Referring to FIGS. 2 and 3 , first, the crowd outsourcing inspection apparatus may set a work target area of the work target data to generate the job data ( S210 ).
“작업 대상 데이터”는 작업자 단말(100)로 송신할 작업 데이터의 원본 데이터를 의미하며, 작업 대상 데이터는 디지털 이미지, 텍스트, 음향 등 다양한 형태의 데이터로 구성될 수 있다. 크라우드 아웃소싱 작업 검수 장치(400)는 작업 대상 데이터를 인공지능 모듈을 사용하여 전처리함으로써, 작업 데이터를 생성한다. “Work target data” means original data of work data to be transmitted to the
인공지능을 이용한 크라우드 아웃소싱 작업 분배 방법은 인공지능 모듈에 의해 제어되는 프로세서가 작업이 필요한 작업 대상 데이터의 작업 대상 영역을 설정하여 작업 데이터를 생성하는 작업 데이터 생성 단계(S211), 통신부가 상기 작업 데이터를 인터넷에 접속된 복수의 작업자 단말 중 일부 작업자 단말에게 송신하는 송신 단계(S212) 및 상기 통신부로 상기 복수의 작업자 단말로부터 상기 작업 데이터에 대한 작업이 완료된 상기 완료 데이터가 수신되는 경우, 상기 완료 데이터에 기초하여 상기 인공지능 모듈을 학습시키는 수신 및 학습 단계(S213)를 포함하고, 작업 데이터 생성 단계, 송신 단계, 수신 및 학습 단계는 복수의 작업자 단말 중 기 설정된 수의 단말에게 송신할 때 또는 상기 작업 대상 데이터에 대한 작업이 완료될 때까지 반복된다. 이에 해당하는 구체적인 예는 도 4를 참조하여 후술한다.The crowd outsourcing work distribution method using artificial intelligence is a work data generation step (S211) in which the processor controlled by the artificial intelligence module sets the work target area of the work target data that requires work to generate the job data (S211), and the communication unit includes the job data A transmitting step (S212) of transmitting a plurality of worker terminals connected to the Internet to some of the worker terminals and the communication unit. and a receiving and learning step (S213) of learning the artificial intelligence module based on This is repeated until the operation on the target data is completed. A specific example corresponding to this will be described later with reference to FIG. 4 .
완료 데이터가 수신된 경우 완료 데이터를 검수할 수 있다. 완료 데이터를 검수하는 단계(S30)는 작업 데이터의 종류에 따라 작업 데이터를 중첩될 수 있는 데이터로 재구성하는 완료 데이터를 재구성하는 단계(S34) 및 완료 데이터를 분석하여 작업자의 정확도, 작업자의 작업 성향, 작업 난이도 등을 평가하는 작업자별 성향 등을 결정하는 단계(S220)를 포함한다. 이에 해당하는 구체적인 예는 도 5 내지 도 11를 참조하여 후술한다.When the completion data is received, the completion data can be inspected. The step of inspecting the completed data (S30) is a step of reconstructing the completed data that reconstructs the work data into data that can be overlapped according to the type of the work data (S34) and analyzing the completed data to determine the accuracy of the worker, the worker's work propensity , and a step (S220) of determining the propensity for each worker to evaluate the work difficulty, etc. A specific example corresponding to this will be described later with reference to FIGS. 5 to 11 .
작업자별 성향 평가 데이터 및 완료 데이터를 기초로 작업자별로 능력을 평가하여 작업물 검수 기준 데이터를 형성하는 단계(S55)를 추가로 수행할 수 있다. 작업물 검수 기준 데이터를 형성하는 단계(S55)는 작업물 검수 단계 이후 작업물의 검수에 활용할 검수 기준을 생성하는 단계이다. S30에서 작업물의 정확도가 산출되었으므로 이를 가중치로 반영하여 검수 기준 데이터를 직접 생성할 수도 있으나(S30), 작업 데이터의 난이도 및 작업물의 정확도에 따라 검수 기준을 기계적으로 생성하기 부적합한 작업이 있을 수 있으므로 해당 작업을 배제하는 필터링 단계(S230) 및 작업자별 능력을 미리 평가하여 활용하기 위한 작업자별 반영률 결정 단계(S240)를 추가로 수행하여 가중치에 따라 검수 기준 데이터를 생성(S250)하는 것이 바람직하다.(S55) 본 단계에 대한 구체적인 예는 도 12를 참조하여 후술한다.A step (S55) of forming work inspection reference data by evaluating the ability of each worker based on the worker-specific propensity evaluation data and the completed data may be additionally performed. The step of forming the work inspection standard data (S55) is a step of generating an inspection standard to be used for the inspection of the work after the work inspection step. Since the accuracy of the work is calculated in S30, it is possible to directly generate the inspection standard data by reflecting it as a weight (S30), but depending on the difficulty of the work data and the accuracy of the work, there may be tasks that are inappropriate to mechanically generate the inspection standards. It is preferable to additionally perform a filtering step (S230) to exclude a job and a reflection rate determination step (S240) for each worker to evaluate and utilize the capabilities of each worker in advance to generate the inspection reference data according to the weight (S250). ( S55) A specific example of this step will be described later with reference to FIG. 12 .
도 4는 도 2 및 도 3의 S210에 해당하는 작업 데이터가 생성되고 분배되는 과정을 설명하기 위한 흐름도이다. 4 is a flowchart illustrating a process in which job data corresponding to S210 of FIGS. 2 and 3 is generated and distributed.
도 4를 참조하면, 인공지능을 이용한 크라우드 아웃소싱 작업 분배 방법은 인공지능 모듈에 의해 제어되는 프로세서가 작업이 필요한 작업 대상 데이터의 작업 대상 영역을 설정하여 작업 데이터를 생성하는 작업 데이터 생성 단계, 통신부가 상기 작업 데이터를 인터넷에 접속된 복수의 작업자 단말 중 일부 작업자 단말에게 송신하는 송신 단계 및 상기 통신부로 상기 복수의 작업자 단말로부터 상기 작업 데이터에 대한 작업이 완료된 상기 완료 데이터가 수신되는 경우, 상기 완료 데이터에 기초하여 상기 인공지능 모듈을 학습시키는 수신 및 학습 단계를 포함하는 작업 데이터 생성 및 분배 단계를 상기 복수의 작업자 단말 중 기 설정된 수의 단말에게 송신할 때 또는 상기 작업 대상 데이터에 대한 작업이 완료될 때까지 반복한다. 이하 각 단계를 예를 들어 상세히 설명한다.Referring to Figure 4, the crowd outsourcing work distribution method using artificial intelligence is a work data generation step in which the processor controlled by the artificial intelligence module sets the work target area of the work target data that requires work to generate the work data, the communication unit A transmitting step of transmitting the work data to some of the worker terminals connected to the Internet, and the communication unit when the completed data on which the work on the work data is completed is received from the plurality of worker terminals to the communication unit, the completed data When transmitting a job data generation and distribution step comprising a receiving and learning step of learning the artificial intelligence module based on Repeat until Hereinafter, each step will be described in detail with an example.
크라우드 아웃소싱 작업 검수 장치의 인공지능 모듈은 제1 작업 대상 데이터에 대하여 작업 영역을 설정하여 제1 작업 데이터를 생성(S214)한다. The artificial intelligence module of the crowd-outsourcing work inspection device sets a work area for the first work target data to generate the first work data (S214).
앞서 언급한 바와 같이, 작업 대상 데이터는 인공지능 모듈이 학습해야 할 객체가 포함된 디지털 컨텐츠로서, 이미지, 텍스트, 음향 등 다양한 형태의 데이터로 구성될 수 있다. As mentioned above, the work target data is digital content including an object to be learned by the artificial intelligence module, and may be composed of various types of data such as images, texts, and sounds.
설명의 편의를 위해 이하에서는 작업 대상 데이터가 이미지 데이터로 구성된 경우를 예를 들어 설명하기로 한다. For convenience of explanation, a case in which the work target data is composed of image data will be exemplified below.
인공지능 모듈은 먼저 모든 작업 대상 데이터 중에서 제1 작업 대상 데이터를 임의로 선택하고, 제1 작업 대상 데이터에서 인공지능 모듈이 학습해야 할 객체가 위치하는 작업 대상 영역을 다른 영역과 구분되도록 설정함으로써, 제1 작업 대상 데이터를 생성한다. 예를 들어, 학습해야 할 객체가 “강아지”라면, 인공지능 모듈은 “강아지”를 포함하는 제1 작업 대상 데이터에서 “강아지”가 위치하는 영역의 경계선을 표시함으로써, 제1 작업 데이터를 생성할 수 있다. The artificial intelligence module first randomly selects the first work target data from all work target data, and sets the work target area where the object to be learned by the artificial intelligence module is located in the first work target data to be distinguished from other areas, 1 Create work target data. For example, if the object to be learned is a “dog”, the artificial intelligence module generates the first job data by marking the boundary of the area where the “dog” is located in the first job target data including the “dog”. can
이때, 인공지능 모듈이 “강아지”가 위치하는 영역의 경계선을 인식하는 방법은 후술할 Trimap을 이용할 수 있다. 다시 말해, 인공지능 모듈의 학습을 위한 자료로서, 복수의 작업자 단말별 완료 데이터로부터 학습에 활용되는 영역을 복수의 작업자 단말별 마스크로서 생성하고, 복수의 작업자 단말별 마스크를 병합하여 Trimap을 생성할 수 있으며, 이 Trimap에 포함되는 영역에서 기 설정된 수보다 높은 빈도로 학습에 활용되는 영역으로 표시된 부분을 작업 대상 영역으로 지정할 수 있다.In this case, a method for the AI module to recognize the boundary of the area where the “dog” is located may use Trimap, which will be described later. In other words, as data for learning the artificial intelligence module, the area used for learning from the completed data for each worker terminal is generated as a mask for each worker terminal, and a Trimap is generated by merging the masks for each worker terminal. In the area included in this Trimap, a part marked as an area used for learning with a frequency higher than a preset number can be designated as the work target area.
이후, 생성된 제1 작업 데이터를 인터넷에 접속된 복수의 작업자 단말 중 일부 작업자 단말에게 송신한다. 이때, 일부 작업자 단말은 작업 데이터를 우선 배정받으므로, 인공지능 모듈의 초기 학습 자료를 생성하게 된다. 인공지능 모듈이 향후 모든 작업 데이터 생산에 활용되므로, 인공지능 모듈의 초기 성능이 중요하며, 인공지능 모듈의 초기 성능을 좌우하는 초기 학습 자료의 질 역시 중요하다. 따라서, 초기 학습 자료의 질을 높이기 위하여, 제1 작업 데이터를 우선 수신받는 일부 작업자 단말은 우수한 능력을 가진 작업자 단말인 것이 유리하다. 이 우수 작업자 단말은 작업자의 경력, 전공분야 등 어떠한 기준으로 정해져도 무방하다. 다만, 인공지능을 이용한 크라우드 아웃소싱 검수 관리 장치는 각 단말기의 작업별 정확도를 평가하므로, 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치가 작업 데이터를 검수하는 과정에서 평가한 작업자의 정확도를 기준으로 일정 수준 이상의 작업자를 우수 작업자 단말로 지정할 수 있다. Thereafter, the generated first job data is transmitted to some worker terminals among a plurality of worker terminals connected to the Internet. At this time, since some worker terminals are given priority to work data, the initial learning material of the artificial intelligence module is generated. Since the AI module will be used for all future work data production, the initial performance of the AI module is important, and the quality of the initial learning material that determines the initial performance of the AI module is also important. Therefore, in order to improve the quality of the initial learning material, it is advantageous that some of the worker terminals receiving the first work data are worker terminals having excellent capabilities. This excellent worker terminal may be determined by any criteria, such as the worker's career and major field. However, since the crowd outsourcing inspection management device using artificial intelligence evaluates the accuracy for each job of each terminal, the crowd outsourcing job inspection device using artificial intelligence evaluates the worker's accuracy in the process of inspecting the job data. A worker can be designated as a good worker terminal.
이후, 크라우드 아웃소싱 작업 검수 장치는 작업자 단말(100)로부터 제1 작업 데이터에 대한 제1 완료 데이터를 수신(S215)한다. Then, the crowd outsourcing work inspection device receives the first completed data for the first work data from the worker terminal 100 (S215).
제1 완료 데이터는 작업자가 작업자 단말(100)을 통해 제1 작업 데이터에 대한 작업을 완료한 데이터를 의미한다. 예를 들어, 인공지능 모듈이 학습해야 할 객체가 “강아지”인 경우, 제1 작업 데이터에 대한 작업은 “강아지” 윤곽을 표시하는 작업일 수 있다. 작업자는 “강아지”가 위치된 영역의 경계선이 개략적으로 표시된 제1 작업 데이터에서 경계선을 “강아지” 윤곽에 맞도록 정밀하게 편집함으로써, 제1 완료 데이터를 생성할 수 있다. The first completed data means data in which the worker completes the work for the first work data through the
작업자 단말로부터 제1 완료 데이터가 수신되는 경우, 크라우드 아웃소싱 작업 검수 장치는 제1 완료 데이터에 기초하여 인공지능 모듈을 학습(S216) 시킨다. When the first completed data is received from the worker terminal, the crowd outsourcing task inspection device learns the artificial intelligence module based on the first completed data (S216).
제1 작업 데이터에는 “강아지”에 대한 경계선이 개략적으로 표시되어 있지만, 사람에 의해 작업된 제1 완료 데이터에는 “강아지”에 대한 경계선이 보다 정밀하게 표시되어 있을 것이다. Although the boundary line for “dog” is schematically displayed in the first work data, the boundary line for “dog” will be more precisely displayed in the first completed data worked by a human.
다수의 제1완료 데이터가 수신되었을 때, 이들 중 특정 작업자 단말의 정확도는 제1완료 데이터를 인공지능 모듈에 학습시키는 과정에서 산출된다. 완료 데이터들을 검수하고 평가하여 인공지능 모듈에 학습시키는 과정은 후술한다.When a plurality of first completed data is received, the accuracy of a specific worker terminal among them is calculated in the process of learning the first completed data to the artificial intelligence module. The process of inspecting and evaluating the completed data and training the AI module will be described later.
인공지능 모듈은 제1 완료 데이터에 기반하여 학습되며, 학습이 완료된 인공지능 모듈을 사용하는 경우, “강아지”를 포함하는 다른 이미지에 대하여 보다 정확하고 정밀하게 “강아지”에 대한 작업 영역이 설정될 수 있다. The artificial intelligence module is learned based on the first completed data, and when the learned artificial intelligence module is used, the work area for "dog" will be set more accurately and precisely with respect to other images including "dog". can
이후, 크라우드 아웃소싱 작업 검수 장치는 학습된 인공지능 모듈에 기초하여 제2 작업 대상 데이터에 대하여 작업 영역을 설정하여 제2 작업 데이터를 생성(S217)한다. Thereafter, the crowd outsourcing work inspection device sets a work area for the second work target data based on the learned artificial intelligence module to generate the second work data (S217).
제2 작업 대상 데이터는 제1 작업 대상 데이터를 제외한 나머지 작업 대상 데이터 중 선택된 작업 대상 데이터일 수 있다. 예를 들어, 작업 대상 데이터가 “강아지”가 포함된 100개의 이미지 데이터로 구성된 경우, 제1 작업 대상 데이터는 “강아지”가 포함된 10개의 이미지로 구성될 수 있다. 인공지능 모듈은 10개의 제1 작업 대상 데이터에서 “강아지”가 포함된 영역을 표시함으로써, 제1 작업 데이터를 생성하고, 작업자 단말로부터 10개의 제1 작업 대상 데이터에 대한 작업이 완료된 제1 완료 데이터가 수신되는 경우, 제1 완료 데이터에 기반하여 학습될 수 있다. 학습이 완료된 인공지능 모듈은 다른 10개의 이미지로 구성된 제2 작업 대상 데이터에 대해 “강아지”가 포함된 영역을 좀더 정밀하게 표시할 수 있으며, 인공지능 모듈을 통해 제2 작업 데이터가 생성된다. 이후, 제2 작업 데이터가 복수의 작업자 단말로 송신되고, 작업자 단말로부터 제2 작업 데이터에 대한 작업이 완료된 제2 완료 데이터가 수신되는 경우, 제2 완료 데이터에 기초하여 인공지능 모듈이 학습된다. 마찬가지 방법으로 인공지능 모듈을 통해 또 다른 10개의 이미지로 구성된 제3 작업 대상 데이터에 대하여 “강아지”가 포함된 영역을 설정하여 제3 작업 데이터가 생성된다. 이 경우, 학습된 인공지능 모듈은 제2 작업 대상 데이터를 처리하는 경우보다 더욱 정밀하게 제3 작업 대상 데이터에 대하여 “강아지”가 포함된 영역을 표시할 수 있다. 동일한 방법으로 작업 대상 데이터에 대한 작업이 완료될 때까지 인공지능 모듈은 주기적으로 학습되며, 인공지능 모듈을 통해 생성되는 작업 데이터의 정밀도는 학습이 거듭될수록 향상될 수 있다. The second work target data may be selected work target data among the remaining work target data except for the first work target data. For example, when the work target data consists of 100 image data including “dogs”, the first work target data may consist of 10 images including “dogs”. The artificial intelligence module generates the first work data by displaying the area including the “dog” in the 10 first work target data, and the first completed data in which the work on the 10 first work target data is completed from the worker terminal When is received, it may be learned based on the first completed data. The learned AI module can more precisely display the area including “dog” for the second task data composed of 10 other images, and the second task data is generated through the artificial intelligence module. Thereafter, when the second job data is transmitted to a plurality of worker terminals, and the second completed data in which the work for the second work data is completed is received from the worker terminal, the artificial intelligence module is learned based on the second completed data. In the same way, the third work data is generated by setting the area including “dog” for the third work target data composed of another 10 images through the artificial intelligence module. In this case, the learned artificial intelligence module may display a region including “dog” for the third work target data more precisely than when processing the second work target data. In the same way, the AI module is periodically trained until the job on the target data is completed, and the precision of the job data generated through the AI module can be improved as the learning is repeated.
다시 말해서, 인공지능 모듈이 작업 대상 데이터로부터 작업 데이터를 생성/송신하는 단계와 완료 데이터를 수신하여 인공지능 모듈을 학습시키는 단계가 반복하여 수행될 수 있다. 이 단계는 작업 대상 데이터에 대한 작업이 모두 분배될 때까지 반복될 수 있으며, 동일한 작업 대상 데이터에 대한 중복 작업인 경우 기 설정된 수의 작업자 단말에 작업 데이터를 생성하여 송부할 때까지 반복하여 수행될 수도 있다.In other words, the step of generating/transmitting the job data from the job target data by the AI module and the step of receiving the completion data and learning the AI module may be repeatedly performed. This step may be repeated until all the tasks for the task data are distributed, and in the case of a duplicate task for the same task data, it will be repeatedly performed until the task data is generated and sent to a preset number of worker terminals. may be
몇몇 실시예에서, 인공지능 모듈의 학습은 제1 완료 데이터에 기반하지 않고, 검수가 완료된 제1 정답 데이터에 기반하여 수행될 수 있다. 즉, 인공지능 모듈은 제2 작업 대상 데이터를 처리하기에 앞서, 제1 완료 데이터에 대한 검수가 완료되어 확정된 제1 정답 데이터에 기반하여 학습될 수 있고, 학습된 인공지능 모듈을 통해 제2 작업 대상 데이터가 처리되어 제2 작업 데이터가 생성될 수 있다. 이 경우, 제1 정답 데이터는 이하에서 후술하는 완료 데이터의 검수 방법에 따라 검수가 완료되어 최종적으로 정답이라고 추론된 데이터에 대응될 수 있다.In some embodiments, the learning of the artificial intelligence module may be performed based on the first correct answer data that has been checked, not based on the first completed data. That is, the artificial intelligence module may be learned based on the first correct answer data determined by completing the inspection of the first completed data prior to processing the second work target data, and through the learned artificial intelligence module, the second The work target data may be processed to generate second work data. In this case, the first correct answer data may correspond to the data inferred to be the final correct answer by completing the inspection according to the inspection method of the completed data to be described later.
이상의 내용은 작업 데이터를 생성하고 분배하는 과정에 대한 내용으로 본 발명과 직접적인 관련은 없으나, 본 발명의 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치가 함께 할 수 있는 기능이므로 참고로 설명하였다.The above content is about the process of generating and distributing work data and is not directly related to the present invention, but has been described as a reference because it is a function that the crowd outsourcing work inspection device using artificial intelligence of the present invention can do together.
다시 도 3을 참조하면, 크라우드 아웃소싱 작업 분배 장치는 작업자 단말로부터 작업 데이터에 대한 작업이 완료된 완료 데이터가 수신되는 경우, 완료 데이터를 검수(S30)할 수 있다. Referring back to FIG. 3 , the crowd outsourcing work distribution apparatus may inspect the completed data ( S30 ) when the completed data on which the work on the work data is completed is received from the worker terminal.
완료 데이터 검수 단계(S30)은 완료 데이터 검수 단계(S30)의 세부 단계를 나타낸 도 5를 참조하여 설명한다.The completed data verification step (S30) will be described with reference to FIG. 5 showing the detailed steps of the completed data verification step (S30).
우선, 완료 데이터를 중첩 가능한 데이터로 재구성(S34)한다. 예컨대 음향이나 텍스트의 경우 1차원 데이터이며, 이미지 등은 2차원 데이터이다. 각 데이터는 다수의 작업자에 의하여 작업된 결과물이 취합될 수 있는 것이 바람직하다. 따라서, 동일한 크기의 양에 대하여 중첩이 가능하도록, 1차원 데이터의 경우 벡터로, 2차원 데이터의 경우 메트리스로 재구성할 수 있다.First, the completed data is reconstructed into superimposable data (S34). For example, sound or text is one-dimensional data, and images and the like are two-dimensional data. Each data is preferably the result of a plurality of workers can be collected. Accordingly, to enable overlap for quantities of the same size, one-dimensional data may be reconstructed as a vector and two-dimensional data may be reconstructed as a matrix.
특히 2차원 데이터에 대하여 보다 구체적으로 설명하면, 이미지 데이터의 경우 이미지를 m X n 개의 면으로 분할된 메트리스일 수 있다. 또한, 2차원 데이터의 종류에 따라 해당면과 1:1 대응되는 m X n (단 m, n은 1 이상의 정수)의 2차원 메트리스로 전환할 수 있다. 이 메트리스의 값은 해당 면이 인식 대상이 포함되었는지 여부를 구분하기 위해 포함된 경우 1을 포함되지 않는 경우 0을 가질 수 있다.In particular, when describing two-dimensional data in more detail, in the case of image data, it may be a matrix in which an image is divided into m X n surfaces. Also, depending on the type of 2D data, it can be converted into a 2D matrix of m X n (where m and n are integers greater than or equal to 1) corresponding to the corresponding surface 1:1. The value of this matrix may have 1 if included to distinguish whether the corresponding face is included or not, and 0 if not included.
재구성한 이후, 복수의 작업자별 작업에 대한 정확도, 성향 및 작업 난이도 적어도 어느 하나를 결정(S220)한다.After reconfiguration, at least one of accuracy, tendency, and work difficulty for a plurality of worker-specific tasks is determined (S220).
본 발명의 일 실시예에 따른 크라우드 아웃소싱 작업 검수 장치(400)는 인공지능 모듈을 사용하여 복수의 작업자들에 대한 작업 정확도, 성향, 및 학습 데이터 형성 작업에 대한 난이도 중 적어도 하나를 판단하고, 이를 바탕으로, 다른 작업에 대한 작업자들의 완료 데이터를 검수하는 특징이 있다. 이하에서는 도 6 내지 도 11을 함께 참조하여, 복수의 작업자별 작업 정확도, 성향 및 작업에 대한 난이도를 판단하는 방법을 상세히 설명하기로 한다.Crowd outsourcing
도 6을 참조하여 복수의 작업자별 마스크를 생성(S223)하는 단계를 설명한다.A step of generating a plurality of masks for each worker ( S223 ) will be described with reference to FIG. 6 .
복수의 작업자별 마스크(OM1, OM2, OM3)는 특정 개체에 대한 영역이 표시된 작업 대상에서 해당 표시가 메트리스 상에 기재된 마스크일 수 있다. 예를 들어, 작업 대상이 디지털 이미지에 대응되고, 디지털 이미지 내의 특정 객체를 정의하는 작업인 경우, 복수의 작업자들은 각자의 기준에 따라 디지털 이미지 내에서 특정 객체의 윤곽을 표시함으로써, 특정 객체를 정의할 수 있다. 이 경우, 작업자 단말(100)로부터 수신된 완료 데이터는 특정 객체의 윤곽이 표시된 디지털 이미지에 대한 데이터일 수 있다. 전술한 바와 같이 재구성한 데이터가 m X n개의 면으로 분할된 면과 1:1로 각 원소가 대응된 메트리스라면, 복수의 작업자별 마스크(OM1, OM2, OM3)는 완료 데이터에서 특정 객체의 형상으로 정의된 영역이 기 설정된 비율 이상인 분할된 면에 대응되는 원소값은 1로, 기 설정된 비율 이하인 분할된 면에 대응되는 원소값은 0으로 기재된 메트리스일 수 있다. The plurality of worker-specific masks OM1 , OM2 , and OM3 may be masks in which a corresponding mark is written on a mattress in a work target in which an area for a specific object is marked. For example, if the work target corresponds to a digital image and is a job of defining a specific object in the digital image, a plurality of workers define the specific object by displaying the outline of the specific object in the digital image according to their respective criteria. can do. In this case, the completion data received from the
이후, 인공지능 모듈은 복수의 작업자별 마스크(OM1, OM2, OM3)를 병합하여 Trimap을 생성(S226)한다. Thereafter, the artificial intelligence module generates a Trimap by merging the plurality of worker masks (OM1, OM2, OM3) (S226).
복수의 작업자들은 각자의 기준에 따라 디지털 이미지 내에서 특정 객체의 윤곽을 표시하므로, 각 작업자들의 결과 데이터 및 마스크(OM1, OM2, OM3)는 서로 상이한 형태를 갖는다. 인공지능 모듈은 복수의 작업자별 마스크(OM1, OM2, OM3)를 병합하여 Trimap(TM)을 생성한다. 구체적으로, 복수의 작업자별 마스크(OM1, OM2, OM3)의 대응되는 원소들의 원소값들을 합산하여 하나의 병합된 마스크가 생성된다. 이 경우, 제1 작업자의 마스크(OM1)의 표시 영역과 제2 작업자의 마스크(OM2)의 표시 영역과 제3 작업자의 마스크(OM3)의 표시 영역이 모두 중첩되는 면의 원소에서의 원소값은 제1 작업자의 마스크(OM1)의 원소값, 제2 작업자의 마스크(OM2)의 원소값 및 제3 작업자의 마스크(OM3)의 원소값의 정규화(normalize)된 합으로 표시될 수 있다. 예를 들어, 마스크 표시 영역의 원소값이 1로 정의되고, 비표시 영역의 원소값이 0으로 정의된다면, 제1 작업자의 마스크(OM1), 제2 작업자의 마스크(OM2) 및 제3 작업자의 마스크(OM3)의 표시 영역이 모두 중첩되는 면에 대응되는 원소에서는 원소값의 합은 3으로 정의되며, 이를 1/n (단, n = 마스크 개수)으로 정의되는 Opacity를 곱함으로써, 정규화될 수 있다. 따라서, 상기 원소값의 합은 3* 1/3 = 1 로 정규화될 수 있다. 마찬가지 방법으로 통합된 마스크의 각 원소값들은 제1 작업자의 마스크(OM1), 제2 작업자의 마스크(OM2) 및 제3 작업자의 마스크(OM3)의 대응되는 원소값들의 정규화된 합으로 산출될 수 있다. 따라서, Trimap은 매트리스로 표현된 각 마스크의 합을 마스크의 개수로 나눈 평균 매트리스로 나타낼 수 있다.Since the plurality of workers mark the outline of a specific object in the digital image according to their respective criteria, the result data and masks OM1 , OM2 , and OM3 of each worker have different shapes. The AI module creates a Trimap(TM) by merging a plurality of worker-specific masks (OM1, OM2, OM3). Specifically, one merged mask is generated by summing element values of corresponding elements of the masks OM1 , OM2 , and OM3 for each worker. In this case, the element value in the element on the surface where the display area of the mask OM1 of the first operator overlaps the display area of the mask OM2 of the second operator and the display area of the mask OM3 of the third operator overlap It may be expressed as a normalized sum of the element value of the mask OM1 of the first operator, the element value of the mask OM2 of the second operator, and the element value of the mask OM3 of the third operator. For example, if the element value of the mask display area is defined as 1 and the element value of the non-display area is 0, the mask OM1 of the first operator, the mask OM2 of the second operator, and the third operator In the element corresponding to the surface where all the display areas of the mask OM3 overlap, the sum of the element values is defined as 3, which can be normalized by multiplying it by the Opacity defined as 1/n (however, n = the number of masks). have. Accordingly, the sum of the element values can be normalized to 3*1/3 = 1. In the same way, each element value of the integrated mask may be calculated as a normalized sum of the corresponding element values of the mask OM1 of the first operator, the mask OM2 of the second operator, and the mask OM3 of the third operator. have. Therefore, Trimap can be expressed as an average matrix obtained by dividing the sum of each mask expressed as a matrix by the number of masks.
도 6에서, Trimap이 2차원 매트릭스 형태로 형성되는 예가 도시되어 있으나, Trimap은 완료 데이터의 형태에 따라 1차원 벡터 형태로 형성될 수도 있다. 예를 들어, 완료 데이터가 음성 데이터에 대응된다면, 특정 객체의 음성이 표시된 영역에 대해 작업자별 마스크가 생성될 수 있고, 작업자별 마스크를 병합하여 1차원 벡터 형태의 Trimap이 생성될 수 있다. Although an example in which the Trimap is formed in the form of a two-dimensional matrix is illustrated in FIG. 6 , the Trimap may be formed in the form of a one-dimensional vector according to the form of completed data. For example, if the completion data corresponds to voice data, a mask for each worker may be generated for an area in which the voice of a specific object is displayed, and a one-dimensional vector form of a Trimap may be generated by merging the masks for each worker.
한편, 상술한 Trimap은 동일한 작업 데이터에 대하여 생성된 복수의 작업자별 완료 데이터에 기초하여 생성된다. 즉, 동일한 디지털 이미지 내에서 특정 객체를 정의하는 작업의 경우, 동일한 디지털 이미지에 대한 복수의 작업자별 완료 데이터를 수신하고, 복수의 작업자별 마스크를 중첩함으로써, Trimap이 생성될 수 있다. On the other hand, the above-described Trimap is generated based on the completion data for each worker generated for the same job data. That is, in the case of a task of defining a specific object within the same digital image, a Trimap may be generated by receiving a plurality of worker-specific completion data for the same digital image and overlapping a plurality of worker-specific masks.
이후, 인공지능 모듈은 복수의 작업자들 중 대상 작업자의 마스크와 Trimap에 기초하여 대상 작업자의 작업 성향, 작업 정확도 및 작업의 난이도를 결정(S229)한다.Thereafter, the artificial intelligence module determines the work tendency, work accuracy, and difficulty of the work of the target worker based on the mask and the trimap of the target worker among the plurality of workers (S229).
구체적으로, 하기 [수학식 1]에 기초하여 대상 작업자의 작업 성향을 판단한다. Specifically, the work tendency of the target worker is determined based on the following [Equation 1].
여기서, OMS (Opacity Mask Score)는 작업자별 작업 성향을 파악하기 위한 지표로서, 작업자의 특정 작업결과에 대한 나머지 작업자들의 작업 결과들과의 일치도를 나타낸 지수일 수 있다. 상기 [수학식 1]에서 TM(t)은 특정 작업(즉, 완료 데이터)(t)에 대한 Trimap의 원소값이며, BM(t, i)는 대상 작업자(i)의 특정 작업(t)에 대한 마스크의 원소값을 의미한다. 즉, OMS는 대상 작업자(i)의 특정 작업(t)에 대한 마스크의 선택 영역의 Trimap에 대한 원소값 평균을 의미한다. Here, the Opacity Mask Score (OMS) is an index for identifying the work propensity for each worker, and may be an index indicating the degree of agreement between the worker's specific work result and the work results of the rest of the workers. In [Equation 1], TM(t) is the element value of the Trimap for a specific task (ie, completed data) (t), and BM(t, i) is the specific task (t) of the target worker (i). It means the element value of the mask for That is, OMS means the average of element values for the trimap of the selected area of the mask for a specific task (t) of the target operator (i).
OMS가 높은 작업자의 경우, Trimap 내에서 높은 원소값을 갖는 원소들을 대부분 선택한 것이므로, 해당 작업자가 선택한 영역은 다른 작업자들도 선택한 영역과 중첩된다고 볼 수 있다. 이에, OMS가 높은 작업자는 특정 객체의 윤곽선을 다른 작업자들에 비해 과소하게 표시하는 경향임을 알 수 있다. In the case of an operator with high OMS, most of the elements with high element values are selected in the Trimap, so the area selected by the operator overlaps the area selected by other operators. Accordingly, it can be seen that workers with high OMS tend to under-display the outline of a specific object compared to other workers.
반면, OMS가 낮은 작업자의 경우, Trimap 내에서 낮은 원소값을 갖는 원소들을 많이 선택한 것이므로, 해당 작업자가 선택한 영역은 다른 작업자들이 선택하지 않은 영역에 대응될 수 있다. 이에, OMS가 낮은 작업자는 특정 객체의 윤곽선을 다른 작업자들에 비해 과대하게 표시하는 경향임을 알 수 있다. On the other hand, in the case of an operator with a low OMS, since many elements having a low element value are selected in the Trimap, the area selected by the operator may correspond to an area not selected by other operators. Accordingly, it can be seen that workers with low OMS tend to over-display the outline of a specific object compared to other workers.
도 7의 (a)는 OMS가 낮은 작업자의 마스크(711)와 Trimap의 마스크(713)를 나타내며, (b)는 OMS가 높은 작업자의 마스크(715)와 Trimap의 마스크(713)를 나타낸다. 설명의 편의를 위해 도 5에는 각 마스크의 경계선에 해당하는 원소만 실선으로 표시되어 있다. 7(a) shows the operator's
도 7의 (a)에 도시된 바와 같이, OMS가 낮은 작업자의 마스크(711)는 Trimap 마스크(713)의 내측에 위치된 것을 확인할 수 있으며, 이를 통해 OMS가 낮은 작업자는 특정 객체의 정의를 다른 작업자들에 비해 과소하게 표시함을 알 수 있다. As shown in (a) of Figure 7, it can be seen that the operator's
반면, 도 7의 (b)에 도시된 바와 같이, OMS가 높은 작업자의 마스크(715)는 Trimap 마스크(713)의 외측에 위치된 것을 확인할 수 있으며, 이를 통해 OMS가 높은 작업자는 특정 객체의 정의를 다른 작업자들에 비해 과도하게 표시함을 알 수 있다. On the other hand, as shown in (b) of FIG. 7 , it can be confirmed that the
또한, 인공지능 모듈은 복수의 작업자별 작업 정확도를 다른 작업자들의 작업 결과물과의 유사도를 기준으로 판단할 수 있다. 다른 작업자들의 작업 결과물은 Trimap으로 통합되었으므로, 실질적으로 복수의 작업자별 작업 정확도는 Trimap과의 유사도를 기준으로 평가한다.In addition, the artificial intelligence module may determine the work accuracy for each of the plurality of workers based on the similarity with the work results of other workers. Since the work results of other workers are integrated into Trimap, the actual work accuracy of multiple workers is evaluated based on the similarity to Trimap.
구체적으로 복수의 작업자별 작업 정확도는 하기 [수학식 2]에 기초하여 측정된다.Specifically, the work accuracy for a plurality of workers is measured based on the following [Equation 2].
여기서, TWS(Task-Worker Similarity)는 작업자의 작업 정확도를 나타내는 지표로서, 특정 작업자의 작업 결과와 나머지 작업자들의 작업 결과 사이의 코사인 유사도(Cosine Similarity)를 의미한다. 상기 [수학식 2]에서, Vt는 특정 작업(t)의 Trimap의 1차원 벡터를 의미하며, Vt,i는 특정 작업자(i)의 특정 작업(t)의 작업자 마스크의 1차원 벡터를 의미한다. Here, TWS (Task-Worker Similarity) is an index indicating the work accuracy of the worker, and means the cosine similarity between the work result of a specific worker and the work result of the other workers. In [Equation 2], V t means a one-dimensional vector of the Trimap of a specific task (t), and V t,i is a one-dimensional vector of a worker mask of a specific task (t) of a specific operator (i) it means.
다시 말해서, 정확도를 계산하기 위한 유사도는 상기 대상 작업자 단말의 마스크 전체에 대하여 각 원소별로 계산된 코사인 유사도(cosine similarity)를 사용하며, 상기 코사인 유사도에 대입하는 일변수로 원소별 차를 사용하고, 다른 변수로 상기 대상 작업자 단말의 마스크에 표시된 인식으로 표시된 원소의 값을 사용한다. In other words, the similarity for calculating the accuracy uses the cosine similarity calculated for each element with respect to the entire mask of the target worker terminal, and uses the element-specific difference as one variable to be substituted for the cosine similarity, As another variable, the value of the element indicated by the recognition indicated on the mask of the target operator terminal is used.
도 8은 TWS의 계산 과정의 일 예를 설명하기 위한 도면이다. 도 8을 참조하면, 특정 작업(t)에 대한 2차원 매트릭스 형태의 Trimap(TM)은 Flatten 함수를 적용하여 1차원 벡터화(Vt)될 수 있으며, 특정 작업(t)에 대한 특정 작업자(i)의 작업자 마스크(OM)도 Flatten 함수를 적용하여 1차원 벡터화(Vt,i)될 수 있다. 이후, Vt-Vt,i를 산출함으로써, 특정 작업자(i)를 제외한 나머지 작업자들의 작업 결과들에 대한 1차원 벡터가 산출되며, Vt-Vt,i와 Vt,i 사이의 코사인 유사도를 산출함으로써, 특정 작업자(i)와 특정 작업자(i)를 제외한 나머지 작업자들의 작업 결과들 사이의 코사인 유사도가 산출된다.8 is a diagram for explaining an example of a TWS calculation process. Referring to FIG. 8 , Trimap(TM) in the form of a two-dimensional matrix for a specific task (t) can be one-dimensional vectorized (V t ) by applying a Flatten function, and a specific operator (i) for a specific task (t) ) of the worker mask (OM) can also be one-dimensional vectorized (V t,i ) by applying the Flatten function. Thereafter, by calculating V t -V t,i , a one-dimensional vector for the work results of the remaining workers except for the specific worker (i) is calculated, and the cosine between V t -V t,i and V t,i By calculating the similarity, the cosine similarity between the work results of the specific worker (i) and the work results of the workers other than the specific worker (i) is calculated.
도 9는 특정 작업자의 작업 결과에 따른 TWS계산 결과를 나타낸 도면이다. 도 9를 참조하면, 특정 작업자의 마스크를 1차원 벡터화하고, Trimap을 1차원 벡터화한 후 상기 [수학식 2]에 기초하여 TWS를 계산한 결과, 특정 작업자의 TWS는 0.936으로 산출되었다. 이를 통해 특정 작업자의 작업 결과(911)는 Trimap의 결과(913) 대비 0.936 정도의 유사도를 갖는 것을 알 수 있다. 특정 작업자의 작업 결과(911)가 Trimap의 결과(913) 대비 유사도가 떨어지는 경우, TWS 값은 낮아질 수 있다. 9 is a view showing a TWS calculation result according to the work result of a specific operator. Referring to FIG. 9 , after one-dimensional vectorization of the mask of a specific operator and one-dimensional vectorization of the Trimap, the TWS was calculated based on
코사인 유사도는 유사도의 대소를 순서로 비교하기에는 유용하지만, 그 정량적인 차이를 직관적으로 나타내지 못하는 단점이 있다.Cosine similarity is useful for comparing the magnitude of similarity in order, but has a drawback in that it cannot intuitively indicate the quantitative difference.
몇몇 실시예에서, 인공지능 모듈은 작업자의 TWS의 직관성을 향상시키기 위해, 작업의 허수라 할 수 있는 누구도 인식 영역으로 표시하지 않은 원소를 배제한 실 작업영역에 대하여 코사인 유사도 대신 원소별 차를 그대로 사용한 지표를 사용할 수 있다. In some embodiments, in order to improve the intuitiveness of the TWS of the operator, the artificial intelligence module uses element-specific differences instead of cosine similarity for the real work area excluding elements that no one has marked as a recognition area, which is an imaginary number of the work. indicators can be used.
이 경우 하기 [수학식 3]에 기초한 TMS(Trimap score)를 TWS를 대신하여 사용할 수 있다. In this case, a Trimap score (TMS) based on the following [Equation 3] may be used instead of the TWS.
여기서, TMS(t,i)는 특정 작업(t)에 대한 특정 작업자(i)의 Trimap score로서, 특정 작업자(i)의 작업 결과 중 다른 작업자들의 작업 결과들과 일치되는 부분에 대한 분산을 최소화하여 특정 작업자(i)의 작업 결과에 대한 정확도 지표를 극대화한 지표라고 설명될 수 있다. 상기 [수학식 3]에서, TM(t)은 특정 작업(t)에 대한 Trimap의 원소값을 의미하며, BM(t,i)는 특정 작업(t)에 대한 특정 작업자(i)의 작업 마스크의 원소값을 의미한다. 한편, n은 Trimap에서 원소값이 0을 초과하는 원소의 개수를 의미한다. Here, TMS(t,i) is a Trimap score of a specific worker (i) for a specific job (t), and minimizes the variance for a part consistent with the job results of other workers among the job results of the specific worker (i) Thus, it can be described as an index that maximizes the accuracy index for the work result of a specific worker (i). In [Equation 3], TM(t) means the element value of the Trimap for a specific job (t), and BM(t,i) is the job mask of a specific worker (i) for a specific job (t) means the element value of On the other hand, n means the number of elements whose element values exceed 0 in the Trimap.
도 10은 특정 작업(t)에 대한 특정 작업자(i)의 TMS(t,i)의 계산 과정을 나타낸 도면이다. 도 10을 참조하면, 특정 작업(t)에 대한 작업 결과가 3*3 = 9개의 원소로 구성된 마스크로 표현되는 경우, │TM(t)-BM(t-i)│의 합은 도 8에 도시된 바와 같이, 2로 계산되며, 상기 [수학식 3]에 따라 TMS(t,i)를 계산하면, TMS(t,i)는 0.77로 계산된다. 10 is a diagram illustrating a calculation process of TMS(t,i) of a specific worker (i) for a specific job (t). Referring to FIG. 10 , when the operation result for a specific operation t is expressed as a mask composed of 3*3 = 9 elements, the sum of |TM(t)-BM(ti)│ is shown in FIG. As shown, it is calculated as 2, and when TMS(t,i) is calculated according to
한편, 인공지능 모듈은 특정 작업에 대한 복수의 작업자별 마스크의 편차로부터 특정 작업에 대한 작업 난이도를 결정한다. On the other hand, the artificial intelligence module determines the task difficulty for a particular task from the deviation of a plurality of worker masks for the particular task.
작업 난이도가 높다는 것은 판단에 어려움이 많은 것을 의미하고, 판단에 어려움이 많은 것은 같은 작업에 대하여 다양한 판단이 나타날 수 있다는 것을 뜻한다. 따라서, 복수의 작업자별 마스크의 편차가 크다는 것은 작업 난이도가 높음을 의미한다. 복수의 작업자별 마스크 간의 편차는 각 마스크별 면적을 계산하여 편차를 구하는 방식 등도 가능할 것이나, 보다 정확한 값을 계산하기 위하여 다음과 같은 방법으로 가늠되는 것이 바람직하다.A high task difficulty means that there are many difficulties in judgment, and a lot of difficulty in judgment means that various judgments may appear for the same task. Therefore, the large variation in the mask for each worker means that the work difficulty is high. The deviation between the masks for a plurality of workers may be calculated by calculating the area of each mask to obtain the deviation.
복수의 작업자별 마스크들에서 특정 원소에 대해 판단 값(1 또는 0)이 고르게 나타난다면, 해당 원소에 대한 판단이 어렵다고 판단할 수 있으며, 이러한 원소의 개수가 많다면 작업 난이도가 높다고 간주될 수 있다. 원소별 값이 다양하게 판단되었다면, 해당 원소의 평균값은 0.5에 수렴하게 될 것이다. 복수의 작업자별 마스크들에서 각 원소별 평균값을 TM에서 이미 계산하였으므로 이를 활용하여 계산할 수 있다.If the determination value (1 or 0) for a specific element appears evenly in the masks for each worker, it may be determined that the determination of the corresponding element is difficult, and if the number of these elements is large, the work difficulty may be considered high. . If the values of each element are determined to be various, the average value of the corresponding element will converge to 0.5. Since the TM has already calculated the average value of each element in the masks for each worker, it can be calculated using this.
구체적으로, 특정 작업에 대한 작업 난이도는 Trimap에서 표시된 원소의 값의 합을 원소의 값이 0보다 큰 원소의 수로 나눈 값으로 결정한다. 이를 수학식으로 나타낸, [수학식 4]에 기초하여 결정될 수 있다. Specifically, the task difficulty for a specific task is determined by dividing the sum of the values of the elements displayed in the Trimap by the number of elements whose values are greater than 0. It may be determined based on [Equation 4], which is expressed as an equation.
여기서, ICS(t)는 특정 작업(t)에 대한 작업 난이도를 나타내는 지표로서, 작업이 모호하지 않고, 얼마나 명확한지에 대한 지표로 설명될 수 있다. 상기 [수학식 4]에서 TM(t)는 특정 작업(t)에 대한 Trimap의 원소값을 의미하며, n은 원소값이 0을 초과하는 유효 원소의 개수를 의미한다. 모든 작업자가 구분할 수 있는 영역(원소값이 0)은 작업량에서 허수에 해당하므로 이를 제외하고 측정하는 것을 예로 들었으나, 불성실한 작업자로 인하여 0인 원소의 개수가 지나치게 작다면, 0보다 큰 어떤 수로 특정하여도 무방하다. 작업이 명확할수록 작업자들의 작업 결과는 비슷할 것이며, 작업 마스크들의 중첩 영역이 넓으므로, 상기 [수학식 4]에서 ICS(t)는 크게 산출될 수 있다. Here, ICS(t) is an index indicating the difficulty of the task for a specific task t, and may be described as an index indicating how clear the task is without being ambiguous. In Equation 4, TM(t) denotes an element value of Trimap for a specific operation t, and n denotes the number of effective elements whose element value exceeds 0. The area that all workers can distinguish (element value is 0) corresponds to an imaginary number in the amount of work, so the measurement was taken as an example. It is free to be specific. As the work becomes clearer, the work results of the workers will be similar, and since the overlapping area of the work masks is wide, ICS(t) in Equation 4 can be calculated to be large.
단순히, 각 Trimap의 각 원소별 정규분포를 구하고, 그 값이 중간(본 실시예에서는 0.5)에 가까운 원소의 빈도 또는 양을 기준으로 계산하는 것으로 대신할 수도 있다. 이 경우 수학식과 달리 ICS 값은 난이도에 비례한 값을 갖는다.It may be substituted for simply obtaining the normal distribution for each element of each Trimap and calculating based on the frequency or amount of an element whose value is close to the middle (0.5 in this embodiment). In this case, unlike the equation, the ICS value has a value proportional to the difficulty.
도 11은 실제 작업들에 대한 ICS(t) 산출 결과를 나타낸 도면들이다. 도 11에 도시된 바와 같이, 객체의 형태가 단순하여 비교적 명확하게 정의될 수 있는 이미지에 대해서 ICS가 높게 측정된 것을 알 수 있다.11 is a diagram illustrating ICS(t) calculation results for actual tasks. As shown in FIG. 11 , it can be seen that the ICS is highly measured for an image in which the shape of an object is simple and can be relatively clearly defined.
완료 데이터를 검수하는 단계(S30) 이후에 검수 결과 산출된 정확도 및 작업 난이도를 활용하여, 작업물 검수 기준 데이터를 형성(S55)할 수 있다.After the step (S30) of inspecting the completed data, by utilizing the accuracy and work difficulty calculated as a result of the inspection, it is possible to form the work inspection reference data (S55).
다시 도 2 및 3을 참조하면, 크라우드 아웃소싱 작업 검수 장치는 복수의 작업자별 정확도 및 작업 난이도에 기초하여 완료 데이터의 대상 작업들에 대하여 반영률이 산출 가능한 작업인지 판단(S230)하고, 반영률이 산출 불가능한 작업인 경우 필터링한다.Referring back to FIGS. 2 and 3 , the crowd outsourcing task inspection device determines whether a reflection rate is a workable task for the target tasks of the completed data based on the accuracy and task difficulty for a plurality of workers (S230), and the reflection rate is impossible to calculate If it's a job, filter it.
여기서, 반영률(Voting Power)은 특정 작업의 Trimap 형성에 기여한 작업자의 가중치 내지는 기여율로 설명될 수 있다. 본 발명의 일 실시예에 따른 크라우드 아웃소싱 작업 검수 장치는 특정 작업에 대한 검수를 위해 필요한 검수 기준 데이터(즉, 정답 데이터)를 확정하는 과정에서 특정 작업을 정확하게 수행한 작업자에게 높은 반영률을 부여하여 검수 기준 데이터의 신뢰도를 향상시키도록 구성된다.Here, the reflection rate (voting power) may be described as a weight or a contribution rate of the operator who contributed to the formation of the Trimap of a specific task. Crowd outsourcing work inspection apparatus according to an embodiment of the present invention provides a high reflection rate to a worker who accurately performed a specific task in the process of determining the inspection reference data (ie, correct answer data) necessary for the inspection for a specific task It is configured to improve the reliability of the reference data.
한편, 특정 작업이 작업 자체가 모호하고 난이도가 지나치게 높은 경우, 해당 작업을 충분히 정확하게 수행한 작업자가 존재하지 않을 수 있다. 또한, 특정 작업을 수행한 복수의 작업자들이 모두 작업을 충실히 수행하지 못한 경우, 해당 작업에 대해서는 불량 작업자들의 완료 데이터만 존재하므로, 이에 대해 반영률을 부여하고, 검수 기준 데이터를 선택하는 경우, 신뢰성이 낮은 검수 기준 데이터가 선택될 수도 있다.On the other hand, if the specific task itself is ambiguous and the difficulty level is too high, there may not be a worker who performed the task accurately enough. In addition, if a plurality of workers who performed a specific job did not all faithfully perform the job, only the completion data of the bad workers exists for the job. Low acceptance reference data may be selected.
이에, 본 발명의 일 실시예에 따른 크라우드 아웃소싱 작업 검수 장치는 인공지능 모듈을 통해 작업자별 반영률을 산출하기 앞서, 해당 작업이 반영률을 산출하기에 적합한 작업인지 여부를 먼저 필터링할 수 있다. Accordingly, the device for inspecting the crowd outsourcing work according to an embodiment of the present invention may first filter whether the corresponding task is a suitable task for calculating the reflection rate before calculating the reflection rate for each worker through the artificial intelligence module.
예를 들어, 인공지능 모듈은 복수의 작업자들로부터 수신된 완료 데이터들의 TWS의 최대값이 정확도 임계값을 초과하고, ICS가 난이도 임계값 초과인지 여부를 검토한다. TWS는 상기 [수학식 2]에 기초하여 산출될 수 있으며, 판단 대상 작업에 대한 TWS값중 가장 높은 최대값이 정확도 임계값을 초과하는지 여부로 판단할 수 있다. 앞서 언급한 바와 같이, TWS는 작업자의 작업 정확도를 나타내는 지표이므로, TWS의 최대값이 높다는 것은 본 작업을 수행한 작업자들 중 높은 정확도로 작업을 수행한 우수 작업자가 포함되어 있다는 것을 의미할 수 있다. For example, the artificial intelligence module examines whether the maximum value of the TWS of the completed data received from the plurality of workers exceeds the accuracy threshold, and the ICS exceeds the difficulty threshold. TWS may be calculated based on [Equation 2], and it may be determined whether the highest maximum value among TWS values for the task to be determined exceeds the accuracy threshold. As mentioned earlier, since TWS is an indicator of the work accuracy of workers, a high maximum value of TWS may mean that among the workers who performed this work, excellent workers who performed the work with high accuracy are included. .
또한, 완료 데이터들의 ICS는 상기 [수학식 4]에 기초하여 산출될 수 있다. 앞서 언급한 바와 같이, ICS가 높을수록 작업의 난이도가 낮다는 것이므로, 특정 작업에 대한 ICS가 난이도 임계값을 초과한다는 것은 특정 작업이 적절한 난이도를 갖는다는 것을 의미할 수 있다. Also, the ICS of the completed data may be calculated based on Equation 4 above. As mentioned earlier, the higher the ICS, the lower the difficulty of the task, so that the ICS for a particular task exceeds the difficulty threshold may mean that the particular task has an appropriate difficulty.
만약, 특정 작업에 대한 완료 데이터들의 최대 TWS가 정확도 임계값 이하이고, 특정 작업에 대한 ICS가 난이도 임계값 이하인 경우에는 작업 자체의 난이도가 너무 높으며, 높은 정확도를 갖는 우수 작업자의 완료 데이터가 없다고 볼 수 있으므로, 반영률 산출이 불가능한 모호한 작업으로 판단될 수 있다. 이 경우, 크라우드 아웃소싱 작업 검수 장치(400)는 모호한 작업에 대한 완료 데이터들을 검수자 단말(500)로 송신하고, 검수자 단말(500)을 통해 모호한 작업에 대한 전문가 검수가 수행(S255)될 수 있다.If the maximum TWS of the completed data for a specific task is less than the accuracy threshold and the ICS for a particular task is less than the difficulty threshold, the difficulty of the task itself is too high, and there is no completion data of an excellent worker with high accuracy. Therefore, it may be judged as an ambiguous operation that cannot calculate the reflection rate. In this case, the crowd outsourcing
반면, 특정 작업에 대한 완료 데이터들의 최대 TWS가 정확도 임계값을 초과하고, 특정 작업에 대한 ICS가 난이도 임계값 초과인 경우에는 해당 작업에는 우수 작업자의 완료 데이터가 포함되어 있으며, 작업 자체의 난이도가 적절한 수준인 것이므로, 우수 작업자를 선별할 수 있는 대상 적격을 갖는다고 볼 수 있다. On the other hand, if the maximum TWS of the completed data for a specific job exceeds the accuracy threshold and the ICS for a specific job exceeds the difficulty threshold, the job includes the completion data of the best worker, and the difficulty of the job itself is Since it is an appropriate level, it can be considered that it has the target qualifications to select excellent workers.
이에, 크라우드 아웃소싱 작업 검수 장치는 해당 작업에 대하여 반영률 산출의 대상 적격이 있다고 판단하여, 복수의 작업자별 정확도 및 작업 난이도에 기초하여 복수의 작업자별 반영률을 결정(S240)한다. Accordingly, the crowd outsourcing work inspection device determines that the target for the calculation of the reflection rate for the corresponding task is eligible, and determines the reflection rate for each of the plurality of workers based on the accuracy and the difficulty of the plurality of workers (S240).
구체적으로, 본 발명의 일 실시예에 따른 크라우드 아웃소싱 작업 검수 장치(400)는 인공지능 모듈을 통해 작업자별 반영률을 산출하기 앞서, 복수의 작업자 중 정확도가 미리 설정된 임계값 이상인 우수 작업자의 완료 데이터를 추출한다. Specifically, the crowd outsourcing
구체적으로, 인공지능 모듈은 상술한 조건을 만족하는 작업들에 대하여 복수의 작업자별 TWS를 산출하고, TWS가 제1 임계값을 초과하는 지 여부를 판단한다. TWS가 높을수록 작업자의 작업 결과는 다른 작업자의 작업 결과와 일치도가 높다고 볼 수 있으므로, 정답 데이터에 근접할 가능성이 높다. 이에, 인공지능 모듈은 작업 정확도가 미리 설정된 제1 임계값 이상인 작업자들의 완료 데이터만을 필터링한다. 제1 임계값 미만인 작업자들의 완료 데이터는 정확도가 낮은 작업결과들에 해당된다. 한편, 상기 [수학식 2]의 TWS정의에서 알 수 있듯이, 복수의 작업자별 TWS는 특정 작업자의 완료 데이터와 Trimap 즉, 복수의 작업자들의 완료 데이터를 중첩함으로써 생성된 Trimap의 코사인 유사도로서 정의되므로, 정확도가 지나치게 낮은 불량 작업자들이 존재할 경우, Trimap 자체의 정확도가 낮아질 수 있으며, 해당 작업에 대한 선의의 작업자들에 대한 TWS를 낮추는 효과를 준다고 볼 수 있다. Specifically, the artificial intelligence module calculates TWS for a plurality of workers for tasks satisfying the above-described conditions, and determines whether the TWS exceeds a first threshold. The higher the TWS, the higher the worker's work results can be seen to be consistent with the work results of other workers, so it is more likely to be close to the correct answer data. Accordingly, the artificial intelligence module filters only the completion data of workers whose work accuracy is greater than or equal to a preset first threshold. Completion data of workers less than the first threshold value corresponds to work results with low accuracy. On the other hand, as can be seen from the TWS definition of [Equation 2], the TWS for a plurality of workers is defined as the cosine similarity of the Trimap generated by overlapping the completion data of a specific operator and the Trimap, that is, the completion data of a plurality of workers, If there are bad workers with too low accuracy, the accuracy of Trimap itself may be lowered, and it can be seen that it has the effect of lowering the TWS for workers with good intentions for the work.
따라서, 본 발명의 일 실시예에 따른 크라우드 아웃소싱 작업 검수 장치의 인공지능 모듈은 복수의 작업자들의 완료 데이터들 중 TWS가 제1 임계값 미만인 완료 데이터를 제거하고, TWS가 제1 임계값 이상인 완료 데이터만을 선별하여 다시 Trimap을 생성하고, 다시 생성된 Trimap에 기초하여 특정 작업에 대한 복수의 작업자별 TWS를 다시 산출한다. Therefore, the artificial intelligence module of the device for inspecting crowd outsourcing work according to an embodiment of the present invention removes the completion data in which the TWS is less than the first threshold value among the completion data of the plurality of workers, and the completion data in which the TWS is equal to or greater than the first threshold value A Trimap is generated again by selecting only a few, and the TWS for a plurality of workers for a specific job is recalculated based on the re-created Trimap.
이후, 인공지능 모듈은 선별된 복수의 작업자들의 완료 데이터에 기초하여 다시 산출된 TWS가 제2 임계값을 초과하는지 여부를 검토하고, 제2 임계값을 초과하는 TWS를 갖는 특정 작업자들의 완료 데이터를 우수 작업자의 완료 데이터로 선택한다. Thereafter, the artificial intelligence module examines whether the TWS recalculated based on the completion data of the selected plurality of workers exceeds the second threshold value, and the completion data of specific workers having a TWS exceeding the second threshold value Selected as completion data of excellent workers.
상기 정확도 임계값, 난이도 임계값, 제1 임계값 및 제2 임계값은 요구되는 학습 데이터의 정확도에 따라 다양하게 결정될 수 있다. 예를 들어, 자율주행 자동차에 적용되는 인공지능의 경우, 객체를 정확하게 인식할 필요가 있으므로, 정확한 학습 데이터에 기반한 학습이 필요할 수 있다. 이 경우, 상술한 임계값을 높게 설정함으로써, 학습 데이터의 정확도를 향상시킬 수 있다. The accuracy threshold, the difficulty threshold, the first threshold, and the second threshold may be variously determined according to the required accuracy of the learning data. For example, in the case of artificial intelligence applied to an autonomous vehicle, since it is necessary to accurately recognize an object, learning based on accurate learning data may be required. In this case, by setting the above-described threshold to be high, the accuracy of the training data can be improved.
이후, 인공지능 모듈은 품질 체크 작업에 대하여 품질 체크 작업에 대한 정답 데이터와 우수 작업자의 완료 데이터 사이의 유사도를 산출하여 우수 작업자의 IOU(Intersection over union)을 결정한다. Thereafter, the artificial intelligence module determines the IOU (Intersection over Union) of the excellent worker by calculating the similarity between the correct answer data for the quality check job and the completed data of the excellent worker for the quality check job.
구체적으로, 인공지능 모듈은 우수 작업자의 작업들 중 품질 체크 작업에 대한 완료 데이터를 선택할 수 있다. 여기서 품질 체크 작업은 우수 작업자별 반영률을 결정하기 위해 사전에 정답 데이터(Ground Truth)를 확보해 놓은 작업을 의미하며, 정답 데이터가 존재하는 품질 체크 작업에 대해 우수 작업자별 IOU를 산출함으로써, 우수 작업자별 반영률이 결정될 수 있다. Specifically, the artificial intelligence module may select the completion data for the quality check task among the tasks of the excellent worker. Here, the quality check task refers to a task in which the correct answer data (ground truth) is secured in advance to determine the reflection rate for each excellent worker. A star reflection rate may be determined.
IOU는 두 영역(A, B)의 교차영역의 넓이를 합영역의 값으로 나눈 값을 의미하며, 하기 [수학식 5]로 정의되는 자카드 계수(Jaccard index)를 의미한다. IOU means a value obtained by dividing the area of the intersection of the two areas A and B by the value of the sum area, and means a Jaccard index defined by Equation 5 below.
우수 작업자들의 경우, 작업 정확도가 높으므로, 품질 체크 작업에 대한 완료 데이터와 정답 데이터 사이의 IOU는 높게 나타날 수 있다. In the case of excellent workers, since the work accuracy is high, the IOU between the completion data and the correct answer data for the quality check task may appear high.
이후, 인공지능 모듈은 품질 체크 작업에 대한 작업 난이도에 대한 우수 작업자의 IOU의 비율로부터 우수 작업자의 품질점수를 산출한다. Then, the artificial intelligence module calculates the quality score of the excellent worker from the ratio of the IOU of the excellent worker to the task difficulty for the quality check task.
구체적으로, 품질점수는 하기 [수학식 6]을 통해 산출될 수 있다. Specifically, the quality score may be calculated through the following [Equation 6].
여기서 QScore는 품질 체크 작업(QcT)에 대한 특정 우수 작업자의 품질 점수를 의미한다. 한편, 상기 [수학식 6]에서 QcTw,i는 특정 우수 작업자(w)의 최근 i번째 품질 체크 작업(QcT)에 대한 완료 데이터를 의미한다. 또한, QcTgt,i는 최근 i번째 품질 체크 작업(QcT)에 대한 정답 데이터를 의미한다. Here, QScore means the quality score of a specific good worker for a quality check task (QcT). On the other hand, in [Equation 6], QcT w,i means completion data for the latest i-th quality check task (QcT) of a specific excellent worker (w). In addition, QcT gt,i means correct answer data for the latest i-th quality check task (QcT).
상기 [수학식 6]에서 알 수 있듯이, 인공지능 모듈은 어려운 작업(낮은 ICS)에 대해서 우수한 정확도를 갖는 우수 작업자(w)에 대하여 더 높은 품질점수를 부여할 수 있다. As can be seen from [Equation 6], the artificial intelligence module can give a higher quality score to an excellent worker w having excellent accuracy for a difficult task (low ICS).
이후, 인공지능 모듈은 품질점수에 기초하여 우수 작업자의 반영률을 결정한다. Thereafter, the AI module determines the reflection rate of excellent workers based on the quality score.
구체적으로, 인공지능 모듈은 특정 우수 작업자의 품질점수에 기간에 따른 가중치를 적용하여 특정 우수 작업자의 반영률을 결정한다. 예를 들어, 하기 [수학식 7]과 같이, 특정 우수 작업자의 품질점수(QScore)에 기간에 대한 가중치(DecayWeight)를 적용하고, 반영률 산출에 적용할 품질 체크 작업(QcT)의 개수를 나눔으로써, 특정 우수 작업자의 영향력 점수(IP)가 산출될 수 있다. Specifically, the AI module determines the reflection rate of a specific excellent worker by applying a weight according to the period to the quality score of a specific excellent worker. For example, as shown in Equation 7 below, by applying a weight (DecayWeight) for a period to the quality score (QScore) of a specific excellent worker, and dividing the number of quality check tasks (QcT) to be applied to the reflection rate calculation , the influence score (IP) of a specific excellent worker can be calculated.
여기서, IP는 검수를 수행할 특정 작업에 대하여 검수 기준 데이터(즉, 정답 데이터)를 결정하는데 반영되는 특정 우수 작업자의 영향력 정도를 나타내는 지표를 의미한다. QcT Range는 IP 산출에 적용할 품질 체크 작업(QcT)의 개수를 의미하며, QcT Range가 높을수록 IP의 신뢰성이 향상될 수 있다. DecayWeight는 기간에 대한 가중치로서, 현재 시점으로부터 가까울수록 큰 값을 갖는 요소일 수 있으며, 하기 [수학식 8]로 정의된다. Here, IP means an index indicating the degree of influence of a specific excellent worker reflected in determining the inspection standard data (ie, correct answer data) for a specific task to be inspected. QcT Range means the number of quality check tasks (QcT) to be applied to IP calculation, and the higher the QcT Range, the higher the IP reliability. DecayWeight is a weight for a period, and may be an element having a larger value as it is closer to the current time point, and is defined by the following [Equation 8].
여기서, Weight는 가중치를 의미하며, t는 QcT Range를 의미한다. i는 1부터 t-1까지의 정수를 의미한다. 한편, 가중치의 구체적인 값은 작업 난이도, 종류 등에 따라 다양하게 결정될 수 있다. Here, Weight means weight, and t means QcT Range. i means an integer from 1 to t-1. On the other hand, the specific value of the weight may be variously determined according to the task difficulty, type, and the like.
예를 들어, 특정 우수 작업자(i)의 영향력 점수(IP)가 산출되는 과정을 설명하면, 다음과 같을 수 있다. 만약, 5개의 품질 체크 작업(QcT)을 기준으로 영향력 점수(IP)가 산출된다면, 먼저, 인공지능 모듈은 특정 우수 작업자(i)의 완료 데이터에 기초하여 5개의 품질 체크 작업(QcT)에 대한 IOU를 산출하고, 상기 품질 체크 작업(QcT)의 작업 난이도(ICS)를 산출한 후, 상기 [수학식 6]에 기초하여 3명의 우수 작업자들에 대한 품질점수(QScore)를 산출할 수 있다. 구체적으로, 5개의 품질 체크 작업(QcT)에 대한 IOU는 상기 [수학식 5]에 기초하여 산출될 수 있으며, ICS는 상기 [수학식 4]에 기초하여 산출될 수 있다. 어느 특정 우수 작업자(i)의 5개의 품질 체크 작업(QcT)에 대한 IOU 및 ICS의 산출 예시가 하기 [표 1]과 같다. For example, the process of calculating the influence score (IP) of a specific excellent worker (i) may be described as follows. If the influence score (IP) is calculated based on the five quality check tasks (QcT), first, the artificial intelligence module determines the five quality check tasks (QcT) based on the completion data of a specific excellent worker (i). After calculating the IOU and calculating the task difficulty (ICS) of the quality check task (QcT), it is possible to calculate a quality score (QScore) for three excellent workers based on Equation 6 above. Specifically, the IOU for the five quality check tasks (QcT) may be calculated based on [Equation 5], and the ICS may be calculated based on the [Equation 4]. An example of the calculation of IOU and ICS for 5 quality check tasks (QcT) of a specific excellent worker (i) is shown in [Table 1] below.
이 경우, 상기 [수학식 6]에 따라, 특정 우수 작업자(i)의 품질점수(Qscore)가 다음과 같이 산출된다. QScore = [1.12, 0.88, 1.14, 1.00, 0.87]In this case, according to the above [Equation 6], the quality score (Qscore) of the specific excellent worker (i) is calculated as follows. QScore = [1.12, 0.88, 1.14, 1.00, 0.87]
또한, 가중치가 0.9인 경우, 5개의 품질 체크 작업(QcT)의 기간에 따른 가중치(DecayWeight)는 상기 [수학식 8]에 따라 다음과 같이 산출될 수 있다. In addition, when the weight is 0.9, the weight (DecayWeight) according to the period of the five quality check tasks (QcT) may be calculated as follows according to Equation (8).
DecayWeight(0.9, 5)= 0.9i = [1.0, 0.9, 0.81, 0.73, 0.65]DecayWeight(0.9, 5)= 0.9 i = [1.0, 0.9, 0.81, 0.73, 0.65]
따라서, 특정 우수 작업자(i)에 대한 영향력 점수(IP)는 다음과 같이 산출될 수 있다. Therefore, the influence score (IP) for a specific excellent worker (i) can be calculated as follows.
이후, 인공지능 모듈은 모든 우수 작업자의 영향력 점수(IP)의 합이 1이 되도록 영향력 점수(IP)를 정규화하여 반영률(Voting Power; VP)를 산출한다. Then, the artificial intelligence module calculates the reflection rate (Voting Power; VP) by normalizing the influence score (IP) so that the sum of the influence scores (IP) of all excellent workers becomes 1.
예를 들어, 3명의 우수 작업자가 존재하고, 3명의 우수 작업자에 대한 영향력 점수(IP)가 하기 [표 2]와 같다면, 3명의 우수 작업자에 대한 영향력 점수(IP)의 합이 1이 되도록 정규화되어 반영률(VP)이 하기 [표 3]과 같이 산출될 수 있다. For example, if there are 3 excellent workers and the influence score (IP) for the 3 excellent workers is as shown in [Table 2] below, so that the sum of the influence points (IP) for the 3 excellent workers is 1 By normalization, the reflection rate (VP) can be calculated as shown in [Table 3] below.
다시 도 2를 참조하면, 인공지능 모듈은 산출된 반영률에 기초하여 복수의 작업자별 완료 데이터 검수를 위한 검수 기준 데이터를 결정(S250)한다. 예를 들어, 반영률(VP)을 Trimap 형성시 적용되는 Opacity에 적용함으로써, 검수 기준 데이터(즉, 검수 기준 Trimap)를 결정할 수 있다. Referring again to FIG. 2 , the artificial intelligence module determines the inspection reference data for inspection of the completed data for each worker based on the calculated reflection rate (S250). For example, by applying the reflection rate (VP) to the Opacity applied when forming the Trimap, it is possible to determine the inspection standard data (ie, the inspection standard Trimap).
도 12는 3명의 우수 작업자에 대한 반영률을 산출하고, 반영률에 기초하여 검수 기준 데이터가 결정되는 예를 설명하기 위한 도면이다. 12 is a view for explaining an example in which the reflection rate for three excellent workers is calculated, and the inspection reference data is determined based on the reflection rate.
도 12를 참조하면, 3명의 우수 작업자(w1, w2, w3)에 대한 반영률이 각각 도 12와 같이 산출되며, 반영률에 기초하여 검수 기준 데이터가 결정된다. Referring to FIG. 12 , the reflection rates for the three excellent workers w1, w2, and w3 are calculated as shown in FIG. 12 , respectively, and inspection reference data is determined based on the reflection rates.
검수 기준 데이터의 결정은 작업 결과의 유형에 따라 선택된 특정 우수 작업자의 반영률에 기초하여 결정될 수 있다. Determination of the inspection reference data may be determined based on the reflection rate of a specific excellent worker selected according to the type of work result.
구체적으로, 완료 데이터의 변수 형태가 범주형 변수(Categorical data)인 경우, 완료 데이터의 평균값을 취하는 방식을 적용할 수 없으므로, 우수 작업자들 중 가장 높은 반영률을 갖는 최우수 작업자의 가장 높은 반영률을 갖는 완료 데이터를 검수 기준 데이터로 결정한다. Specifically, if the variable type of the completion data is categorical data, the method of taking the average value of the completion data cannot be applied, so the completion with the highest reflection rate of the best worker with the highest reflection rate among the excellent workers Determine the data as the inspection reference data.
한편, 완료 데이터의 변수 형태가 연속형 변수(Continuous data)인 경우, 완료 데이터의 통계학적 접근이 가능하다고 볼 수 있다. 이 경우, 인공지능 모듈은 우수 작업자들의 완료 데이터에 적합한 추론모델을 적용하여 검수 기준 데이터를 결정한다. On the other hand, when the variable form of the completed data is continuous data, it can be considered that statistical access to the completed data is possible. In this case, the AI module determines the inspection standard data by applying an inference model suitable for the completion data of excellent workers.
예를 들어, 도 12에 도시된 바와 같이, 우수 작업자들의 반영률을 각 작업자들의 완료 데이터에 Opacity로 적용하여 각 작업자별 Opacity mask (OM1, OM2, OM3)를 생성하고, 이를 중첩함으로써, Trimap(TM)을 생성하고, 형성된 Trimap(TM)에서 특정 임계값을 초과하는 원소값을 갖는 원소들만을 선택하는 방식으로, 검수 기준 데이터를 결정할 수 있다. For example, as shown in FIG. 12 , by applying the reflection rate of excellent workers as Opacity to the completion data of each worker, Opacity masks (OM1, OM2, OM3) for each worker are generated, and by overlapping them, Trimap (TM ) and selecting only elements having element values exceeding a specific threshold in the formed Trimap(TM), it is possible to determine the inspection reference data.
그러나, 검수 기준 데이터의 결정방법이 이에 한정되는 것은 아니며, 인공지능 모듈은 우수 작업자들의 반영률이 적용된 완료 데이터들의 평균값, 중간값 등 다양한 통계값들을 선택하는 방식 또는 알파-매팅(Alpha matting) 알고리즘을 적용하여 검수 기준 데이터를 결정할 수 있다. However, the method of determining the inspection standard data is not limited thereto, and the AI module selects various statistical values such as the average value and the median value of the completed data to which the reflection rate of excellent workers is applied, or an alpha-matting algorithm. It can be applied to determine the inspection standard data.
몇몇 실시예에서, 인공지능 모듈은 완료 데이터가 연속형 변수 형태이더라도, 통계적 추론 모델을 적용하지 않고, 선택형 추론 모델을 적용할 수 있다. 즉, 완료 데이터가 0~1 사이의 연속적인 데이터 값을 갖더라도, 작업의 특성상 정답 데이터를 0 또는 1로 결정할 필요가 있는 경우, 선택형 추론 모델을 적용하여 가장 반영률이 높은 최우수 작업자의 완료 데이터를 정답 데이터로 설정할 수 있다. In some embodiments, the artificial intelligence module may apply the selective inference model without applying the statistical inference model, even if the completed data is in the form of a continuous variable. That is, even if the completed data has a continuous data value between 0 and 1, if the correct answer data needs to be determined as 0 or 1 due to the nature of the task, the completion data of the best worker with the highest reflection rate is applied by applying the selective inference model. It can be set as correct answer data.
이후, 본 발명의 일 실시예에 따른 크라우드 아웃소싱 작업 검수 장치(400)는 산출된 작업자별 반영률(VP)에 기초하여 기존의 작업자별 반영률(VP)을 조정한다. 즉, 검수를 통해 완료 데이터 중 정답 데이터가 많은 것으로 판별된 작업자에 대해서는 반영률(VP)이 높아지도록 조정되고, 완료 데이터 중 정답 데이터가 적은 것으로 판별된 작업자에 대해서는 반영률(VP)이 낮아지도록 조정될 수 있다. Then, the crowd outsourcing
본 발명의 일 실시예에 따른 크라우드 아웃소싱 작업 검수 장치(400)는 결정된 작업 데이터에 기초하여 작업자들의 완료 데이터를 검수하고, 정답으로 처리된 완료 데이터를 학습 데이터로 선택한다. 인공지능은 검수가 완료된 학습 데이터에 기초하여 학습될 수 있으므로, 인공지능의 학습 효율은 증가될 수 있으며, 인공지능의 성능은 고도화될 수 있다.Crowd outsourcing
상술한 바와 같이, 본 발명의 일 실시예에 따른 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치(400)는 인터넷을 통해 불특정 작업자들에게 인공지능의 학습을 위한 학습 데이터를 생성하는 작업을 분배할 수 있다. 특히, 작업 대상 데이터에 대하여 인공지능 모듈을 통해 전처리를 수행하고, 전처리된 작업 데이터를 불특정 작업자들에게 전송함으로써, 작업자들의 작업이 보다 용이하게 진행될 수 있도록 할 수 있다. 즉, 인공지능 모듈은 작업 대상 데이터에서 작업 대상 영역을 설정하는 전처리를 수행하여 작업 데이터를 생성하고, 생성된 작업 데이터를 복수의 작업자들에게 송신할 수 있으므로, 작업자들은 보다 수월하게 학습 데이터 생성 작업을 수행할 수 있다. As described above, the crowd outsourcing
더불어, 인공지능 모듈은 작업 데이터를 생성하는 과정에서 일부 제1 작업 데이터에 대한 작업이 완료된 제1 완료 데이터를 학습하도록 구성되므로, 작업 데이터를 생성하는 과정에서 점차적으로 학습될 수 있고, 제1 작업 데이터를 분배한 이후, 제2, 제3 작업 데이터를 생성하는 과정에서는 좀더 고도화된 방법으로 작업 영역을 설정할 수 있으며, 이로 인해, 고도로 전처리된 작업 데이터가 생성되어 작업자들에게 분배될 수 있다. 따라서, 복수의 작업자들의 업무 부하(load)가 더욱 감소될 수 있으며, 종국적으로는 학습 데이터의 생성 작업 자체가 인공지능 모듈에 의해 수행되도록 구성될 수도 있다.In addition, since the artificial intelligence module is configured to learn the first completed data in which the work for some first work data is completed in the process of generating the work data, it can be gradually learned in the process of generating the work data, the first work After distributing the data, in the process of generating the second and third work data, the work area may be set in a more advanced way, whereby highly pre-processed work data may be generated and distributed to the workers. Accordingly, the workload of the plurality of workers may be further reduced, and ultimately, the creation of the learning data itself may be configured to be performed by the artificial intelligence module.
또한, 본 발명의 일 실시예에 따른 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치(400)는 작업 난이도 및 해당 작업을 수행한 작업자들의 정확도를 산출하고, 작업 난이도가 충분히 낮으며, 복수의 작업자들의 정확도가 충분히 높은 경우, 해당 작업에 대해 인공지능 모듈을 통해 검수를 수행하도록 구성된다. 또한, 작업 난이도가 너무 높거나 복수의 작업자들의 정확도가 너무 낮아 인공지능 모듈을 통한 검수가 불분명한 경우, 해당 작업에 대해 전문가 검수를 수행하도록 구성된다. 즉, 전문가들은 일부 모호한 작업에 대해서만 검수를 수행하면 되고, 대부분의 검수는 인공지능 모듈을 통해 수행되므로, 전문가들의 업무 부하가 충분히 감소될 수 있으며, 크라우드 아웃소싱 작업의 효율성이 향상될 수 있다. In addition, the crowd outsourcing
이 경우, 본 발명의 일 실시예에 따른 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치(400)는 복수의 작업자별 정확도, 성향, 작업 난이도를 판단하고, 복수의 작업자별 정확도 및 난이도에 기초하여 반영률을 결정하고, 반영률에 기초하여 복수의 작업자별 완료 데이터 검수를 위한 정답 데이터를 결정하도록 구성된다. 즉, 정확도가 우수한 작업자에게는 높은 반영률을 부여하고, 정답 데이터를 결정함에 있어서, 우수한 작업자의 완료 데이터를 높은 비율로 반영한다. 따라서, 정확도가 낮은 다수의 작업자들의 작업 결과에 의해 정답 데이터의 신뢰성이 낮아지는 문제를 최소화할 수 있으며, 인공지능 모듈에 의한 검수의 신뢰성이 더욱 향상될 수 있다.In this case, the crowd outsourcing
특히, 본 발명의 일 실시예에 따른 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치(400)는 복수의 작업자별 반영률을 결정함에 있어서 기간에 따른 가중치를 적용한다. 우수한 작업자라 하여도 다양한 요인에 의해 최근 작업 정확도가 떨어질 수도 있다. 본 발명의 일 실시예에 따른 크라우드 아웃소싱 작업 검수 장치(400)는 각 작업자별 품질점수에 기간에 따른 가중치를 적용하여 반영률을 결정하도록 구성되어 있으므로, 최근 작업 정확도가 떨어진 우수 작업자의 작업 결과가 정답 데이터를 결정하는데 영향이 미치지 못하도록 할 수 있으며, 이를 통해 정답 데이터의 신뢰성을 향상시킬 수 있다. In particular, the crowd outsourcing
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다. The description of the present invention described above is for illustration, and those of ordinary skill in the art to which the present invention pertains can understand that it can be easily modified into other specific forms without changing the technical spirit or essential features of the present invention. will be. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. For example, each component described as a single type may be implemented in a dispersed form, and likewise components described as distributed may be implemented in a combined form.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다. The scope of the present invention is indicated by the following claims rather than the above detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalent concepts should be interpreted as being included in the scope of the present invention. do.
100, 200, 300: 작업자 단말
400: 크라우드 아웃소싱 작업 관리장치
500: 검수자 단말
410: 통신부
420: 프로세서
430: 메모리100, 200, 300: operator terminal
400: Crowd outsourcing task management device
500: inspector terminal
410: communication department
420: processor
430: memory
Claims (13)
인공지능 모듈에 의해 제어되는 프로세서가 상기 완료 데이터를 중첩 가능한 데이터로 재구성하는 데이터 재구성 단계; 및
상기 인공지능 모듈에 의해 제어되는 프로세서가 상기 재구성된 데이터를 복수의 작업자 별로 분석하여 상기 복수의 작업자별 성향, 정확도, 상기 학습 데이터 형성 작업의 난이도 중 적어도 하나를 결정하는 성향 결정 단계를 포함하는,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법.Data receiving step of the communication unit receiving the completion data for the learning data forming task from a plurality of worker terminals through the Internet;
a data reconstruction step in which the processor controlled by the artificial intelligence module reconstructs the completed data into superimposable data; and
Including a tendency determining step in which the processor controlled by the artificial intelligence module analyzes the reconstructed data for each of a plurality of workers and determines at least one of the plurality of workers' propensity, accuracy, and difficulty of the learning data forming task,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 데이터 재구성 단계는,
상기 완료 데이터의 종류에 따라, 1차원 데이터인 경우 벡터로 재구성하고, 2차원 데이터인 경우 전체 면을 분할한 분할된 면을 가진 메트리스로 재구성하는,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법. According to claim 1,
The data reconstruction step is
According to the type of the completed data, in the case of one-dimensional data, it is reconstructed into a vector, and in the case of two-dimensional data, it is reconstructed into a matrix having a divided surface obtained by dividing the entire surface,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 성향 결정 단계는,
상기 복수의 작업자 단말별 상기 재구성 데이터로부터 상기 분할된 면에 해당하는 원소를 가진 메트리스로 상기 복수의 작업자 단말별 마스크를 생성하는 마스크 생성 단계; 및
상기 마스크를 분석하여 상기 복수의 작업자별 성향, 정확도, 상기 학습 데이터 형성 작업의 난이도 중 적어도 하나를 결정하는 성향 분석 단계를 포함하는,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법.3. The method of claim 2,
The tendency determination step is,
a mask generating step of generating a mask for each of the plurality of worker terminals with a matrix having an element corresponding to the divided surface from the reconstruction data for each of the plurality of worker terminals; and
Including a tendency analysis step of analyzing the mask to determine at least one of the plurality of workers' propensity, accuracy, and difficulty of the learning data formation task,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 성향 분석 단계는,
작업에 대한 상기 복수의 작업자 단말별 마스크 사이의 편차로부터 상기 작업에 대한 상기 학습 데이터 형성 작업의 난이도를 결정하는,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법.4. The method of claim 3,
The tendency analysis step is,
Determining the difficulty of the learning data forming task for the task from the deviation between the masks for each of the plurality of worker terminals for the task,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 성향 결정 단계는,
상기 마스크 생성단계와 상기 성향 분석 단계 사이에 상기 복수의 작업자 단말별 마스크를 병합하여 Trimap을 생성하는 Trimap 생성단계를 더 포함하는,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법.4. The method of claim 3,
The tendency determination step is,
Further comprising a Trimap generating step of generating a Trimap by merging the masks for each of the plurality of worker terminals between the mask generating step and the propensity analysis step,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 Trimap 생성 단계에서,
상기 복수의 작업자 단말별 마스크를 병합하는 방법은 상기 Trimap에 상기 복수의 작업자 단말별 마스크의 상기 원소의 값의 평균을 나타내는 방법인,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법.6. The method of claim 5,
In the Trimap generation step,
The method of merging the masks for each of the plurality of worker terminals is a method of indicating an average of the values of the elements of the masks for each of the plurality of operator terminals in the Trimap,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 성향 결정 단계는,
상기 복수의 작업자 단말 중 대상 작업자 단말의 마스크와 상기 Trimap의 유사도를 산출함으로써, 상기 대상 작업자 단말의 상기 정확도를 결정하는,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법.7. The method of claim 6,
The tendency determination step is,
By calculating the similarity between the mask of the target worker terminal and the Trimap among the plurality of worker terminals, determining the accuracy of the target operator terminal,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 성향 결정 단계는,
상기 유사도를 산출하는 방법으로서, 상기 대상 작업자 단말의 마스크 전체에 대하여 각 원소별로 계산된 코사인 유사도(cosine similarity)를 사용하며, 상기 코사인 유사도에 대입하는 일변수로 원소별 차를 사용하고, 다른 변수로 상기 대상 작업자 단말의 마스크에 표시된 인식으로 표시된 원소의 값을 사용하며,
상기 원소별 차는 상기 Trimap에 표시된 상기 원소의 값과 상기 대상 작업자 단말의 마스크에 표시된 상기 원소의 값의 차인,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법.8. The method of claim 7,
The tendency determination step is,
As a method of calculating the similarity, a cosine similarity calculated for each element is used for the entire mask of the target worker terminal, a difference between elements is used as one variable to be substituted for the cosine similarity, and another variable is used. Using the value of the element indicated by the recognition indicated on the mask of the target operator terminal,
The difference for each element is the difference between the value of the element displayed on the Trimap and the value of the element displayed on the mask of the target operator terminal,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 성향 결정 단계는,
상기 유사도를 산출하는 방법으로서, 원소별 차의 총합을 상기 Trimap에서 값이 0보다 큰 원소의 수로 나눈 값의 1에 대한 보수로 특정하며,
상기 원소별 차는 상기 Trimap에 표시된 상기 원소의 값과 상기 대상 작업자 단말의 마스크에 표시된 상기 원소의 값의 차인,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법.8. The method of claim 7,
The tendency determination step is,
As a method of calculating the similarity, the sum of differences for each element is specified as the complement of 1 of a value divided by the number of elements whose value is greater than 0 in the Trimap,
The difference for each element is the difference between the value of the element displayed on the Trimap and the value of the element displayed on the mask of the target operator terminal,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 성향 결정 단계는,
대상 작업자 단말의 마스크 중 선택 원소에 대응되는 상기 Trimap에서 원소의 평균을 산출함으로써, 상기 대상 작업자 단말의 작업 성향을 결정하는,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법. 6. The method of claim 5,
The tendency determination step is,
By calculating the average of elements in the Trimap corresponding to the selected element among the masks of the target worker terminal, determining the work tendency of the target worker terminal,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 성향 결정 단계는,
상기 Trimap에서 대상 작업자 단말의 마스크에 대응되는 원소의 값의 합을 선택 원소의 수로 나눈 OMS(Opacity Mask Score) 값을 작업 성향으로 결정하는,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법.11. The method of claim 10,
The tendency determination step is,
In the Trimap, an Opacity Mask Score (OMS) value obtained by dividing the sum of the values of elements corresponding to the mask of the target operator terminal by the number of selected elements is determined as the work tendency,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 성향 결정 단계는,
상기 작업 난이도를 산출하는 방법으로서, 상기 Trimap에서 표시된 상기 원소의 값의 합을 상기 원소의 값이 0보다 큰 상기 원소의 수로 나눈 값으로 결정하는,
인공지능을 이용한 크라우드 아웃소싱 작업 검수 방법.6. The method of claim 5,
The tendency determination step is,
A method of calculating the task difficulty, wherein the sum of the values of the elements displayed in the Trimap is determined as a value obtained by dividing the value of the elements by the number of the elements greater than 0,
A method of inspecting crowd outsourcing work using artificial intelligence.
상기 복수의 작업자 단말로부터 수신된 상기 완료 데이터들을 검수하는 연산을 수행하도록 구성된 프로세서; 및
상기 프로세서의 연산 동작을 제어하는 인공지능 모듈이 저장된 메모리를 포함하고,
상기 인공지능 모듈은,
2 이상의 상기 완료 데이터를 분석하여, 작업자의 정확도, 작업자의 성향, 작업의 난이도 중 적어도 하나 이상을 결정하는, 인공지능을 이용한 크라우드 아웃소싱 작업 검수 장치.
A communication unit for receiving the work completion data for the work data from a plurality of worker terminals;
a processor configured to perform an operation of inspecting the completed data received from the plurality of worker terminals; and
and a memory in which an artificial intelligence module for controlling the arithmetic operation of the processor is stored,
The artificial intelligence module is
Analyze the two or more of the completed data to determine at least one of the accuracy of the worker, the worker's tendency, and the difficulty of the job, a crowd outsourcing job inspection device using artificial intelligence.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200020688A KR102470856B1 (en) | 2020-02-19 | 2020-02-19 | Method and apparatus for cloud outsorcing task checking by using artificial intelligent |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200020688A KR102470856B1 (en) | 2020-02-19 | 2020-02-19 | Method and apparatus for cloud outsorcing task checking by using artificial intelligent |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210105775A true KR20210105775A (en) | 2021-08-27 |
KR102470856B1 KR102470856B1 (en) | 2022-11-25 |
Family
ID=77504577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200020688A KR102470856B1 (en) | 2020-02-19 | 2020-02-19 | Method and apparatus for cloud outsorcing task checking by using artificial intelligent |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102470856B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102484694B1 (en) * | 2022-11-01 | 2023-01-09 | 주식회사 큐로드 | Method, apparatus and computer program for inspecting work quality of gig workers qa platform worker and calculating rewards |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015041254A (en) * | 2013-08-22 | 2015-03-02 | 大日本印刷株式会社 | Trimap generation device, trimap generation method and program |
KR20180065840A (en) * | 2016-12-07 | 2018-06-18 | (주)씽크포비엘 | Method and apparatus for automatically assigning appropriate personnel |
KR101887415B1 (en) | 2017-11-21 | 2018-08-10 | 주식회사 크라우드웍스 | Program and method for checking data labeling product |
JP2019022477A (en) * | 2017-07-19 | 2019-02-14 | タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited | Crowdsourcing and deep learning based segmenting and karyotyping of chromosomes |
-
2020
- 2020-02-19 KR KR1020200020688A patent/KR102470856B1/en active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015041254A (en) * | 2013-08-22 | 2015-03-02 | 大日本印刷株式会社 | Trimap generation device, trimap generation method and program |
KR20180065840A (en) * | 2016-12-07 | 2018-06-18 | (주)씽크포비엘 | Method and apparatus for automatically assigning appropriate personnel |
JP2019022477A (en) * | 2017-07-19 | 2019-02-14 | タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited | Crowdsourcing and deep learning based segmenting and karyotyping of chromosomes |
KR101887415B1 (en) | 2017-11-21 | 2018-08-10 | 주식회사 크라우드웍스 | Program and method for checking data labeling product |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102484694B1 (en) * | 2022-11-01 | 2023-01-09 | 주식회사 큐로드 | Method, apparatus and computer program for inspecting work quality of gig workers qa platform worker and calculating rewards |
Also Published As
Publication number | Publication date |
---|---|
KR102470856B1 (en) | 2022-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102018108780A1 (en) | Machining surface quality evaluation device | |
EP4170602A1 (en) | A computer-implemented method and a system for estimating a pith location with regard to a timber board | |
CN112116184A (en) | Factory risk estimation using historical inspection data | |
CN115587543A (en) | Federal learning and LSTM-based tool residual life prediction method and system | |
KR20210108622A (en) | Artificial intelligence-based interviewer system and method for determining job competence | |
CN112116185A (en) | Test risk estimation using historical test data | |
CN110738702B (en) | Three-dimensional ultrasonic image processing method, device, equipment and storage medium | |
JP2021149446A (en) | Gazed object recognition system and method | |
KR102470856B1 (en) | Method and apparatus for cloud outsorcing task checking by using artificial intelligent | |
KR102481583B1 (en) | Method and apparatus for forming inspection criteria data with cloud outsorcing work by using artificial intelligent | |
KR102405297B1 (en) | Method and apparatus for sampling of cloud outsorcing task for inspection by using artificial intelligent | |
Hemalatha et al. | Performance evaluation of contour based segmentation methods for ultrasound images | |
KR20210041408A (en) | Apparatus and method for learning and evaluating worker's work based on eye tracking technology | |
Kumaresan et al. | Deep learning based Simple CNN weld defects classification using optimization technique | |
KR102405298B1 (en) | Apparatus and method for cloud outsorcing task management by using artificial intelligent | |
KR102480575B1 (en) | Method and apparatus for cloud outsorcing task distribution by using artificial intelligent | |
CN115969400A (en) | Apparatus for measuring area of eyeball protrusion | |
US20230135258A1 (en) | Prediction of geographic-atrophy progression using segmentation and feature evaluation | |
Iraldi et al. | Damage classification on roads using machine learning | |
US20220334043A1 (en) | Non-transitory computer-readable storage medium, gate region estimation device, and method of generating learning model | |
CN114092216A (en) | Enterprise credit rating method, apparatus, computer device and storage medium | |
CN114202530A (en) | Method, device, equipment and storage medium for analyzing damage degree | |
CN115357517B (en) | Evaluation method for development superiority and inferiority of machine vision underlying algorithm | |
Mezhenin et al. | Algorithms optimization for procedural terrain generation in real time graphics | |
JP7481691B2 (en) | Quality evaluation device, teaching data creation method, quality evaluation processing program, and quality evaluation method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |