KR102159574B1 - 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법 - Google Patents

인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법 Download PDF

Info

Publication number
KR102159574B1
KR102159574B1 KR1020200054502A KR20200054502A KR102159574B1 KR 102159574 B1 KR102159574 B1 KR 102159574B1 KR 1020200054502 A KR1020200054502 A KR 1020200054502A KR 20200054502 A KR20200054502 A KR 20200054502A KR 102159574 B1 KR102159574 B1 KR 102159574B1
Authority
KR
South Korea
Prior art keywords
accuracy
inspection
work
results
passed
Prior art date
Application number
KR1020200054502A
Other languages
English (en)
Inventor
박민우
김대영
Original Assignee
주식회사 크라우드웍스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 크라우드웍스 filed Critical 주식회사 크라우드웍스
Priority to KR1020200054502A priority Critical patent/KR102159574B1/ko
Application granted granted Critical
Publication of KR102159574B1 publication Critical patent/KR102159574B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06316Sequencing of tasks or work
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법이 제공된다. 상기 방법은 프로젝트의 복수의 작업을 복수의 작업자에게 배정하여 작업 수행을 요청하는 단계, 상기 복수의 작업자로부터 복수의 작업 결과를 입력받는 단계, 상기 복수의 작업 결과를 복수의 검수자에게 배정하여 검수 수행을 요청하는 단계, 상기 복수의 검수자로부터 상기 복수의 작업 결과에 대한 복수의 검수 결과로 검수 통과 또는 반려를 입력받는 단계, 복수의 상기 검수 결과가 상기 검수 통과로 입력된 작업 결과의 정확도를 추정하는 단계, 및 상기 추정 결과에 따라 상기 복수의 검수 통과된 작업 결과의 상기 정확도를 관리하는 단계를 포함한다.

Description

인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법{METHOD FOR ESTIMATING AND MANAGING THE ACCURACY OF WORK RESULTS OF CROWDSOURCING BASED PROJECTS FOR ARTIFICIAL INTELLIGENCE TRAINING DATA GENERATION}
본 발명은 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법에 관한 것이다.
최근, 기업 활동의 일부 과정에 일반 대중을 참여시키는 크라우드소싱 기반으로 많은 양의 데이터를 수집 및 가공하는 기업들이 늘고 있다. 즉, 기업은 하나의 프로젝트를 오픈하여 일반 대중, 즉 작업자가 해당 프로젝트에 참여하게 함으로써, 작업자에 의해 완료된 작업 결과를 통해 필요한 정보를 수집하게 된다.
이때, 기업은 보다 신뢰도가 높은 정보를 수집하기 위해, 작업자에 의해 완료된 작업 결과를 검수자에게 배정하여 검수 작업을 수행하도록 한다.
구체적으로, 하나의 프로젝트가 오픈되면, 복수의 작업자 각각에게 복수의 작업이 배정된다. 각각의 작업자는 배정받은 복수의 작업을 수행하고, 작업 결과를 제공한다. 이후, 복수의 검수자 각각에게 작업 결과에 대한 복수의 검수 작업이 배정되고, 각각의 검수자는 배정받은 복수의 검수 작업을 수행하게 된다.
한편, 프로젝트의 작업 결과에 대하여 검수자의 검수를 통해 반려율을 산출하고, 산출된 반려율을 이용함으로써 작업 결과의 품질을 관리하고 있으나, 이는 작업자 및 검수자에 의한 1차적인 판단 결과에 불과하므로 작업 결과의 정확도를 판단하는 지표가 될 수 없다.
특히, 작업 결과의 정확도를 판단하기 위한 정량적인 지표는 존재하지 않는바, 프로젝트의 품질을 개선하는 등의 목표 설정을 위해 작업 결과의 정확도를 판단할 수 있는 정량적 지표 마련이 필요한 실정이다.
공개특허공보 제10-2014-0095956호, 2014.08.04.
본 발명이 해결하고자 하는 과제는 복수의 검수 결과가 검수 통과로 입력된 작업 결과의 정확도를 추정하고, 추정 결과에 따라 복수의 검수 통과된 작업 결과에 대하여 정확도를 관리할 수 있는 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법을 제공하는 것이다.
다만, 본 발명이 해결하고자 하는 과제는 상기된 바와 같은 과제로 한정되지 않으며, 또다른 과제들이 존재할 수 있다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법은 크라우드소싱 기반 프로젝트(이하, 프로젝트)의 복수의 작업을 복수의 작업자에게 배정하여 작업 수행을 요청하는 단계, 상기 복수의 작업자로부터 복수의 작업 결과를 입력받는 단계, 상기 복수의 작업 결과를 복수의 검수자에게 배정하여 검수 수행을 요청하는 단계, 상기 복수의 검수자로부터 상기 복수의 작업 결과에 대한 복수의 검수 결과로 검수 통과 또는 반려를 입력받는 단계, 복수의 상기 검수 결과가 상기 검수 통과로 입력된 작업 결과(이하, "검수 통과된 작업 결과")의 정확도를 추정하는 단계, 및 상기 추정 결과에 따라 상기 복수의 검수 통과된 작업 결과의 상기 정확도를 관리하는 단계를 포함한다. 이때, 상기 복수의 검수 통과된 작업 결과의 정확도를 추정하는 단계는, 사전 결정된 제1 단위 건을 추정 구간(interval)으로 설정하는 단계와, 상기 추정 구간에 상응하는 검수 통과된 작업 결과가 발생할 때마다, 상기 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도를 소정의 신뢰 수준(confidence level)으로 추정하는 단계를 포함한다. 그리고 상기 복수의 검수 통과된 작업 결과의 상기 정확도를 관리하는 단계는, 상기 제1 정확도의 신뢰 구간(confidence interval)의 신뢰 하한 값(lower confidence limit)이 기준 정확도 미만이면, 상기 추정 구간에 상응하는 검수 통과된 작업 결과를 복수의 사전 결정된 제2 단위 건의 세부 추정 구간으로 분할하는 단계와, 상기 복수의 세부 추정 구간에 상응하는 검수 통과된 작업 결과의 제2 정확도를 상기 신뢰 수준으로 추정하는 단계와, 상기 복수의 세부 추정 구간 중 상기 제2 정확도의 신뢰 구간의 신뢰 하한 값이 상기 기준 정확도 미만인 세부 추정 구간(이하, "미달 세부 추정 구간")을 식별하는 단계와, 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재검수 또는 재작업 수행을 요청하는 단계를 포함한다.
본 발명의 일부 실시예에서, 상기 복수의 검수 통과된 작업 결과의 정확도를 추정하는 단계는, 상기 제1 정확도의 신뢰 구간의 신뢰 하한 값이 상기 기준 정확도보다 크고, 상기 제1 정확도의 신뢰 구간의 신뢰 하한 값과 상기 기준 정확도 간의 편차가 사전 결정된 값 이상이면, 상기 제1 단위 건보다 큰 사전 결정된 제3 단위 건을 상기 추정 구간으로 갱신하여 설정하는 단계를 더 포함할 수 있다.
본 발명의 일부 실시예에서, 상기 복수의 검수 통과된 작업 결과의 정확도를 추정하는 단계는, 상기 제1 정확도의 신뢰 구간의 신뢰 하한 값이 상기 기준 정확도보다 작으면, 상기 제1 단위 건보다 작은 사전 결정된 제4 단위 건을 상기 추정 구간으로 갱신하여 설정하는 단계를 더 포함할 수 있다.
본 발명의 일부 실시예에서, 상기 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도를 소정의 신뢰 수준으로 추정하는 단계는, 상기 추정 구간에 상응하는 검수 통과된 작업 결과 중 n건의(단, n은 1이상의 자연수) 검수 통과된 작업 결과를 샘플링하는 단계와, 상기 n건의 샘플링한 검수 통과된 작업 결과에 대해서 상기 복수의 2차 검수자에게 정확 여부 판정을 요청하는 단계와, 상기 복수의 2차 검수자로부터 상기 n건의 샘플링한 검수 통과된 작업 결과에 대한 판정 결과로 정확 또는 부정확을 입력받는 단계와, 상기 판정 결과로 상기 정확을 입력받은 빈도에 기초하여 상기 n건의 샘플링한 검수 통과된 작업 결과의 정확도를 측정하는 단계와, 상기 n건의 샘플링한 검수 통과된 작업 결과의 정확도에 기초하여 상기 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도를 상기 신뢰 수준으로 추정하는 단계를 포함할 수 있다.
본 발명의 일부 실시예에서, 상기 제1 정확도의 신뢰 구간의 신뢰 하한 값은, 상기 n건의 샘플링한 검수 통과된 작업 결과의 정확도로부터 상기 신뢰 수준의 표본 오차를 감산한 값일 수 있다.
본 발명의 일부 실시예에서, 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재검수 또는 재작업 수행을 요청하는 단계는, 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재검수 수행을 요청하고, 상기 복수의 검수 통과된 작업 결과의 상기 정확도를 관리하는 단계는, 상기 복수의 2차 검수자로부터 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대한 검수 결과 및 반려 사유를 입력받는 단계를 포함할 수 있다.
본 발명의 일부 실시예에서, 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재검수 또는 재작업 수행을 요청하는 단계는, 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재작업 수행을 요청하고, 상기 복수의 검수 통과된 작업 결과의 상기 정확도를 관리하는 단계는, 상기 복수의 2차 검수자로부터 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대한 재작업 결과를 입력받는 단계를 포함할 수 있다.
본 발명의 일부 실시예에서, 상기 복수의 검수 통과된 작업 결과의 상기 정확도를 관리하는 단계는, 상기 재검수 또는 재작업 수행 이후, 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과의 제3 정확도를 상기 신뢰 수준으로 다시 추정하는 단계와, 상기 제3 정확도의 신뢰 구간의 신뢰 하한 값이 상기 기준 정확도 미만이면, 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재검수 또는 재작업 수행을 다시 요청하는 단계를 포함할 수 있다.
본 발명의 일부 실시예는, 상기 프로젝트가 종료되면, 복수의 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도에 기초하여 상기 프로젝트의 작업 결과의 정확도를 추정하는 단계를 더 포함할 수 있다.
상술한 과제를 해결하기 위한 본 발명의 다른 면에 따른 컴퓨터 프로그램은, 하드웨어인 컴퓨터와 결합되어 상기 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법을 실행하며, 컴퓨터 판독가능 기록매체에 저장된다.
본 발명의 기타 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
상술한 본 발명에 의하면, 프로젝트의 작업 결과에 대하여 소정의 단위 건을 기준으로 추정 구간을 설정하고, 해당 추정 구간의 정확도 추정을 통해 전체 프로젝트에 대한 정량적인 정확도 지표 산출이 가능하다.
또한, 추정된 정확도를 이용하여 추정 구간을 세분화하고 세분화된 구간의 정확도를 추가적으로 산출하여 해당 구간에서의 검수 통과된 작업 결과의 재작업 또는 재검수 여부를 결정함으로써, 부정확한 작업 결과를 바로 잡을 수 있다는 장점이 있다.
이와 더불어, 추정된 정확도를 이용하여 추정 구간의 범위를 증가시킴으로써, 정확도가 충분히 높을 경우 신속하고 효율적인 정확도 판단 및 산출 과정이 이루어지도록 할 수 있다. 그리고 추정된 정확도가 낮을 경우 추정 구간의 범위를 감소시킴으로써, 좁은 범위에 걸쳐 목표로 하는 정확도 확보를 위한 재검수 또는 재작업이 이루어지도록 하여, 전체 작업 결과를 대상으로 재검수 또는 재작업을 수행하는 것 대비 소요 시간 및 비용을 절감할 수 있다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 크라우드소싱 서비스의 개념도이다.
도 2는 본 발명의 일 실시예에 따른 크라우드소싱 기반의 프로젝트의 진행 프로세스를 설명하기 위한 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법의 순서도이다.
도 4는 검수 통과된 작업 결과의 정확도를 추정 및 관리하는 내용을 설명하기 위한 순서도이다.
도 5는 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도를 추정하는 내용을 설명하기 위한 순서도이다.
도 6은 추정 구간을 갱신하는 내용을 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시예에 따른 작업 결과 정확도 추정 및 관리 장치의 블록도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 크라우드소싱 서비스의 개념도이다.
도 1을 참조하면, 크라우드소싱 서비스는 의뢰자(10), 서비스 제공 업체(20) 및 대중(30)으로 구성되어 수행된다.
의뢰자(10)는 크라우드소싱 기반의 프로젝트(이하, 프로젝트)를 의뢰하는 기업이나 개인을 의미한다.
의뢰자(10)는 인공지능 학습데이터의 생성을 위한 소스 데이터의 수집 또는 데이터 어노테이션 등을 목적으로 프로젝트를 의뢰한다. 프로젝트를 통해서 생성된 데이터는 지도 학습, 비지도 학습, 강화 학습 등의 임의의 기계 학습의 학습데이터로 활용될 수 있다. 소스 데이터의 수집은 녹음된 음성 수집, 사진 수집 등 가공되지 않은 데이터를 수집하는 것을 의미한다. 데이터 어노테이션은 텍스트, 사진, 비디오 등의 소스 데이터에 관련 주석 데이터를 입력하는 것을 의미한다. 예들 들어, 데이터 어노테이션은 주어진 지문에서 개체를 찾는 것, 유사한 문장을 찾는 것 등이 있을 수 있으나 이에 제한되지 않는다. 한편, 전술한 프로젝트의 종류는 일 실시예에 불과하며, 의뢰자의 설계에 따라 다양한 프로젝트가 본 발명에서 취급될 수 있다.
서비스 제공 업체(20)는 크라우드소싱 서비스를 제공하는 기업을 의미한다.
서비스 제공 업체(20)는 의뢰자(10)로부터 제품 또는 서비스에 대한 프로젝트를 의뢰 받으면, 해당 프로젝트에 대한 작업을 일반 대중(30)에게 배정하여 대중(30)으로부터 작업 결과를 제공받는다. 이후, 작업 결과를 기반으로 추출된 최종 산출물을 의뢰자(10)에게 제공한다.
이때, 서비스 제공 업체(20)는 크라우드소싱 플랫폼(이하, 플랫폼)을 통해 의뢰자(10) 및 대중(30)에게 크라우드소싱 서비스를 제공한다. 즉, 서비스 제공 업체(20)는 의뢰자(10)로부터 프로젝트를 의뢰 받으면, 플랫폼에 프로젝트를 오픈한다. 이후, 대중(30)으로부터 오픈된 프로젝트에 대한 작업 결과를 제공받으면, 해당 프로젝트를 플랫폼 상에서 종료하고, 최종 산출물을 추출하여 의뢰자(10)에게 제공할 수 있다.
대중(30)은 플랫폼에 오픈된 프로젝트에 참여하는 일반 대중을 의미한다. 여기서, 대중(30)은 서비스 제공 업체(20)가 제공하는 애플리케이션 또는 웹사이트 등을 통해 플랫폼에 오픈된 프로젝트에 참여할 수 있다.
대중(30)은 작업자(32) 및 검수자(34)로 구성된다.
작업자(32)는 플랫폼에 오픈된 복수의 프로젝트 중 특정 프로젝트에 참여를 결정한다. 이후, 작업자(32)는 소스 데이터의 수집 또는 데이터 어노테이션 등의 작업을 수행하고, 이를 플랫폼에 전송한다.
검수자(34)는 플랫폼에 오픈된 복수의 프로젝트 중 특정 프로젝트에 참여를 결정한다. 이후, 검수자(34)는 작업자(32)가 수행한 작업 결과에 대한 검수를 수행한다. 검수자(34)는 검수 수행 결과로서, 검수 통과 처리 또는 반려 처리를 할 수 있고, 반려 처리시 반려 사유를 입력할 수 있다. 검수 통과의 경우 재작업과 이로 인한 재검수가 필요하지 않으므로, 검수 통과는 검수 완료와 동일한 의미를 가진다.
도 2는 본 발명의 일 실시예에 따른 크라우드소싱 기반의 프로젝트의 진행 프로세스를 설명하기 위한 흐름도이다.
먼저, 의뢰자(10)는 서비스 제공 업체(20)로 하나 이상의 프로젝트를 의뢰한다(S11).
이후, 서비스 제공 업체(20)는 의뢰된 프로젝트를 플랫폼 상에 오픈한다(S12). 이때, 서비스 제공 업체(20)는 프로젝트 오픈 전에, 해당 프로젝트의 난이도 등을 고려하여 등급을 결정할 수 있다. 즉, 난이도에 따라 어떤 등급 이상의 대중(30)에게 해당 프로젝트를 노출시킬지를 결정할 수 있다. 이에 따라, 프로젝트의 작업 결과의 신뢰도를 높일 수 있게 된다.
이후, 서비스 제공 업체(20)는 프로젝트의 등급에 따라 해당 등급 이상의 작업자(32)에게 작업을 할당하여 작업 요청한다(S13).
이후, 작업자(32)는 할당된 작업을 수행하게 된다(S14). 이때, 작업자(32)는 어떤 이유에 의해 작업 자체가 불가능한 작업에 대해서는 작업을 수행하지 않고 작업 불가 사유를 입력할 수 있다.
이후, 서비스 제공 업체(20)는 작업자(32)로부터 작업 결과를 제공받고(S15), 해당 작업 결과에 대한 검수 작업을 검수자(34)에게 할당하여 검수 요청한다(S16).
마찬가지로 본 발명의 일 실시예는 프로젝트의 난이도에 따라 설정된 등급 또는 검수자(34)의 자격 요건에 따라 수행 중인 전체 프로젝트 중 적합한 프로젝트만 검수자(34)에게 노출되게끔 할 수 있다.
이후, 검수자(34)는 할당된 검수를 수행하게 된다(S17). 이때, 검수자(34)는 작업이 적합하게 수행된 것으로 판단하면 검수 완료를 결정하고, 검수 작업이 잘못된 것으로 판단하면 반려 처리한다. 반려 처리 시, 검수자(34)는 어떤 이유로 작업이 잘못된 것으로 판단했는지에 대한 반려 사유를 입력한다.
이후, 서비스 제공 업체(20)는 검수자(34)로부터 검수 결과를 제공받는다(S18).
검수 결과가 검수 완료인 경우, 서비스 제공 업체(20)는 해당 작업 결과를 유효한 데이터로 사용하여, 이를 기반으로 하여 프로젝트 종료 시 최종 산출물을 추출하게 된다.
검수 결과가 반려 처리인 경우, 서비스 제공 업체(20)는 내부적으로 검수를 다시 수행하거나, 작업자(32)에게 다시 작업을 배정하여 재작업을 수행하게 할 수도 있다. 재작업시 검수자의 재검수가 필요하다.
이후, 서비스 제공 업체(20)는 프로젝트 기간이 종료되거나 충분한 유효 데이터를 확보하게 되면 해당 프로젝트를 종료하고(S19), 확보된 유효 데이터를 기반으로 최종 결과물을 산출하여 의뢰자(10)에게 제공한다(S20).
이때, 프로젝트 종료 전, 서비스 제공 업체(20)는 작업자(32) 및 검수자(34)의 수행 결과를 평가하고, 평가에 따라 작업 비용 및 검수 비용을 산출하여 작업자(32) 및 검수자(34)에게 지급한다.
도 1 및 도 2에서는 단순히 의뢰자(10), 서비스 제공 업체(20), 작업자(32), 검수자(34)로 표현하였으나, 이들은 각 참여자에 의해서 운용되는 스마트폰, 태블릿, PDA, 랩톱, 데스크톱, 서버 등과 같은 컴퓨터 장치 또는 전기 통신 장치를 의미한다.
한편, 프로젝트의 품질은 작업자의 작업 결과에 의해 결정되므로, 작업자의 작업 결과의 품질을 향상 및 검증하기 위한 검수 프로세스를 두고 있다. 검수 프로세스는 전술한 바와 같이 작업자가 작업 결과를 완료하여 제출하면 정확히 작업되었는지 여부를 판단하여, 검수 통과 또는 반려시키는 것을 통해 작업 결과의 정확도를 체크하는 과정이다.
하지만, 검수 프로세스를 두는 것만으로는 프로젝트의 작업 결과가 100% 정확한 것이라 장담할 수 없기 때문에, 검수 프로세스를 두는 것과 별개로 프로젝트의 작업 결과에 대해 정확도가 어느 정도인지를 가늠할 수 있는 정량적인 지표가 필요하다.
이를 위해, 본 발명의 일 실시예는 복수의 검수 결과가 검수 통과로 입력된 작업 결과의 정확도를 추정하고, 추정 결과에 따라 복수의 검수 통과된 작업 결과에 대하여 정확도를 관리할 수 있다.
이하에서는 도 3 내지 도 6을 참조하여 본 발명의 일 실시예에 따른 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법을 설명하도록 한다.
도 3은 본 발명의 일 실시예에 따른 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법의 순서도이다. 도 4는 검수 통과된 작업 결과의 정확도를 추정 및 관리하는 내용을 설명하기 위한 순서도이다. 도 5는 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도를 추정하는 내용을 설명하기 위한 순서도이다.
한편, 도 3 내지 도 5에 도시된 단계들은 서비스 제공 업체(20)에 의해 운영되는 플랫폼 서버(이하, 서버)에 의해 수행되는 것으로 이해될 수 있지만, 이에 제한되는 것은 아니다.
또한, 복수의 작업자(32) 또는 복수의 검수자(34)는 소정의 단말 장치를 이용하여 작업을 수행한다. 작업자(32) 또는 검수자(34)의 단말 장치는 스마트폰, 태블릿, PDA, 랩톱, 데스크톱 등과 같은 컴퓨터 장치 또는 전기 통신 장치일 수 있으나, 이에 제한되는 것은 아니다.
먼저, 도 3을 참조하면 서버는 크라우드소싱 기반의 프로젝트(이하, 프로젝트라 한다)의 복수의 작업을 복수의 작업자(32)에게 배정하여 작업 수행을 요청하고(S110), 복수의 작업자(32)로부터 복수의 작업 결과를 입력받는다(S120).
여기에서, 하나의 프로젝트에는 복수의 작업이 포함될 수 있으며, 복수의 작업은 종류에 따라 복수의 태스크로 그룹화될 수 있고, 또는 각각의 작업이 서로 다른 종류의 작업일 수도 있으며, 동일한 작업일 수도 있지만, 이에 제한되는 것은 아니다.
다음으로, 서버는 복수의 작업 결과를 복수의 검수자(34)에게 배정하여 검수 수행을 요청하고(S130), 복수의 검수자(34)로부터 복수의 작업 결과에 대한 복수의 검수 결과를 입력받는다(S140). 이때, 검수자(34)는 복수의 검수 결과로 검수 통과 또는 반려를 입력할 수 있다.
다음으로, 서버는 복수의 검수 결과가 검수 통과로 입력된 작업 결과(이하, 검수 통과된 작업 결과라 한다)의 정확도를 추정하고(S150), 추정 결과에 따라 복수의 검수 통과된 작업 결과의 정확도를 관리한다(S160).
즉, 본 발명의 일 실시예는 검수 프로세스와는 별도로 프로젝트의 작업 결과의 정확도를 추정 및 관리하는 것을 특징으로 한다.
도 4를 참조하면, 서버는 검수 통과된 작업 결과에 대한 정확도를 추정하기 위하여, 먼저 사전 결정된 제1 단위 건을 추정 구간으로 설정한다(S205).
그 다음, 서버는 추정 구간에 상응하는 검수 통과된 작업 결과가 발생하는지 여부를 체크하여 발생할 때마다(S210), 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도를 소정의 신뢰 수준으로 추정한다(S215).
일 예로, 제1 단위 건의 추정 구간은 100건으로 설정될 수 있으며, 서버는 100건의 검수 통과된 작업 결과가 발생할 때마다 100건에 대한 정확도를 추정한다.
일 실시예로, 본 발명은 검수 통과된 작업 결과의 정확도를 추정시 통계학의 모비율의 추정 이론을 활용할 수 있다. 모비율의 추정 이론에 따라, 모집단은 추정 구간에 속하는 전체 검수 통과된 작업 결과가 되고, 표본은 후술하는 샘플링한 검수 통과된 작업 결과가 된다.
이때, 본 발명의 일 실시예에는 모비율의 추정 이론이 적용되기에 적합하도록 표본의 크기 n은 충분히 크며(예를 들어, n>30), 이에 따라 표본의 비율은 그 분포가 정규 분포를 따르고, 이를 표준화한 Z score는 표준 정규분포를 따른다.
이때, 모집단의 비율을 P라 하고, 표본의 비율을 p라 할 경우, 표본의 크기 n이 충분히 크면(예를 들어, n>30), 모집단의 비율 P의 신뢰 구간은 표본의 비율 p를 이용하여 다음 식 1에 따라 산출할 수 있다.
[식 1]
p - z * SQRT[ p(1-p)/n ] <= P <= p + z * SQRT[ p(1-p)/n ]
여기에서, 'p - z * SQRT[ p(1-p)/n ]'은 신뢰 하한 값(lower confidence limit)에 해당하고, 'p + z * SQRT[ p(1-p)/n ]'은 신뢰 상한 값(upper confidence limit)에 해당한다. 또한, z는 신뢰 수준에 상응하는 Z score로서, 예를 들어, 95%의 신뢰 수준에서 z는 1.96이고, 99%의 신뢰 수준에서 z는 2.58에 해당한다. 예를 들어, z를 1.96으로 사용한 경우, 95%의 신뢰 수준으로 모집단의 비율이 신뢰 구간에 위치한다고 할 수 있다.
이때, 본 발명의 일 실시예에서는 이러한 모비율의 추정 이론에 따라, 추정 구간에 속하는 전체 검수 통과된 작업 결과의 정확도는 모집단의 비율이 되고, 샘플링한 검수 통과된 작업 결과의 정확도는 표본 비율이 된다.
도 5를 참조하면, 서버는 제1 단위 건의 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도 추정을 위해, 추정 구간에 상응하는 검수 통과된 작업 결과 중 n건(단, n은 1 이상의 자연수)의 검수 통과된 작업 결과를 샘플링한다(S310).
그리고 서버는 n건의 샘플링한 검수 통과된 작업 결과에 대해 복수의 2차 검수자(34)에게 정확 여부 판정을 요청하여(S320), 복수의 2차 검수자(34)로부터 n건의 샘플링한 검수 통과된 작업 결과에 대한 판정 결과로 정확 또는 부정확을 입력받는다(S330).
여기에서 2차 검수자(34)는, 검수 수행을 통한 검수 통과 또는 반려를 입력하고 반려의 경우 반려 사유를 입력하는 보통의 검수 프로세스와는 달리, 검수 통과된 작업 결과가 정확한지 아니면 부정확한지를 판정하여 입력한다. 2차 검수자(34)는 반려 사유를 입력하는 것이 아니라 정확성 여부만을 판정하는 것이므로, 검수 프로세스에 비하여 신속한 처리가 가능하다.
그 다음, 서버는 2차 검수자(34)로부터의 판정 결과로 정확을 입력받은 빈도에 기초하여, n건의 샘플링한 검수 통과된 작업 결과의 정확도를 측정한다(S340). 예를 들어, 2차 검수자(34)로부터 정확을 입력받은 빈도가 x일 경우, 정확도는 x/n으로 측정될 수 있다.
그 다음, 서버는 n건의 샘플링한 검수 통과된 작업 결과의 정확도에 기초하여, 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도를 신뢰 수준으로 추정한다(S350).
예를 들어, 샘플링한 건수 n=100건이고, 정확도가 99%로 추정된 경우, 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도의 신뢰구간은 95%의 신뢰 수준으로 다음 [식 2]와 같이 나타낼 수 있다.
[식 2]
0.99 - 1.96 * SQRT[ 0.99(1-0.99)/100 ] <= P <= 0.99 + 1.96 * SQRT[ 0.99(1-0.99)/100 ]
99% - 1.95% <= P <= 100%
97.05% <= P(제1 정확도) <=100%
다시 도 4를 참조하면, 서버는 제1 정확도의 신뢰 구간(confidence interval)의 신뢰 하한 값(lower confidence limit)이 기준 정확도 미만인지 여부를 판단한다(S220).
이때, 본 발명의 일 실시예는 각 추정 구간에 속하는 전체 검수 통과된 작업 결과의 정확도가 기준 정확도 이상이 되도록 관리하는 것을 목적으로 하므로 신뢰 하한 값을 사용한다.
여기에서 제1 정확도의 신뢰 구간의 신뢰 하한 값은 n건의 샘플링한 검수 통과된 작업 결과의 정확도로부터 신뢰 수준의 표본 오차를 감산한 값에 해당하며, 신뢰 수준의 표본 오차는 식 1 및 식 2에서의 'z * SQRT[ p(1-p)/n ]'에 해당한다.
서버는 판단 결과 제1 정확도에 대한 신뢰 하한 값이 기준 정확도 미만일 경우(S220-Y), 추정 구간에 상응하는 검수 통과된 작업 결과를 복수의 사전 결정된 제2 단위 건의 세부 추정 구간으로 분할한다(S225).
그 다음, 서버는 복수의 세부 추정 구간에 상응하는 검수 통과된 작업 결과의 제2 정확도를 신뢰 수준으로 추정하고(S230), 복수의 세부 추정 구간에 대하여 제2 정확도의 신뢰 구간의 신뢰 하한 값이 기준 정확도 미만에 해당하는지 여부를 판단한다(S235).
판단 결과, 복수의 세부 추정 구간 중 제2 정확도의 신뢰 구간의 신뢰 하한 값이 기준 정확도 미만에 해당하는 경우(S235-Y), 해당되는 세부 추정 구간(이하, 미달 세부 추정 구간이라 한다)을 식별하여(S240), 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해 복수의 2차 검수자(34)에게 재검수 또는 재작업 수행을 요청한다(S245).
예를 들어, 서버는 추정 구간 100건에 대하여 추정된 제1 정확도의 신뢰 구간의 신뢰 하한 값이 기준 정확도 미만일 경우, 100건에 대하여 각각 50건의 세부 추정 구간으로 분할할 수 있다. 그리고 각 50건의 세부 추정 구간에 대하여 제1 정확도의 추정 방법과 같이 추정된 제2 정확도의 신뢰 구간의 신뢰 하한 값이 기준 정확도 미만에 해당하는 미달 세부 추정 구간을 식별하여, 식별된 미달 세부 추정 구간에 대해서만 재검수 또는 재작업을 진행함으로써 신속하게 정확도를 보완할 수 있다.
도 6은 추정 구간을 갱신하는 내용을 설명하기 위한 도면이다.
단계 S220에서 서버는 판단 결과 제1 정확도에 대한 신뢰 하한 값이 기준 정확도보다 크고, 제1 정확도의 신뢰 구간의 신뢰 하한 값과 기준 정확도 간의 편차가 사전 결정된 값 이상일 경우(S265-Y), 제1 단위 건(a)보다 큰 사전 결정된 제3 단위 건을 추정 구간으로 갱신하여 설정할 수 있다(S270).
예를 들어, 최초 추정 구간인 제1 단위 건(a)이 100건이고, 제1 정확도의 신뢰 구간의 신뢰 하한 값이 98%이며, 기준 정확도인 95%와 3% 이상 차이나게 클 경우, 서버는 추정 구간을 100건보다 20건을 증가하여 제3 단위 건으로 갱신할 수 있다.
이와 같이 이전 구간의 정확도가 높아 추정 구간의 단위 건수를 증가시켜 나갈 경우, 정확도의 추정 및 관리에 소요되는 시간 및 비용을 절감할 수 있다는 장점이 있다.
이와 달리 서버는 판단 결과 제1 정확도에 대한 신뢰 하한 값이 기준 정확도보다 크나, 제1 정확도의 신뢰 구간의 신뢰 하한 값과 기준 정확도 간의 편차가 사전 결정된 값 미만일 경우(S265-N), 이전에 설정된 제1 단위 건을 추정 구간으로 하여 제1 정확도를 추정한다.
반대로, 서버는 제1 정확도의 신뢰 구간의 신뢰 하한 값이 기준 정확도보다 작을 경우에는(S220-Y), 제1 단위 건보다 작은 사전 결정된 제4 단위 건으로 갱신할 수 있다(S260).
예를 들어, 최초 추정 구간인 제1 단위 건이 100건이고, 제1 정확도의 신뢰 구간의 신뢰 하한 값이 94%로, 기준 정확도인 95%보다 작은 경우, 서버는 추정 구간을 100건보다 20건을 감소하여 제4 단위 건으로 갱신할 수 있다.
즉, 이전 구간의 정확도가 낮다면, 다음 추정 구간의 단위 건수를 감소시킴으로써, 목표하는 정확도를 확보하도록 하며, 좁은 범위에 걸쳐서 재검수 또는 재작업이 수행되도록 하여, 재검수 또는 재작업에 소요되는 비용 및 시간을 절감할 수 있다.
다시 도 4를 참조하면, 서버는 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해 복수의 2차 검수자(34)에게 재검수 수행을 요청할 수 있으며, 재검수 수행을 요청 받은 2차 검수자(34)는 재검수를 수행하게 된다.
이후 서버는 2차 검수자(34)의 재검수가 완료됨에 따라, 복수의 2차 검수자(34)로부터 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대한 검수 결과와 반려 사유를 입력받을 수 있다.
원칙적으로 본 발명의 일 실시예는 2차 검수자(34)는 검수 통과된 작업에 대한 정확 여부만을 판정하는 것이므로 검수를 수행하지 않으나, 예외적으로 작업 결과의 정확도를 목표하는 정확도로 향상시키기 위하여, 2차 검수자(34)에게 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과 중 부정확하게 작업되어 반려되었어야 하는 작업 결과에 대해 반려시키고 반려 사유를 입력하도록 재검수 수행을 요청할 수 있다.
이 경우 서버는 원래 검수를 수행한 검수자에게 다시 재검수를 요청할 수도 있으나, 원래 검수자에 의한 검수 통과된 작업 결과가 부정확으로 판정된 것이므로 재검수 수행 결과 역시 왜곡될 가능성이 높기 때문에, 2차 검수자(34)에게 직접 재검수를 요청할 수 있다.
또한, 서버는 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해 복수의 2차 검수자(34)에게 재작업 수행을 요청할 수 있으며, 재작업 수행을 요청 받은 2차 검수자(34)는 검수가 아닌 직접 재작업을 수행하게 된다.
이후 서버는 2차 검수자(34)의 재작업이 완료됨에 따라, 복수의 2차 검수자(34)로부터 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대한 재작업 결과를 입력받을 수 있다.
이는 2차 검수자(34)로 하여금 재검수 및 반려 사유를 입력토록 하면, 작업자의 재작업을 기다린 후 재검수를 다시 수행하기까지 상대적으로 많은 시간이 소요되기 때문에, 서버는 이 경우 2차 검수자(34)에게 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과 중 부정확하게 작업되어 반려되었어야 하는 작업 결과에 대해 직접 수정하도록 재작업 수행을 요청할 수 있다.
다시 도 4를 참조하면, 본 발명의 일 실시예는 2차 검수자(34)에 의한 재검수 또는 재작업 수행 이후에, 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대하여 제3 정확도(34)를 신뢰 수준으로 다시 추정할 수 있다(S250).
이와 같은 추정 결과, 제3 정확도의 신뢰 구간의 신뢰 하한 값이 기준 정확도 미만일 경우(S255-Y), 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해 복수의 2차 검수자(34)에게 재검수 및 재작업 수행을 다시 요청할 수 있다(S245).
이와 같은 과정은 해당 추정 구간의 제3 정확도가 기준 정확도 이상이 될 때까지 반복 수행될 수 있다.
한편, 본 발명의 설명에서 제1 정확도, 제2 정확도, 제3 정확도나, 제1 단위 건 수, 제2 단위 건 수 등, '제1', '제2', '제3' 등의 용어는 특정 수치를 한정하기 위한 것이 아니라, 추정 시점에 따라 서로 구별하기 위해 사용되는 것일 뿐이다.
그밖에, 본 발명의 일 실시예는 작업 결과의 정확도를 추정 및 관리하는 것에서 더 나아가, 프로젝트가 종료되면, 복수의 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도에 기초하여 프로젝트의 작업 결과의 정확도를 추정할 수도 있다.
즉, 각 추정 구간의 제1 정확도를 이용하여 프로젝트 전체 작업 결과의 정확도를 추정할 수 있다.
뿐만 아니라, 본 발명의 일 실시예는 복수의 프로젝트의 정확도를 이용하여 크라우드소싱 플랫폼 전체에 대한 정확도의 추정도 가능함은 물론이다.
한편, 상술한 설명에서, 단계 S110 내지 S350은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다. 아울러, 기타 생략된 내용이라 하더라도 후술하는 도 7의 내용은 도 1 내지 도 6의 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법에도 적용될 수 있다.
이하에서는 본 발명의 일 실시예에 따른 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 장치(400, 이하 작업 결과 정확도 추정 및 관리 장치라 한다)에 대하여 설명하도록 한다.
도 7은 본 발명의 일 실시예에 따른 작업 결과 정확도 추정 및 관리 장치(400)를 설명하기 위한 도면이다.
도 7을 참조하면, 따른 작업 결과 정확도 추정 및 관리 장치(400)는 통신모듈(410), 메모리(420) 및 프로세서(430)를 포함한다.
통신모듈(410)은 하나의 프로젝트에 대한 크라우드소싱 기반의 작업을 복수의 작업자(32)에게 송신하여 작업 수행을 요청하고, 복수의 작업자(32)로부터 작업 결과를 수신한다. 또한, 복수의 작업자(32)로부터 수신된 작업 결과를 복수의 검수자(34)에게 송신하여 검수를 요청하고, 복수의 검수자(34)로부터 검수 결과를 수신한다.
메모리(420)에는 복수의 검수 통과된 작업 결과의 정확도를 추정하고, 추정 결과에 기초하여 복수의 검수 통과된 작업 결과의 정확도를 관리하기 위한 프로그램이 저장된다.
프로세서(430)는 메모리(420)에 저장된 프로그램을 실행시킨다. 프로세서(430)는 메모리(420)에 저장된 프로그램을 실행시킴에 따라, 사전 결정된 제1 단위 건을 추정 구간으로 설정하고, 추정 구간에 상응하는 검수 통과된 작업 결과가 발생할 때마다, 추정 구간에 상응하는 검수 통과된 작업 결과에 대한 제1 정확도를 소정의 신뢰 수준으로 추정한다.
그리고 프로세서(430)는 제1 정확도의 신뢰 구간의 신뢰 하한 값이 기준 정확도 미만이면, 추정 구간에 상응하는 검수 통과된 작업 결과의 복수의 사전 결정된 제2 단위 건의 세부 추정 구간으로 분할하고, 복수의 세부 추정 구간에 상응하는 검수 통과된 작업 결과의 제2 정확도를 신뢰 수준으로 추정하며, 복수의 세부 추정 구간 중 제2 정확도의 신뢰 구간의 신뢰 하한 값이 기준 정확도 미만인 미달 세부 추정 구간을 식별하고, 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재검수 또는 재작업 수행을 요청한다.
이상에서 전술한 본 발명의 일 실시예에 따른 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법은, 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 어플리케이션)으로 구현되어 매체에 저장될 수 있다.
상기 전술한 프로그램은, 상기 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 상기 방법들을 실행시키기 위하여, 상기 컴퓨터의 프로세서(CPU)가 상기 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, Ruby, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 상기 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 컴퓨터의 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.
상기 저장되는 매체는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상기 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 상기 프로그램은 상기 컴퓨터가 접속할 수 있는 다양한 서버 상의 다양한 기록매체 또는 사용자의 상기 컴퓨터상의 다양한 기록매체에 저장될 수 있다. 또한, 상기 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
10 : 의뢰자
20 : 서비스 제공 업체
30 : 대중
32 : 작업자
34 : 검수자
400 : 작업 결과 정확도 추정 및 관리 장치
410 : 통신모듈
420 : 메모리
430 : 프로세서

Claims (10)

  1. 컴퓨터에 의해 수행되는 방법으로서,
    크라우드소싱 기반 프로젝트(이하, 프로젝트)의 복수의 작업을 복수의 작업자에게 배정하여 작업 수행을 요청하는 단계;
    상기 복수의 작업자로부터 복수의 작업 결과를 입력받는 단계;
    상기 복수의 작업 결과를 복수의 검수자에게 배정하여 검수 수행을 요청하는 단계;
    상기 복수의 검수자로부터 상기 복수의 작업 결과에 대한 복수의 검수 결과로 검수 통과 또는 반려를 입력받는 단계;
    복수의 상기 검수 결과가 상기 검수 통과로 입력된 작업 결과(이하, "검수 통과된 작업 결과")의 정확도를 추정하는 단계; 및
    상기 추정 결과에 따라 상기 복수의 검수 통과된 작업 결과의 상기 정확도를 관리하는 단계를 포함하고,
    상기 복수의 검수 통과된 작업 결과의 정확도를 추정하는 단계는,
    사전 결정된 제1 단위 건을 추정 구간(interval)으로 설정하는 단계와,
    상기 추정 구간에 상응하는 검수 통과된 작업 결과가 발생할 때마다, 상기 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도를 소정의 신뢰 수준(confidence level)으로 추정하는 단계를 포함하고,
    상기 복수의 검수 통과된 작업 결과의 상기 정확도를 관리하는 단계는,
    상기 제1 정확도의 신뢰 구간(confidence interval)의 신뢰 하한 값(lower confidence limit)이 기준 정확도 미만이면,
    상기 추정 구간에 상응하는 검수 통과된 작업 결과를 복수의 사전 결정된 제2 단위 건의 세부 추정 구간으로 분할하는 단계와,
    상기 복수의 세부 추정 구간에 상응하는 검수 통과된 작업 결과의 제2 정확도를 상기 신뢰 수준으로 추정하는 단계와,
    상기 복수의 세부 추정 구간 중 상기 제2 정확도의 신뢰 구간의 신뢰 하한 값이 상기 기준 정확도 미만인 세부 추정 구간(이하, "미달 세부 추정 구간")을 식별하는 단계와,
    상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재검수 또는 재작업 수행을 요청하는 단계를 포함하는,
    크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법.
  2. 제1항에 있어서,
    상기 복수의 검수 통과된 작업 결과의 정확도를 추정하는 단계는,
    상기 제1 정확도의 신뢰 구간의 신뢰 하한 값이 상기 기준 정확도보다 크고, 상기 제1 정확도의 신뢰 구간의 신뢰 하한 값과 상기 기준 정확도 간의 편차가 사전 결정된 값 이상이면, 상기 제1 단위 건보다 큰 사전 결정된 제3 단위 건을 상기 추정 구간으로 갱신하여 설정하는 단계를 더 포함하는,
    크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법.
  3. 제1항에 있어서,
    상기 복수의 검수 통과된 작업 결과의 정확도를 추정하는 단계는,
    상기 제1 정확도의 신뢰 구간의 신뢰 하한 값이 상기 기준 정확도보다 작으면, 상기 제1 단위 건보다 작은 사전 결정된 제4 단위 건을 상기 추정 구간으로 갱신하여 설정하는 단계를 더 포함하는,
    크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법.
  4. 제1항에 있어서,
    상기 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도를 소정의 신뢰 수준으로 추정하는 단계는,
    상기 추정 구간에 상응하는 검수 통과된 작업 결과 중 n건의(단, n은 1이상의 자연수) 검수 통과된 작업 결과를 샘플링하는 단계와,
    상기 n건의 샘플링한 검수 통과된 작업 결과에 대해서 상기 복수의 2차 검수자에게 정확 여부 판정을 요청하는 단계와,
    상기 복수의 2차 검수자로부터 상기 n건의 샘플링한 검수 통과된 작업 결과에 대한 판정 결과로 정확 또는 부정확을 입력받는 단계와,
    상기 판정 결과로 상기 정확을 입력받은 빈도에 기초하여 상기 n건의 샘플링한 검수 통과된 작업 결과의 정확도를 측정하는 단계와,
    상기 n건의 샘플링한 검수 통과된 작업 결과의 정확도에 기초하여 상기 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도를 상기 신뢰 수준으로 추정하는 단계를 포함하는,
    크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법.
  5. 제4항에 있어서,
    상기 제1 정확도의 신뢰 구간의 신뢰 하한 값은,
    상기 n건의 샘플링한 검수 통과된 작업 결과의 정확도로부터 상기 신뢰 수준의 표본 오차를 감산한 값인,
    크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법.
  6. 제1항에 있어서,
    상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재검수 또는 재작업 수행을 요청하는 단계는,
    상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재검수 수행을 요청하고,
    상기 복수의 검수 통과된 작업 결과의 상기 정확도를 관리하는 단계는,
    상기 복수의 2차 검수자로부터 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대한 검수 결과 및 반려 사유를 입력받는 단계를 포함하는,
    크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법.
  7. 제1항에 있어서,
    상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재검수 또는 재작업 수행을 요청하는 단계는,
    상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재작업 수행을 요청하고,
    상기 복수의 검수 통과된 작업 결과의 상기 정확도를 관리하는 단계는,
    상기 복수의 2차 검수자로부터 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대한 재작업 결과를 입력받는 단계를 포함하는,
    크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법.
  8. 제1항에 있어서,
    상기 복수의 검수 통과된 작업 결과의 상기 정확도를 관리하는 단계는,
    상기 재검수 또는 재작업 수행 이후,
    상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과의 제3 정확도를 상기 신뢰 수준으로 다시 추정하는 단계와,
    상기 제3 정확도의 신뢰 구간의 신뢰 하한 값이 상기 기준 정확도 미만이면, 상기 미달 세부 추정 구간에 상응하는 검수 통과된 작업 결과에 대해서 복수의 2차 검수자에게 재검수 또는 재작업 수행을 다시 요청하는 단계를 포함하는,
    크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법.
  9. 제1항에 있어서,
    상기 프로젝트가 종료되면, 복수의 추정 구간에 상응하는 검수 통과된 작업 결과의 제1 정확도에 기초하여 상기 프로젝트의 작업 결과의 정확도를 추정하는 단계를 더 포함하는,
    크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법.
  10. 컴퓨터와 결합되어, 제1항 내지 제9항 중 어느 하나의 항의 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법을 실행시키기 위하여 컴퓨터 판독가능 기록매체에 저장된 컴퓨터 프로그램.
KR1020200054502A 2020-05-07 2020-05-07 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법 KR102159574B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200054502A KR102159574B1 (ko) 2020-05-07 2020-05-07 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200054502A KR102159574B1 (ko) 2020-05-07 2020-05-07 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법

Publications (1)

Publication Number Publication Date
KR102159574B1 true KR102159574B1 (ko) 2020-09-24

Family

ID=72706478

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200054502A KR102159574B1 (ko) 2020-05-07 2020-05-07 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법

Country Status (1)

Country Link
KR (1) KR102159574B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102333644B1 (ko) * 2020-12-11 2021-12-02 셀렉트스타 주식회사 크라우드소싱을 통하여 수집된 작업물을 처리하는 작업자의 신뢰도정보를 반영하여 작업결과를 도출하는 방법, 시스템, 및 컴퓨터-판독가능 매체

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140095956A (ko) 2013-01-25 2014-08-04 한국전자통신연구원 크라우드 소싱기반 영상 지식 콘텐츠 생성 시스템 및 방법
KR20170050617A (ko) * 2015-10-30 2017-05-11 (주)유미테크 크라우드 소싱 기반 지식 검증 시스템
KR101887415B1 (ko) * 2017-11-21 2018-08-10 주식회사 크라우드웍스 데이터 라벨링 작업 검수방법 및 프로그램

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140095956A (ko) 2013-01-25 2014-08-04 한국전자통신연구원 크라우드 소싱기반 영상 지식 콘텐츠 생성 시스템 및 방법
KR20170050617A (ko) * 2015-10-30 2017-05-11 (주)유미테크 크라우드 소싱 기반 지식 검증 시스템
KR101887415B1 (ko) * 2017-11-21 2018-08-10 주식회사 크라우드웍스 데이터 라벨링 작업 검수방법 및 프로그램

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102333644B1 (ko) * 2020-12-11 2021-12-02 셀렉트스타 주식회사 크라우드소싱을 통하여 수집된 작업물을 처리하는 작업자의 신뢰도정보를 반영하여 작업결과를 도출하는 방법, 시스템, 및 컴퓨터-판독가능 매체
WO2022124501A1 (ko) * 2020-12-11 2022-06-16 셀렉트스타 주식회사 크라우드소싱을 통하여 수집된 작업물을 처리하는 작업자의 신뢰도정보를 반영하여 작업결과를 도출하는 방법, 시스템, 및 컴퓨터-판독가능 매체

Similar Documents

Publication Publication Date Title
KR102155790B1 (ko) 평균 반려율을 이용한 작업자 능숙도 측정 방법 및 장치
KR102156582B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 성실 작업자 선별 및 검수 우선순위 부여 방법
KR102164844B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 단위 난이도를 활용한 작업자 평가 방법
KR102244697B1 (ko) 인공지능 학습 데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업자 성향을 고려한 프로젝트 큐레이션 방법
CN110688536A (zh) 一种标签预测方法、装置、设备和存储介质
US20220327452A1 (en) Method for automatically updating unit cost of inspection by using comparison between inspection time and work time of crowdsourcing-based project for generating artificial intelligence training data
KR102195629B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트에서의 작업 능력 지수에 기반한 작업자 선정 방법
CN115422028A (zh) 标签画像体系的可信度评估方法、装置、电子设备及介质
KR102159574B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 결과의 정확도 추정 및 관리 방법
KR102164769B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 검수 패스를 활용한 능숙도 측정 방법
KR102232880B1 (ko) 인공지능 학습데이터 생성을 위한 이미지 또는 동영상 수집을 위한 크라우드소싱 기반 프로젝트의 검수자 평가 방법
KR102159578B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 기능요소에 따른 검수자의 검수 권한 부여 방법
CN109582578A (zh) 软件测试用例的系统、方法、计算机可读介质及电子设备
KR102205811B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 기능요소별 작업시간을 활용한 최소 작업시간 설정 방법
KR102195608B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 오브젝트 반려율을 활용한 자동 반려 방법
KR102205810B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 재작업 결과의 자동 반려 방법
US20220327450A1 (en) Method for increasing or decreasing number of workers and inspectors in crowdsourcing-based project for creating artificial intelligence learning data
KR102155746B1 (ko) 검수자 간 샘플 검수를 통한 검수자 검증 방법
KR102183812B1 (ko) 인공지능 학습 데이터 생성을 위한 크라우드소싱 기반 프로젝트의 검증용 작업 결과를 이용한 검수자별 시급제 기반 검수 비용 지급 방법
KR102195956B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 난이도에 따른 최대 작업 제한 건수 갱신 방법
KR102155747B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 반려된 오브젝트 수에 기반하여 최소 재작업 및 재검수 시간을 설정하는 방법
KR102164837B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 비용 효율적인 검수 품질 관리 방법
KR102156586B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업 및 검수의 순차적인 배정 방법
KR102195606B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업자의 선택적인 셀프 체크를 통한 신뢰도 향상 방법
KR102155879B1 (ko) 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 작업자의 피드백을 활용한 검수 품질 관리 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant