KR20230039487A - 통합 학습용 데이터 세트를 이용한 딥러닝 인공지능 자동 생성 방법 및 이를 위한 장치 - Google Patents

통합 학습용 데이터 세트를 이용한 딥러닝 인공지능 자동 생성 방법 및 이를 위한 장치 Download PDF

Info

Publication number
KR20230039487A
KR20230039487A KR1020220003708A KR20220003708A KR20230039487A KR 20230039487 A KR20230039487 A KR 20230039487A KR 1020220003708 A KR1020220003708 A KR 1020220003708A KR 20220003708 A KR20220003708 A KR 20220003708A KR 20230039487 A KR20230039487 A KR 20230039487A
Authority
KR
South Korea
Prior art keywords
data
labeling
auto
learning
automatic generation
Prior art date
Application number
KR1020220003708A
Other languages
English (en)
Inventor
여승기
Original Assignee
주식회사 디에스랩글로벌
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 디에스랩글로벌 filed Critical 주식회사 디에스랩글로벌
Priority to KR1020220003708A priority Critical patent/KR20230039487A/ko
Publication of KR20230039487A publication Critical patent/KR20230039487A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/10Interfaces, programming languages or software development kits, e.g. for simulating neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)

Abstract

본 발명의 일 실시예에 따른 AI(Artificial Intelligence) 자동 생성 방법은, 복수개의 학습용 데이터 세트들을 구성하고 상기 복수개의 학습용 데이터들 중에서 선택되는 2이상의 학습용 데이터들을 결합하여 통합 학습용 데이터 세트를 구성하는, 데이터 세팅 단계, 상기 통합 학습용 데이터 세트에 포함된 학습용 데이터에 대한 라벨링을 수행하는, 데이터 라벨링 단계;, 라벨링된 학습용 데이터 세트를 학습하여 AI를 모델링하는, AI 모델링 단계; 및 모델링된 AI를 배포하는, AI 배포 단계를 포함한다.

Description

통합 학습용 데이터 세트를 이용한 딥러닝 인공지능 자동 생성 방법 및 이를 위한 장치{METHOD FOR AUTOMATICALLY GENERATING DEEP LEARNING ARTIFICIAL INTELLIGENCE USING DATA SET FOR INTEGRATED LEARNING AND APPARATUS TEHEREFOR}
본 명세서는 딥러닝 기반의 인공지능(Artificial Intelligence; AI) 자동 생성 방법 및 인공지능 정확도 개선을 위한 MLOps 장치를 제안한다.
최근 인공지능(Artificial Intelligence, AI) 기술이 급격히 발전하고 있으며, 인공지능 기술을 이용한 서비스가 다양한 분야에서 광범위하게 제공되고 있다. 특히, 딥러닝(deep learning) 기술이 크게 주목받고 있으며, 데이터 분석, 영상 인식, 자연어 처리 등과 같은 다양한 분야에서 큰 성과를 보이고 있다. 딥러닝은 머신러닝(machine learning)의 한 분야로 데이터를 컴퓨터가 처리 가능한 형태인 벡터나 그래프 등으로 표현하고 이를 학습하는 AI를 구축하는 기술이다. 즉, 얼굴이나 표정을 인식하는 등의 특정 학습 목표에 대하여, 딥러닝은 학습을 위한 더 나은 표현 방법과 효율적인 AI 구축을 목적으로 한다. 딥러닝의 표현 방법들 중 다수는 신경 과학에서 영감을 얻었으며, 신경 시스템의 정보 처리나 통신 패턴에 기반을 두고 있다.
그러나 이러한 인공지능의 개발은 알(R) 언어, 파이썬(Python) 언어 기반으로 진행되고, 기술적 전문도 및 난이도가 높아 전문가를 통해서만 폐쇄적으로 진행되어 왔다. 따라서, 비전문가가 자신이 원하는 기능으로 동작하는 인공지능을 개발하는 것은 불가능하였다. 최근에는, 오픈소스 기반 딥러닝 기법의 알고리즘의 개발이 증가하고 있는 추세이나, 여전히 비전문가가 다루기에는 높은 수준의 기술 숙련도를 요구하고 있어 진입 장벽이 매우 높은 실정이다.
따라서, 본 명세서에서는 상술한 종래의 인공지능 개발의 문제점을 해결하고자, 비전문가도 쉽게 자신이 원하는 기능을 구현/수행하는 인공지능 자동 생성 플랫폼을 제안하고자 한다.
본 발명의 일 실시예에 따른 AI(Artificial Intelligence) 자동 생성 방법은, 복수개의 학습용 데이터 세트들을 구성하고 상기 복수개의 학습용 데이터들 중에서 선택되는 2 이상의 학습용 데이터들을 결합하여 통합 학습용 데이터 세트를 구성하는, 데이터 세팅 단계, 상기 통합 학습용 데이터 세트에 포함된 학습용 데이터에 대한 라벨링을 수행하는, 데이터 라벨링 단계;, 라벨링된 학습용 데이터 세트를 학습하여 AI를 모델링하는, AI 모델링 단계; 및 모델링된 AI를 배포하는, AI 배포 단계를 포함한다.
본 발명의 일 실시예에 따르면, 인공지능을 생성하는 데 있어 높은 기술 숙련도를 요구하지 않으므로, 비전문가도 쉽게 원하는 기능/목적이 구현된 인공지능을 개발할 수 있다는 효과가 있다.
또한, 본 발명의 일 실시예에 따르면, 인공지능 기반의 오토 라벨링 기능을 제공하므로, 기존의 수동 라벨링에 소요되었던 인력 및 시간 낭비를 감축할 수 있다는 효과가 있다.
또한, 본 발명의 일 실시예에 따르면, 인공지능 개발부터 배포까지 쉽게 가능하므로, 비전문가를 위한 인공지능 개발 환경이 제공된다는 효과가 있다.
또한, 본 발명의 일 실시예에 따르면, AI 마켓을 통해 다른 사용자가 개발한 인공지능의 구매가 가능하므로, 비전문가도 쉽게 인공지능의 사용/활용이 가능하다는 효과가 있다. 나아가, 이를 통해 인공지능 활용 범위가 다양한 분야에 확대 적용되어, 다양한 분야의 기술/산업 발전을 제고한다는 효과가 있다.
본 발명의 효과는 상술한 효과에 제한되지 않으며, 각 실시예별 다양한 효과는 이하에서 상세히 후술하기로 한다.
도 1은 본 발명의 일 실시예에 따른 딥러닝 기반의 AI 자동 생성 방법을 예시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 딥러닝 기반의 AI 자동 생성 장치의 블록도이다.
도 3은 본 발명의 일 실시예에 따른 데이터 세팅 모듈이 제공하는 데이터 세팅 기능 제공 화면을 예시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 데이터 라벨링 모듈의 데이터 라벨링 방법을 예시한 순서도이다.
도 5 내지 8은 본 발명의 일 실시예에 따른 수동 라벨링 작업 툴을 예시한 도면이다.
도 9는 본 발명의 일 실시예에 따라 오토 라벨링 AI 후보 중 최적의 오토 라벨링 AI를 선택하는 화면을 예시한 도면이다.
도 10은 본 발명의 일 실시예에 따른 오토 라벨링 검수 화면을 예시한 도면이다.
도 11은 본 발명의 일 실시예에 따른 AI 모델링 모듈의 AI 모델링 방법을 예시한 순서도이다.
도 12는 본 발명의 일 실시예에 따른 AI 후보 각각에 대한 성능 평가 결과 제공 화면을 예시한 도면이다.
도 13은 본 발명의 일 실시예에 따라 생성/모델링된 AI의 분석 결과 제공 화면을 예시한 도면이다.
도 14는 본 발명의 일 실시예에 따른 AI 배포 모듈이 제공하는 AI 마켓 화면을 예시한다.
이하 설명하는 기술은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 이하 설명하는 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 이하 설명하는 기술의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 해당 구성요소들은 상기 용어들에 의해 한정되지는 않으며, 단지 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 이하 설명하는 기술의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다. 예를 들어, 'A 및/또는 B'는 'A 또는 B 중 적어도 하나'의 의미로 해석될 수 있다. 또한, '/'는 '및' 또는 '또는'으로 해석될 수 있다.
본 명세서에서 사용되는 용어에서 단수의 표현은 문맥상 명백하게 다르게 해석되지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함한다" 등의 용어는 설시된 특징, 개수, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 의미하는 것이지, 하나 또는 그 이상의 다른 특징들이나 개수, 단계 동작 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 배제하지 않는 것으로 이해되어야 한다.
도면에 대한 상세한 설명을 하기에 앞서, 본 명세서에서의 구성부들에 대한 구분은 각 구성부가 담당하는 주기능 별로 구분한 것에 불과함을 명확히 하고자 한다. 즉, 이하에서 설명할 2개 이상의 구성부가 하나의 구성부로 합쳐지거나 또는 하나의 구성부가 보다 세분화된 기능별로 2개 이상으로 분화되어 구비될 수도 있다. 그리고 이하에서 설명할 구성부 각각은 자신이 담당하는 주기능 이외에도 다른 구성부가 담당하는 기능 중 일부 또는 전부의 기능을 추가적으로 수행할 수도 있으며, 구성부 각각이 담당하는 주기능 중 일부 기능이 다른 구성부에 의해 전담되어 수행될 수도 있음은 물론이다.
또, 방법 또는 동작 방법을 수행함에 있어서, 상기 방법을 이루는 각 과정들은 문맥상 명백하게 특정 순서를 기재하지 않은 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 과정들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 명세서는, 데이터 준비 단계부터, 라벨링, AI 개발, 배포, 유지, 판매 및 보수 등에 이르기까지 인공지능 개발 및 배포와 관련된 모든 과정이 자동화된 '딥러닝 기반의 인공지능 자동 생성 플랫폼(이하, 'AI 개발 자동화 플랫폼'이라 지칭)'을 제안하고자 함이 목적이다. 이러한 '딥러닝 기반의 인공지능 자동 생성 플랫폼'은 '딥러닝 기반의 Data-Centric MLOps 솔루션'이라 지칭될 수 있다. 본 명세서에서 제안되는 AI 개발 자동화 플랫폼은 모든 과정이 AI를 기반으로 자동화되기 때문에, AI 개발 자동화 플랫폼을 통해 비전문가/비숙련자도 쉽게 원하는 기능이 구현된 AI를 쉽게 개발 및 배포할 수 있다는 효과가 있다. AI 개발 자동화 플랫폼은 어플리케이션/프로그램과 같은 소프트웨어 형식으로 구현되어 배포되거나 웹 페이지로 구현되어 사용자에 서비스될 수 있다.
이하에서는 이러한 AI 개발 자동화 플랫폼에 대하여 각 도면을 참조하여 구체적으로 살펴본다.
도 1은 본 발명의 일 실시예에 따른 딥러닝 기반의 AI 자동 생성 방법을 예시한 도면이며, 도 2는 본 발명의 일 실시예에 따른 딥러닝 기반의 AI 자동 생성 장치의 블록도이다.
본 명세서에서 제안되는 AI 개발 자동화 플랫폼은 딥러닝 기반의 AI 자동 생성 방법이 구현된 서비스 플랫폼이며, 딥러닝 기반의 AI 자동 생성 방법은 딥러닝 기반의 AI 자동 생성 장치(200)에 의해 구현/수행될 수 있다.
딥러닝 기반의 AI 자동 생성 방법은 도 1에 도시한 바와 같이 크게 4가지 단계(S110~S140)로 구성될 수 있으며, 각 단계(S110~S140)는 도 2에 도시한 바와 같이 각 모듈(210~240)에 의해 구현/수행될 수 있다. 보다 상세하게는, 딥러닝 기반의 AI 자동 생성 방법은 데이터 세팅 단계(S110), 데이터 라벨링 단계(S120), AI 모델링 단계(S130) 및/또는 AI 배포 단계(S140)를 포함할 수 있으며, 데이터 세팅 단계(S110)는 데이터 세팅 모듈(210)에 의해, 데이터 라벨링 단계(S120)는 데이터 라벨링 모듈(220)에 의해, AI 모델링 단계(S130)는 AI 모델링 모듈(230)에 의해, AI 배포 단계(S140)는 AI 배포 모듈(140)에 의해 각각 수행될 수 있다.
데이터 세팅 단계(S110)는, 데이터 세팅 모듈(210)이 AI의 학습용 데이터 세트를 구성하는 단계에 해당한다. 데이터 세팅 모듈(210)은 사용자가 쉽게 학습용 데이터 세트를 구성할 수 있도록 다양한 기능을 제공할 수 있으며, 사용자는 이러한 기능을 활용하여 학습용 데이터 세트를 간편하게 구성할 수 있다. 예를 들어, 데이터 세팅 모듈(210)은 기존 데이터 불러오기 기능, 공공 데이터 활용 기능, 학습 데이터 결합 기능 등을 제공함으로써 사용자가 쉽게 학습용 데이터 세트를 구축할 수 있는 환경을 제공한다. 데이터 세팅 단계(S110)에 관한 보다 상세한 설명은 도 3을 참조하여 이하에서 상세히 후술하기로 한다.
데이터 라벨링 단계(S120)는, 데이터 라벨링 모듈(220)이 데이터(예를 들어, S110 단계에서 구축된 학습용 데이터 세트)를 라벨링하는 단계에 해당한다. 여기서, 데이터 라벨링이란, AI가 스스로 학습할 수 있는 형태로 데이터를 분류하고 가공하는 작업을 의미한다. 정확한 라벨링 작업이 진행될수록 데이터의 품질이 향상되어 보다 성능 높은 AI의 모델링이 가능하므로, 정확도 높은 라벨링 작업은 매우 중요하다. 본 명세서에서 데이터 라벨링 단계(S120)는 크게 수동 라벨링 단계와 오토(Auto) 라벨링 단계로 구분되는데, 이에 대한 구체적인 설명은 도 4 내지 10을 참조하여 이하에서 상세히 후술하기로 한다.
AI 모델링 단계(S130)는, AI 모델링 모듈(230)이 입력받은 데이터에 적합한 AI를 자동으로 생성하는 단계에 해당한다. 특히, AI 모델링 단계(S130)는 사용자가 생성하고자 하는 AI의 모델 종류(예를 들어, 정형 데이터 자동 분류, 정형 카테고리 분류, 정형 연속 값 분류, 자연어 처리, 이미지 분류, 추천 시스템 등)를 입력/선택받고, 입력/선택된 AI 모델 종류에 따라 데이터를 학습하여, AI를 자동 생성할 수 있다. AI 모델링 단계(S130)에 대한 구체적인 설명은 도 11 내지 13을 참조하여 이하에서 상세히 후술하기로 한다.
AI 배포 단계(S140)는, AI 배포 모듈(240)이 AI 모델링 단계(S130)에서 자동 모델링된/생성된 AI를 배포하는 단계에 해당한다. 특히, AI 배포 단계(S140)는, 생성된 AI가 최적화된 환경에서 높은 성능으로 구동될 수 있도록, 재학습을 통한 인공지능 고도화, 인공지능 운영에 최적화된 서버 구성, 운영 환경 실시간 모니터링, 다양한 프로그램 언어를 지원하는 API(Application Program Interface)를 통한 AI 배포 솔루션을 제공할 수 있다. 나아가, AI 배포 단계(S140)는, 생성된 AI를 타사용자에게 판매할 수 있는 AI 마켓 기능도 제공할 수 있다. AI 배포 단계(S140)에 대한 구체적인 설명은 도 14를 참조하여 이하에서 상세히 후술하기로 한다.
도 2에서 제안된 딥러닝 기반의 AI 자동 생성 장치는, 예를 들어 사용자 장치(예를 들어, 단말, PC, 노트북, 태블릿 등), 웹 서버 및/또는 어플리케이션 서버에 해당할 수 있으며, 적어도 하나의 하드웨어/소프트웨어를 통해 구현될 수 있다.
하드웨어를 통해 구현되는 경우, 딥러닝 기반의 AI 자동 생성 장치는, 프로세서, 메모리, 디스플레이부, 통신부, 및/또는 사용자 입력부를 포함하여 구성될 수 있다.
프로세서는, CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), AP(Application Processor), AP(Application Processor) 또는 본 발명의 기술 분야에 잘 알려진 임의의 형태의 프로세서에 해당할 수 있다. 프로세서는, 딥러닝 기반의 AI 자동 생성 장치에 포함된 적어도 하나의 구성을 제어하여, 본 명세서에서 제안된 실시예를 구현할 수 있다.
메모리부는, 다양한 디지털 데이터를 저장하는 저장 공간으로, 예를 들어 플래시 메모리, HDD(Hard Disk Drive), SSD(Solid State Drive), 클라우드 등이 이에 해당할 수 있다.
디스플레이부는 적어도 하나의 이미지 출력 수단을 포함하여, 다양한 비주얼 오브젝트를 출력할 수 있다.
통신부는 적어도 하나의 유/무선 통신 프로토콜을 구비하여, 외부 장치/서버와 통신을 수행할 수 있다.
사용자 입력부는 적어도 하나의 센서를 이용하여 사용자 입력을 센싱할 수 있다. 예를 들어, 사용자 입력부는, 중력(gravity) 센서, 지자기 센서, 모션 센서, 자이로스코프 센서, 가속도 센서, 적외선 센서, 기울임(inclination) 센서, 밝기 센서, 고도 센서, 뎁스 센서, 압력 센서, 밴딩 센서, 오디오 센서, 비디오 센서, GPS(Global Positioning System) 센서, 터치 센서 및 그립 센서 등의 다양한 센싱 수단 중 적어도 어느 하나를 포함하여 딥러닝 기반의 AI 자동 생성 장치에 대한 사용자 입력을 센싱할 수 있다.
도 3은 본 발명의 일 실시예에 따른 데이터 세팅 모듈이 제공하는 데이터 세팅 기능 제공 화면을 예시한 도면이다.
도 3을 참조하면, 데이터 세팅 모듈은 학습용 데이터 세트를 구성하기 위한 기존 데이터 업로드 기능(310)을 제공할 수 있다. 사용자는 해당 기능(310)을 통해 AI 생성에 기반이 되는 데이터 세트(특히, 학습용 데이터 세트)를 손쉽게 구축할 수 있다. 데이터 세팅 모듈은 다양한 파일 형식(예를 들어, CSV, ZIP, MP4, MOV, PNG, JPG, JPEG, GIF 등)을 지원할 수 있으며, 사용자는 지원 파일 형식에 해당하는 데이터를 업로드함으로써 학습용 데이터 세트를 구축하여 AI 자동 생성의 근간을 마련할 수 있다.
나아가, 데이터 세팅 모듈은 데이트 베이스 관리 시스템과 연동하여, 해당 시스템으로부터 데이터를 불러와 학습 데이터 세트를 구성할 수도 있다. 예를 들어, 데이터 세팅 모듈은 MySQL, Postgre SQL, Oracle, MSSQL 등과 같은 데이터 베이스 관리 시스템과의 연동을 지원하여, 이들로부터 데이터를 불러와 학습 데이터 세트를 구성할 수도 있다.
각 데이터 종류에 따라 자동 생성되는 AI는 표 1과 같을 수 있다.
Figure pat00001
본 도면에는 도시하지 않았으나, 데이터 세팅 모듈은 공중에 공개되어 있는 공공 데이터를 학습 데이터 세트 구성에 활용 가능한 데이터 샘플로서 사용자에게 제공할 수 있으며, 사용자는 이를 이용하여 보다 풍부한 학습 데이터 세트를 구성할 수도 있다. 공공 데이터는 주기적으로/실시간으로 업데이트될 수 있으며, 사용자는 공공 데이터를 활용하여 학습 데이터 세트를 더욱 풍부하고 다양하게 구성함으로써, 더 뛰어난 성능의 AI 자동 생성의 근간을 마련할 수 있다.
본 실시예에 따라 구성된 학습 데이터 세트는 본 도면에 예시된 바와 같이 리스트-업(320)되어 데이터 세팅 기능 제공 화면을 통해 사용자에 제공될 수 있다. 사용자는 리스트-업된 학습 데이터 세트(320) 중 적어도 하나의 학습 데이터 세트를 선택하여 AI를 학습시키는 데 활용할 수 있다.
나아가, 데이터 세팅 모듈은 학습 데이터 세트간 결합 기능도 추가로 제공할 수 있다. 이 기능은 주로, AI에 학습시키고자 하는 학습 데이터 세트가 복수개 존재하는 경우, 복수의 학습 데이터 세트를 하나의 학습 데이터 세트로 결합/통합시키기 위한 목적으로 사용될 수 있다. 이 경우, 사용자는 복수개의 학습 데이터 세트를 하나의 학습 데이터 세트로 결합하여 AI를 학습시킬 수 있다.
결합/통합은, 복수의 학습 데이터 세트간 공통되는 항목을 중심으로 데이터를 결합/통합하는 방식으로 수행될 수 있다. 예를 들어, 하기와 같은 데이터 항목이 포함된 제1 및 제2 학습 데이터 세트를 결합하는 경우를 가정해볼 수 있다.
- 제1 학습 데이터 세트: ID(1), 성별(여), 지역(부산)
- 제2 학습 데이터 세트: ID(1), 구매 상품(청바지)
제1 및 제2 학습 데이터 세트에서 공통되는 데이터 항목은 ID(1)이므로, ID(1)을 중심으로 데이터가 결합/통합될 수 있으며, 결합/통합 결과는 다음과 같다.
- 제1 및 제2 학습 데이터 결합 세트: ID(1), 성별(여), 지역(부산), 구매 상품(청바지)
이렇듯 학습 데이터 세트간 결합이 가능하므로, 보다 유연하고 자유로운 학습 데이터 세트 구성 환경이 조성되어, 사용자 의도에 보다 부합하면서도 성능이 좋은 AI 자동 생성의 근간이 마련된다는 효과가 있다.
이러한 학습 데이터 세트의 결합은 텍스트 기반의 AI 자동 생성에 한해 적용될 수 있다.
도 4는 본 발명의 일 실시예에 따른 데이터 라벨링 모듈의 데이터 라벨링 방법을 예시한 순서도이다.
본 순서도에서 적어도 하나의 단계는 실시예에 따라 제외/생략되거나, 새로운 단계가 부가될 수 있으며, 순서 역시 변경될 수 있음은 물론이다. 본 순서도는, 이미지 기반의 AI를 생성하기 위한 데이터 라벨링 동작을 기준으로 설명하나, 이에 한정되는 것은 아니며 텍스트 기반의 AI를 생성하기 위한 데이터 라벨링 동작에도 적용될 수 있음은 물론이다.
도 4를 참조하면, 우선 데이터 라벨링 모듈은 사용자 입력에 기초하여 수동 라벨링 동작을 수행할 수 있다(S401). 이미지 기반의 AI 생성을 위한 수동 라벨링 동작은, 사용자 입력에 기초하여 이미지 데이터에서 인식 대상 이미지 객체를 선택하고, 선택된 이미지 객체에 대한 라벨을 할당하는 방식으로 수행될 수 있다. 여기서, 이미지 데이터는 데이터 세팅 모듈에 의해 사전 세팅/구성된 학습 데이터 세트에 포함되어 있는 이미지 데이터를 의미할 수 있다.
데이터 라벨링 모듈은 사용자가 보다 쉽고 간편하게 수동 라벨링을 수행할 수 있도록 수동 라벨링 작업 툴을 제공할 수 있으며, 사용자는 이를 이용하여 보다 쉽고 간편하게 수동 라벨링 작업을 수행할 수 있다. 수동 라벨링 작업 툴은 이미지 객체 선택 방식에 따라 바운딩 박스 방식, 폴리라인 방식, 폴리곤 방식, 매직툴 방식의 수동 라벨링 기능을 제공할 수 있다.
도 5 내지 8은 본 발명의 일 실시예에 따른 수동 라벨링 작업 툴을 예시한 도면이다. 보다 상세하게는, 도 5는 본 발명의 일 실시예에 따른 바운딩 박스 방식의 수동 라벨링 기능을 제공 중인 수동 라벨링 작업 툴 실행 화면, 도 6은 본 발명의 일 실시예에 따른 폴리라인 방식의 수동 라벨링 기능을 제공 중인 수동 라벨링 작업 툴 실행 화면, 도 7은 본 발명의 일 실시예에 따른 폴리곤 방식의 수동 라벨링 기능을 제공 중인 수동 라벨링 작업 툴 실행 화면, 도 8은 본 발명의 일 실시예에 따른 매직툴 방식의 수동 라벨링 기능을 제공 중인 수동 라벨링 작업 툴 실행 화면을 각각 예시한다.
도 5를 참조하면, 바운딩 박스 방식은 이미지 객체(510)를 사각형/박스 형태로 선택/구획하여 수동 라벨링을 수행하는 방식으로, 수동 라벨링 작업 툴은 사각형/박스 형태의 제1 이미지 객체 선택 인디케이터(530)를 제공할 수 있다. 사용자는 이러한 제1 이미지 객체 선택 인디케이터(530)를 이용하여 AI를 통해 인식하고자 하는 이미지 객체(510)를 선택(또는 이미지 객체(510)의 영역을 구획)하고, 해당 객체(510)에 대한 라벨(520)을 부여할 수 있다. 예를 들어, 본 도면에 예시한 바와 같이, 사용자는 제1 이미지 객체 선택 인디케이터(530)를 이용하여 인식 객체인 자동차(510)를 사각형/박스 형태로 선택/구획하고, 'car'라는 라벨(520)을 할당함으로써 수동 라벨링을 수행할 수 있다. 이미지 데이터에 이미지 객체(510)가 복수개 포함되어 있는 경우, 복수의 이미지 객체(510) 전체에 대하여 바운딩 박스 방식의 수동 라벨링이 수행될 수 있다.
도 6을 참조하면, 폴리라인 방식은 시작점과 끝점이 불연속된 형태의 이미지 객체(610)에 대한 수동 라벨링을 수행하는 방식으로, 수동 라벨링 작업 툴은 불연속된 형태의 이미지 객체(610)를 선택하기 위한 제2 이미지 객체 선택 인디케이터(630)를 제공할 수 있다. 사용자는 이러한 제2 이미지 객체 선택 인디케이터(630)를 이용하여 인식하고자 하는 불연속 형태의 이미지 객체(610)를 선택(또는 이미지 객체(610)의 영역을 구획)하고, 해당 객체(610)에 대한 라벨(620)을 부여할 수 있다. 예를 들어, 본 도면에 예시한 바와 같이, 사용자는 제2 이미지 객체 선택 인디케이터(630)를 이용하여 인식 객체인 도로(610)를 불연속 형태로 선택/구획하고, 'road'라는 라벨(620)을 할당함으로써 수동 라벨링을 수행할 수 있다. 이미지 데이터에 이미지 객체(610)가 복수개 포함되어 있는 경우, 복수의 이미지 객체(610) 전체에 대하여 폴리라인 방식의 수동 라벨링이 수행될 수 있다.
도 7을 참조하면, 폴리곤 방식은 시작점과 끝점이 연속된 형태의 이미지 객체(710)에 대한 수동 라벨링을 수행하는 방식으로, 수동 라벨링 작업 툴은 연속된 형태의 이미지 객체(710)를 선택하기 위한 제3 이미지 객체 선택 인디케이터(730)를 제공할 수 있다. 사용자는 이러한 제3 이미지 객체 선택 인디케이터(730)를 이용하여 인식하고자 하는 연속 형태의 이미지 객체(710)를 선택(또는 이미지 객체(710)의 영역을 구획)하고, 해당 객체(710)에 대한 라벨(720)을 부여할 수 있다. 예를 들어, 본 도면에 예시한 바와 같이, 사용자는 제3 이미지 객체 선택 인디케이터(730)를 이용하여 인식 객체인 고양이(710)를 연속 형태로 선택/구획하고, 'cat'이라는 라벨(720)을 할당함으로써 수동 라벨링을 수행할 수 있다. 이미지 데이터에 이미지 객체(710)가 복수개 포함되어 있는 경우, 복수의 이미지 객체(710) 전체에 대하여 폴리곤 방식의 수동 라벨링이 수행될 수 있다.
도 8을 참조하면, 매직툴 방식은 박스 바운딩 방식과 폴리곤 방식이 결합된 방식으로, 이미지 객체 선택 인디케이터(840)는 매직툴 방식에 따라, 이미지 객체(810) 선택/구획은 폴리곤 방식에 따라 수행될 수 있다. 보다 상세하게는, 사용자는 사각/박스 형태의 제4 이미지 객체 선택 인디케이터(840)를 이용하여 이미지 객체(810)를 선택(또는 이미지 객체(810)의 영역을 구획)할 수 있으며, 제4 이미지 객체 선택 인디케이터(840)를 통해 구획/선택된 사각/박스 영역 내에 존재하는 폐곡선 형태의 이미지 객체(810)를 자동 선택/구획하여 라벨을 부여하는 방식에 해당한다. 예를 들어, 본 도면에 예시한 바와 같이, 사용자는 제4 이미지 객체 선택 인디케이터(840)를 이용하여 인식 객체인 강아지를 사각형/박스 형태로 선택/구획할 수 있다. 이 경우, 선택/구획된 영역 내의 이미지 객체인 강아지(810)의 경계선(820)이 폴리곤 방식으로 추출되어 이미지 객체(810)로 자동 선택/구획될 수 있으며, 해당 객체(810)에 대하여 'dog'라는 라벨(830)이 할당됨으로써 수동 라벨링이 수행될 수 있다.
4가지 방식의 수동 라벨링 방식에 대해 설명하였으나 본 발명은 이에 한정되는 것은 아니며, 다양한 형태의 수동 라벨링 방식이 적용될 수 있음은 물론이다.
다시 도 4를 참조하면, 다음으로 데이터 라벨링 모듈은 오토 라벨링 AI 후보를 적어도 하나 생성할 수 있다(S402). 여기서, 오토 라벨링은, 데이터 라벨링 동작이 오토 라벨링 AI에 의해 자동으로 수행되는 것을 의미한다. 데이터 라벨링 모듈은 수동 라벨링된 데이터/내용을 기초로, 이미지 데이터를 자동으로 라벨링하기 위한 AI 후보를 적어도 하나 생성할 수 있다. 예를 들어, 데이터 라벨링 모듈은 수동 라벨링된 데이터를 서로 다른 딥러닝 방식으로 학습하여 각 방식별로 AI 후보를 생성할 수 있다.
다음으로, 데이터 라벨링 모듈은 생성된 오토 라벨링 AI 후보 중 가장 성능이 뛰어난 최적의 오토 라벨링 AI를 선택할 수 있다(S403).
도 9는 본 발명의 일 실시예에 따라 오토 라벨링 AI 후보 중 최적의 오토 라벨링 AI를 선택하는 화면을 예시한 도면이다.
도 9에 예시한 바와 같이, 데이터 라벨링 모듈은 생성한 오토 라벨링 AI 후보를 이용하여 이미지 데이터에 대한 오토 라벨링 동작을 수행하고, 각 후보별 오토 라벨링한 결과(910, 920)를 사용자에게 제공할 수 있다. 사용자는 각 후보별 오토 라벨링한 결과(910, 920)를 검토하여, 이 중 오토 라벨링 정확도가 (가장) 높은 이미지 데이터(920)를 선택하는 입력을 수행할 수 있다. 데이터 라벨링 모듈은 가장 높은 비율로 선택된 오토 라벨링 AI 후보를 가장 성능이 뛰어난 최적의 오토 라벨링 AI로 보고 최종 오토 라벨링 AI로 선택하여, 오토 라벨링 AI 생성을 완료할 수 있다.
다시 도 4를 참조하면, 데이터 라벨링 모듈은 이렇게 생성된 오토 라벨링 AI를 이용하여 학습 데이터 세트 중 수동 라벨링된 이미지 데이터를 제외한 나머지 이미지 데이터에 대한 오토 라벨링을 수행할 수 있다.
이러한 AI 기반의 오토 레벨링 기능을 통해, 사용자는 모든 데이터에 대하여 일일이 수동 라벨링을 수행할 필요가 없어 작업량이 현저히 줄어들 뿐 아니라, 방대한 양의 데이터에 대한 라벨링이 가능하므로, 성능이 뛰어난 AI 자동 생성의 근간을 마련할 수 있다는 효과가 있다.
도 10은 본 발명의 일 실시예에 따른 오토 라벨링 검수 화면을 예시한 도면이다.
데이터에 대한 정확한 라벨링 작업은 AI의 성능에 직접적인 영향을 미치므로, 높은 정확도가 요구하는 작업이다. 따라서, 데이터 라벨링 정확도를 보다 더 향상시키기 위해, 데이터 라벨링 모듈은 오토 라벨링 AI가 오토 라벨링한 데이터에 대한 검수 기능을 실시예예 따라 추가로 제공할 수 있다.
예를 들어, 도 10에 예시한 바와 같이, 데이터 라벨링 모듈은 생성된 오토 라벨링 AI에 의해 오토 라벨링된 이미지 데이터(1020)를 사용자에게 제공할 수 있다. 사용자는 오토 라벨링된 이미지 데이터(1020)를 확인하여 라벨링이 의도한 바에 따라 적절히/정확하게 수행되었는지 검수할 수 있다. 검수 편의를 위해, 데이터 라벨링 모듈은 오토 라벨링된 이미지 데이터(1020)의 라벨링 결과(예를 들어, (검수) 통과(pass) 또는 (검수) 거절(reject))를 사용자로부터 입력받기 위한 GUI(Graphic User Interface)(1010)를 제공할 수 있다. 사용자는 오토 라벨링된 이미지 데이터(1020)를 확인하여 라벨링이 의도한 바에 따라 정확히 수행된 경우 통과를, 의도와 달리 부정확하게 수행된 경우 거절을 선택함으로써 검수를 수행할 수 있다. 사용자에 의해 거절된 데이터는, 폐기(discard)/삭제되거나, 앞서 상술한 수동 라벨링 방법에 의해 재라벨링될 수 있다.
검수가 완료되면, 데이터 라벨링 모듈은 폐기된 데이터를 제외한 나머지 통과된 데이터를 재학습하여 오토 라벨링 AI를 재생성/업데이트할 수 있다. 데이터 라벨링 모듈은, 앞서 상술한 검수 방식에 따라 재생성/업데이트된 오토 라벨링 AI에 대한 재검수 동작을 수행할 수 있다. 이렇듯 오토 라벨링 AI 검수 작업은 거절된 데이터가 기설정된 비율/개수 미만으로 감소할 때까지 반복적으로 수행될 수 있다.
이러한 검수 및 오토 라벨링 AI 재생성/업데이트의 반복 과정으로 최종 생성된 오토 라벨링 AI는, 폐기/삭제된 데이터에 대해서 오토 라벨링 및 검수 동작을 재수행할 수 있다.
앞서 데이터 라벨링 및 검수 실시예를 이미지 데이터 라벨링 및 검수 실시예를 중심으로 설명하였으나 본 발명이 이에 한정되는 것은 아니며, 텍스트 데이터 라벨링 및 검수 동작에도 적용될 수 있음은 물론이다.
예를 들어, 정형 데이터(예를 들어, 정형화 분류 데이터, 정형화 회귀(연속값) 데이터, 자연어 데이터 등의 텍스트 기반 데이터)에 대해서도 앞서 상술한 데이터 라벨링 동작이 수행될 수 있다. 이때, 정형 데이터에 대한 라벨링 동작은, 각 텍스트 데이터에 대한 결과 값을 라벨로 부여하는 방식으로 수행될 수 있다. 정형 데이터에 대한 라벨링 및 검수 동작 역시, 도 4 및 도 10에서 제안된 실시예에 따라 수행될 수 있으며, 중복되는 설명은 생략한다.
도 11은 본 발명의 일 실시예에 따른 AI 모델링 모듈의 AI 모델링 방법을 예시한 순서도이다.
본 순서도에서 적어도 하나의 단계는 실시예에 따라 제외/생략되거나, 새로운 단계가 부가될 수 있으며, 순서 역시 변경될 수 있음은 물론이다.
도 11을 참조하면, 우선 AI 모델링 모듈은 사용자로부터 AI가 학습할 데이터를 입력받을 수 있다(S1101). 사용자로부터 데이터를 입력받는 방식으로는, 앞서 도 3에서 상술한 바와 같이, 데이터 세팅 모듈이 학습용 데이터 세트를 구성하기 위하여 사용자로부터 데이터를 입력받는 방식이 동일하게 적용될 수 있다. 따라서, AI 모델링 모듈은, 사용자 입력에 기초하여 다양한 파일 형식의 데이터를 학습용 데이터로서 입력받을 수 있다. 그리고/또는, AI 모델링 모듈은 AI가 학습할 데이터로서, 앞서 데이터 라벨링 모듈에 의해 라벨링이 완료된 (학습) 데이터를 입력받을 수 있다.
다음으로, AI 모델링 모듈은 사용자로부터 사용자가 생성하고자 하는 AI 모델의 종류를 입력받을 수 있다(S1102).
예를 들어, AI 모델링 모듈은 사용자가 생성하고자 하는 AI 모델 종류로서, 정형 데이터 자동 분류 모델, 정형 카테고리 분류 모델, 정형 연속값 분류 모델, 자연어 처리 모델, 시계열 처리 모델, 추천 시스템 모델, 이미지 분류 모델 및 이미지 인식 모델 중 어느 하나를 입력받을 수 있다. 각 AI 모델의 기능에 대해 간략히 소개하면 다음과 같다:
- 정형 데이터 자동 분류 모델: CSV 형태의 테이블 구조에 입력된 데이터 세트를 기설정된 값으로 나누는 카테고리 분류와 숫자 형태의 연속값 분류로 나뉘며, 상황에 맞는 결과값을 예측하는 모델
- 정형 카테고리 분류 모델: 학점이나 Yes or No, 특정 브랜드와 같이 정해진 결과 값이나 비연속적인 값을 예측하는 모델
- 정형 연속 값 분류 모델: 숫자 형태의 연속적인 결과 값을 예측하는 모델로, 특정 분야에서의 리스크 등을 수치로 나타내거나, 특정 분야의 점수를 매기거나, 점수를 예측하는 등의 목적으로 사용 가능
- 자연어 처리 모델: 인간의 언어 형상을 컴퓨터가 이해할 수 있도록 처리하는 모델로, 챗봇이나 번역, 악플 판단, 진위 여부 판별 등의 목적으로 사용 가능
- 시계열 처리 모델: 시간 개념을 포함하는 시계열 데이터를 학습하여, 과거와 현재의 데이터를 기반으로 미래를 예측하는 모델
- 추천 시스템 모델: 고객의 선호도를 분석하여 분석된 고객과 유사한 성향을 가진 잠재적 고객을 찾아 상품, 컨텐츠, 수업 등을 추천하는 모델
- 이미지 분류 모델: 카테고리별로 분류된 이미지 데이터를 학습함으로써, 대상 이미지가 어떤 카테고리에 속하는 이미지인지를 예측하는 모델
- 이미지 객체 인식 모델: 이미지 내의 객체를 인식, 분류하고, 객체의 위치 영역을 구획/구분하는 모델
AI 모델 종류는 상술한 종류에 제한되지 않으며 다양한 기능/목적의 AI 모델 종류가 입력될 수 있음은 물론이다.
다음으로, AI 모델링 모듈은 사용자로부터 입력받은 데이터를 학습시켜 사용자가 입력한 AI 모델 종류의 AI 후보를 적어도 하나 생성/모델링할 수 있다(S1103). 복수개의 AI 후보는, 동일한 입력 데이터를 서로 다른 딥러닝 방식으로 학습함으로써, 생성/모델링될 수 있다.
다음으로, AI 모델링 모듈은 생성된 AI 후보 각각에 대한 성능 평가를 진행하고, 성능 평가 결과를 사용자에게 제공할 수 있다(S1104).
도 12는 본 발명의 일 실시예에 따른 AI 후보 각각에 대한 성능 평가 결과 제공 화면을 예시한 도면이다.
성능 평가는 각 AI 후보가 입력된 데이터를 기반으로 예측한 결과 값이 실제 결과 값과 얼마나 일치하는 지를 기준으로 수행될 수 있으며, 본 도면에 예시한 바와 같이 각 후보별로 정확도 및/또는 오차율이 산출되어 사용자에게 제공될 수 있다.
사용자는 이러한 성능 평가를 기초로 AI 후보 중 최종 생성/모델링하고자 하는 AI 후보를 선택할 수 있다(S1105).
다시 도 4를 참조하면, AI 모델링 모듈은 사용자 입력에 의해 선택된 AI 후보를 최종 AI로 결정하여, AI 생성을 완료할 수 있다(S1106). 사용자는 이렇게 완성된 AI에 분석하고자 하는 데이터를 입력하여 결과 값을 예측할 수 있다. 완성된 AI는, 개별 예측 기능과 일괄 예측 기능을 제공할 수 있다. 개별 예측 기능은, AI에 대하여 각 변수 값을 하나씩 사용자가 입력하면, AI가 각 변수 값에 대한 결과 값을 예측하여 출력하는 기능에 해당한다. 일괄 예측 기능은, AI에 대하여 한꺼번에 많은 양의 변수 값을 입력하면, AI가 입력된 변수 값에 대한 결과 값을 예측하여 출력하는 기능에 해당한다. 전자는 간단 예측에, 후자는 파일/데이터 기반의 방대한 예측에 주로 활용될 수 있다. 사용자는 사용 목적에 따라 개별 예측 기능과 일괄 예측 기능을 활용하여 결과 값을 예측할 수 있다.
도 13은 본 발명의 일 실시예에 따라 생성/모델링된 AI의 분석 결과 제공 화면을 예시한 도면이다.
AI 모델링 모듈은 생성된 AI를 분석하여, 분석 결과/정보를 사용자에게 제공함으로써 사용자가 AI의 기능/특성을 보다 잘 파악할 수 있도록 돕는다. AI 모델링 모듈은 주로 AI에 입력된 각 속성/변수/데이터 값이 결과 값에 어떤 영향을 얼만큼 주었는지를 주로 분석하여 사용자에게 제공할 수 있으며, 특히 사용자가 이해하기 쉽도록 본 도면과 같이 분석 결과를 시각화하여 제공할 수 있다.
도 14는 본 발명의 일 실시예에 따른 AI 배포 모듈이 제공하는 AI 마켓 화면을 예시한다.
AI 배포 모듈은 앞서 상술한 절차에 따라 자동으로 완성된 AI에 대한 다운로드 기능을 제공할 수 있다. 예를 들어, AI 배포 모듈은 완성된 AI를 다운로드받을 수 있는 다운로드 링크를 생성하여 사용자에게 제공할 수 있다. 사용자는 다운로드 기능을 통해 자신이 완성한 AI를 다운로드 받아 사용할 수 있다.
그리고/또는 AI 배포 모듈은, 완성된 AI에 대한 디플로이 기능을 제공할 수 있다. 디플로이 기능은, 클라우드 서버를 임대하여 AI를 배포, 운영, 관리할 수 있는 통합 MLOps(Machine Learning Model Operationalization Management)를 제공하는 기능에 해당한다. 따라서, 사용자는 별도의 서버를 임대하거나 구축할 필요 없이, 디플로이 기능을 통해 AI 구동에 가장 적합한 환경을 제공하는 서버를 임대함으로써 보다 쉽게 AI를 배포, 운영 및 관리할 수 있다.
그리고/또는, AI 모델링 모듈은 본 도면에 예시한 바와 같이, 완성된 AI를 사고 팔 수 있는 AI 마켓 기능을 제공할 수 있다. 사용자는 자신이 완성한 AI를 AI 마켓을 통해 팔거나, 다른 사람이 완성한 AI를 AI 마켓을 통해 구매하는 것도 가능하다. 이를 통해, 사용자는 단순히 AI 개발 및 사용에 끝나는 것이 아니라, 자신이 직접 완성한 AI를 통하여 수익 창출도 가능하다는 효과가 있다. 또한, 사용자는 AI를 직접 개발할 필요 없이 사용 목적/의도에 맞는 AI를 AI 마켓을 통해 간편하게 구매하여 원하는 용도로 활용 가능하다는 효과가 있다.
본 발명에 따른 실시예는 다양한 수단, 예를 들어, 하드웨어, 펌웨어(firmware), 소프트웨어 또는 그것들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 본 발명의 일 실시예는 하나 또는 그 이상의 ASICs(application specific integrated circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 프로세서, 콘트롤러, 마이크로 콘트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.
또한, 펌웨어나 소프트웨어에 의한 구현의 경우, 본 발명의 일 실시예는 이상에서 설명된 기능 또는 동작들을 수행하는 모듈, 절차, 함수 등의 형태로 구현되어, 다양한 컴퓨터 수단을 통하여 판독 가능한 기록매체에 기록될 수 있다. 여기서, 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 예컨대 기록매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CD-ROM(Compact Disk Read Only Memory), DVD(Digital Video Disk)와 같은 광 기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함한다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 이러한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
아울러, 본 발명에 따른 장치나 단말은 하나 이상의 프로세서로 하여금 앞서 설명한 기능들과 프로세스를 수행하도록 하는 명령에 의하여 구동될 수 있다. 예를 들어 그러한 명령으로는, 예컨대 JavaScript나 ECMAScript 명령 등의 스크립트 명령과 같은 해석되는 명령이나 실행 가능한 코드 혹은 컴퓨터로 판독 가능한 매체에 저장되는 기타의 명령이 포함될 수 있다. 나아가 본 발명에 따른 장치는 서버 팜(Server Farm)과 같이 네트워크에 걸쳐서 분산형으로 구현될 수 있으며, 혹은 단일의 컴퓨터 장치에서 구현될 수도 있다.
또한, 본 발명에 따른 장치에 탑재되고 본 발명에 따른 방법을 실행하는 컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 어플리케이션, 스크립트 혹은 코드로도 알려져 있음)은 컴파일 되거나 해석된 언어나 선험적 혹은 절차적 언어를 포함하는 프로그래밍 언어의 어떠한 형태로도 작성될 수 있으며, 독립형 프로그램이나 모듈, 컴포넌트, 서브루틴 혹은 컴퓨터 환경에서 사용하기에 적합한 다른 유닛을 포함하여 어떠한 형태로도 전개될 수 있다. 컴퓨터 프로그램은 파일 시스템의 파일에 반드시 대응하는 것은 아니다. 프로그램은 요청된 프로그램에 제공되는 단일 파일 내에, 혹은 다중의 상호 작용하는 파일(예컨대, 하나 이상의 모듈, 하위 프로그램 혹은 코드의 일부를 저장하는 파일) 내에, 혹은 다른 프로그램이나 데이터를 보유하는 파일의 일부(예컨대, 마크업 언어 문서 내에 저장되는 하나 이상의 스크립트) 내에 저장될 수 있다. 컴퓨터 프로그램은 하나의 사이트에 위치하거나 복수의 사이트에 걸쳐서 분산되어 통신 네트워크에 의해 상호 접속된 다중 컴퓨터나 하나의 컴퓨터 상에서 실행되도록 전개될 수 있다.
본 명세서에서 '모듈'은 '부', '구성', '유닛'으로 대체되어 설명될 수 있다.
설명의 편의를 위하여 각 도면을 나누어 설명하였으나, 각 도면에 서술되어 있는 실시예들을 병합하여 새로운 실시예를 구현하도록 설계하는 것도 가능하다. 또한, 본 발명은 상술한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상술한 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
또한, 이상에서는 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 명세서는 상술한 특정의 실시예에 한정되지 아니하며, 청구 범위에서 청구하는 요지를 벗어남이 없이 당해 명세서가 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형 실시들은 본 명세서의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.

Claims (15)

  1. AI(Artificial Intelligence) 자동 생성 방법에 있어서,
    복수개의 학습용 데이터 세트들을 구성하고 상기 복수개의 학습용 데이터들 중에서 선택되는 2이상의 학습용 데이터들을 결합하여 통합 학습용 데이터 세트를 구성하는, 데이터 세팅 단계;
    상기 통합 학습용 데이터 세트에 포함된 학습용 데이터에 대한 라벨링을 수행하는, 데이터 라벨링 단계;
    라벨링된 학습용 데이터 세트를 학습하여 AI를 모델링하는, AI 모델링 단계; 및
    모델링된 AI를 배포하는, AI 배포 단계; 를 포함하는, AI 자동 생성 방법.
  2. 제 1 항에 있어서,
    상기 데이터 세팅 단계는,
    사용자 입력에 기초하여 데이터를 입력받는 단계;
    입력된 데이터를 상기 복수개의 학습용 데이터 세트로 구성하는 단계;
    상기 복수개의 학습용 데이터 세트들 간 공통되는 항목을 추출하는 단계; 및
    상기 추출된 공통되는 항목에 기초하여 상기 통합 학습용 데이터 세트를 구성하는 단계; 를 포함하는, AI 자동 생성 방법.
  3. 제 2 항에 있어서,
    상기 사용자 입력에 기초하여 데이터를 입력받는 단계는,
    상기 사용자 입력에 기초하여 상기 데이터를 업로드하는 단계; 및
    상기 사용자 입력에 기초하여 특정 데이터 베이스 관리 시스템과 연동하여 상기 특정 데이터 베이스 관리 시스템으로부터 상기 데이터를 로딩하는 단계; 중 적어도 하나를 포함하는, AI 자동 생성 방법.
  4. 제 1 항에 있어서,
    상기 데이터 라벨링 단계는,
    사용자 입력을 기초로 상기 학습용 데이터에 대한 수동 라벨링 동작을 수행하는, 수동 라벨링 단계;
    수동 라벨링된 학습용 데이터를 학습하여 오토 라벨링 AI를 생성하는 단계; 및
    상기 오토 라벨링 AI에, 상기 학습용 데이터 세트에 포함된 학습용 데이터 중 상기 수동 라벨링된 학습용 데이터를 제외한 나머지 데이터를 입력하여, 상기 나머지 데이터에 대한 오토 라벨링 동작을 수행하는, 오토 라벨링 단계; 를 포함하는, AI 자동 생성 방법.
  5. 제 4 항에 있어서,
    상기 학습용 데이터가 이미지 데이터인 경우, 상기 수동 라벨링 단계는,
    상기 이미지 데이터에 포함된 이미지 객체의 영역을 구획하는 단계;
    구획된 영역에 포함된 상기 이미지 객체를 인식하는 단계;
    상기 이미지 객체에 할당할 라벨을 입력받는 단계; 및
    인식한 이미지 객체에 입력된 라벨을 할당하는 단계; 를 포함하는, AI 자동 생성 방법.
  6. 제 4 항에 있어서,
    상기 오토 라벨링 AI를 생성하는 단계는,
    상기 수동 라벨링된 학습용 데이터를 복수의 딥러닝 기술을 기반으로 학습하여 복수의 오토 라벨링 AI 후보를 생성하는 단계;
    상기 복수의 오토 라벨링 AI 후보 각각에 상기 나머지 학습용 데이터를 입력하여 각 오토 라벨링 AI 후보별 오토 라벨링 결과를 출력하는 단계; 및
    상기 오토 라벨링 AI 후보별 오토 라벨링 결과에 기초하여, 오토 라벨링 정확도가 가장 높은 오토 라벨링 AI 후보를 최종 오토 라벨링 AI로 선택하는 단계; 를 포함하는, AI 자동 생성 방법.
  7. 제 4 항에 있어서,
    상기 오토 라벨링 AI에 의해 오토 라벨링된 나머지 데이터의 오토 라벨링 결과를 검수하는 단계; 를 더 포함하는, AI 자동 생성 방법.
  8. 제 7 항에 있어서,
    상기 오토 라벨링 결과를 검수하는 단계는,
    상기 오토 라벨링 AI에 의해 오토 라벨링된 나머지 데이터의 오토 라벨링 결과를 제공하는 단계;
    상기 오토 라벨링 결과를 기초로, 각 나머지 데이터별 검수 통과 또는 검수 거절 입력을 사용자로부터 수신하는 단계; 및
    검수 통과 입력된 나머지 데이터를 이용하여 상기 오토 라벨링 AI를 재학습시키는 단계; 를 포함하는, AI 자동 생성 방법.
  9. 제 8 항에 있어서,
    검수 거절 입력된 나머지 데이터는 폐기하거나, 상기 사용자 입력을 기초로 상기 검수 거절 입력된 나머지 데이터에 대한 상기 수동 라벨링 동작을 수행하는 단계; 를 더 포함하는, AI 자동 생성 방법.
  10. 제 8 항에 있어서,
    상기 오토 라벨링 결과를 검수하는 단계는, 검수 거절 입력된 나머지 데이터의 비율이 기설정된 비율 미만으로 감소될 때까지 반복 수행되는, AI 자동 생성 방법.
  11. 제 1 항에 있어서,
    상기 AI 모델링 단계는,
    생성할 AI 모델 종류를 입력받는 단계; 및
    상기 학습용 데이터 세트 및 상기 라벨링된 학습용 데이터 중 적어도 하나를 입력된 AI 모델 종류에 따라 학습하여, 상기 AI를 생성하는 단계; 를 포함하는, AI 자동 생성 방법.
  12. 제 11 항에 있어서,
    상기 AI를 생성하는 단계는,
    상기 학습용 데이터 세트 및 상기 라벨링된 학습용 데이터 중 적어도 하나를, 상기 입력된 AI 모델 종류에 대해 설정된 복수의 딥러닝 기술을 기반으로 학습하여, 복수의 AI 후보를 생성하는 단계;
    상기 복수의 AI 후보의 성능을 평가하는 단계; 및
    상기 복수의 AI 후보별 성능 평가 결과에 기초하여, 상기 복수의 AI 후보 중 최종 AI를 선택하는 단계; 를 포함하는, AI 자동 생성 방법.
  13. 제 12 항에 있어서,
    상기 복수의 AI 후보의 성능을 평가하는 단계는,
    상기 복수의 AI 후보에 동일한 데이터를 입력하여 각 AI 후보별로 결과 값을 획득하는 단계;
    상기 각 AI 후보별로 획득한 결과 값과 실제 결과 값을 비교하여 매칭 정도를 판단하는 단계; 및
    상기 매칭 정도가 높을수록 성능을 높게 평가하는 단계; 를 포함하는, AI 자동 생성 방법.
  14. 제 12 항에 있어서,
    상기 최종 AI를 분석하고, 분석 결과를 제공하는 단계; 를 더 포함하며,
    상기 분석 결과는, 상기 최종 AI에 입력된 속성이 결과 값에 미치는 영향을 분석한 결과를 포함하는, AI 자동 생성 방법.
  15. 제 1 항에 있어서,
    상기 AI 배포 단계는,
    상기 AI를 다운로드받을 수 있는 다운로드 링크를 제공하는 단계;
    상기 AI를 운영 및 관리할 수 있는 통합 MLOps(Machine Learning Model Operationalization Management)를 제공하는 단계; 및
    상기 AI를 판매할 수 있는 AI 마켓 기능을 제공하는 단계; 중 적어도 하나를 포함하는, AI 자동 생성 방법.
KR1020220003708A 2021-09-13 2022-01-11 통합 학습용 데이터 세트를 이용한 딥러닝 인공지능 자동 생성 방법 및 이를 위한 장치 KR20230039487A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220003708A KR20230039487A (ko) 2021-09-13 2022-01-11 통합 학습용 데이터 세트를 이용한 딥러닝 인공지능 자동 생성 방법 및 이를 위한 장치

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020210121866A KR20230039032A (ko) 2021-09-13 2021-09-13 딥러닝 기반의 인공지능 자동 생성 방법 및 인공지능 정확도 개선을 위한 MLOps 장치
KR1020220003708A KR20230039487A (ko) 2021-09-13 2022-01-11 통합 학습용 데이터 세트를 이용한 딥러닝 인공지능 자동 생성 방법 및 이를 위한 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020210121866A Division KR20230039032A (ko) 2021-09-13 2021-09-13 딥러닝 기반의 인공지능 자동 생성 방법 및 인공지능 정확도 개선을 위한 MLOps 장치

Publications (1)

Publication Number Publication Date
KR20230039487A true KR20230039487A (ko) 2023-03-21

Family

ID=85801200

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020210121866A KR20230039032A (ko) 2021-09-13 2021-09-13 딥러닝 기반의 인공지능 자동 생성 방법 및 인공지능 정확도 개선을 위한 MLOps 장치
KR1020220003708A KR20230039487A (ko) 2021-09-13 2022-01-11 통합 학습용 데이터 세트를 이용한 딥러닝 인공지능 자동 생성 방법 및 이를 위한 장치
KR1020220003709A KR20230039488A (ko) 2021-09-13 2022-01-11 이미지 데이터가 포함된 학습용 데이터 세트를 학습하는 인공지능 자동 생성 방법 및 이를 위한 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020210121866A KR20230039032A (ko) 2021-09-13 2021-09-13 딥러닝 기반의 인공지능 자동 생성 방법 및 인공지능 정확도 개선을 위한 MLOps 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020220003709A KR20230039488A (ko) 2021-09-13 2022-01-11 이미지 데이터가 포함된 학습용 데이터 세트를 학습하는 인공지능 자동 생성 방법 및 이를 위한 장치

Country Status (1)

Country Link
KR (3) KR20230039032A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102655929B1 (ko) * 2023-08-18 2024-04-11 주식회사 티사이언티픽 생성형 ai 모델을 활용한 대화형 텍스트 데이터 생성 시스템 및 그 방법
KR102660320B1 (ko) * 2023-08-29 2024-04-25 오케스트로 주식회사 클라우드 기반의 최적 소스코드 제공 서버 및 소스 코드 제공 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102552230B1 (ko) * 2022-10-31 2023-07-06 (주)바질컴퍼니 클라우드 플랫폼에서 인공지능 모델을 활용한 데이터 라벨링 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102655929B1 (ko) * 2023-08-18 2024-04-11 주식회사 티사이언티픽 생성형 ai 모델을 활용한 대화형 텍스트 데이터 생성 시스템 및 그 방법
KR102660320B1 (ko) * 2023-08-29 2024-04-25 오케스트로 주식회사 클라우드 기반의 최적 소스코드 제공 서버 및 소스 코드 제공 방법

Also Published As

Publication number Publication date
KR20230039032A (ko) 2023-03-21
KR20230039488A (ko) 2023-03-21

Similar Documents

Publication Publication Date Title
KR20230039487A (ko) 통합 학습용 데이터 세트를 이용한 딥러닝 인공지능 자동 생성 방법 및 이를 위한 장치
US10719301B1 (en) Development environment for machine learning media models
US11176423B2 (en) Edge-based adaptive machine learning for object recognition
WO2021136365A1 (zh) 基于机器学习模型的应用开发方法、装置及电子设备
US20180349757A1 (en) Learning service providing apparatus
US11556746B1 (en) Fast annotation of samples for machine learning model development
CN104246656B (zh) 建议的视频编辑的自动检测
US11574430B2 (en) Method and system for creating animal type avatar using human face
WO2017120895A1 (en) System and method for optimizing user interface and system and method for manipulating user's interaction with interface
US11868721B2 (en) Intelligent knowledge management-driven decision making model
CN115080021A (zh) 基于自动化机器学习实现的零代码建模方法及系统
CN105210085A (zh) 使用最短连线特征的图像标记
CN109409533A (zh) 一种机器学习模型的生成方法、装置、设备及存储介质
CN111611240A (zh) 执行自动机器学习过程的方法、装置及设备
US20210004311A1 (en) Automated feedback-based application optimization
KR20230041454A (ko) 머신러닝 기반의 웹 페이지 템플릿 추천 방법 및 이를 위한 장치
CN114730486B (zh) 用于生成用于对象检测的训练数据的方法和系统
KR20210125588A (ko) 머신 러닝 기반의 사용자 맞춤형 특허 문헌 자동 분류 방법, 장치 및 시스템
CN111902812A (zh) 电子装置及其控制方法
US20220044136A1 (en) Automated data table discovery for automated machine learning
CN113127195A (zh) 人工智能分析垂直解决方案集成器
KR102531719B1 (ko) 어린이를 위한 숏폼콘텐츠 공유 및 추천 서비스 제공 장치 및 방법
KR102459775B1 (ko) 인공지능 기반 영상 콘텐츠 제작을 위한 자동 편집 방법, 장치 및 시스템
Hoarau Time Series Analysis on AWS: Learn how to build forecasting models and detect anomalies in your time series data
Mahalle et al. Data-Centric AI