KR20230087308A - 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법 - Google Patents

인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법 Download PDF

Info

Publication number
KR20230087308A
KR20230087308A KR1020210176140A KR20210176140A KR20230087308A KR 20230087308 A KR20230087308 A KR 20230087308A KR 1020210176140 A KR1020210176140 A KR 1020210176140A KR 20210176140 A KR20210176140 A KR 20210176140A KR 20230087308 A KR20230087308 A KR 20230087308A
Authority
KR
South Korea
Prior art keywords
learning
cloud
code
type
learning code
Prior art date
Application number
KR1020210176140A
Other languages
English (en)
Inventor
이경용
Original Assignee
국민대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국민대학교산학협력단 filed Critical 국민대학교산학협력단
Priority to KR1020210176140A priority Critical patent/KR20230087308A/ko
Publication of KR20230087308A publication Critical patent/KR20230087308A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법에 관한 것으로, 상기 장치는 사용자 학습코드를 수신하는 학습코드 수신부; 학습코드 모집단에 있는 샘플 학습코드의 사전 분석을 통해 구축된 학습코드 유형 모델을 기초로 상기 사용자 학습코드의 유형을 판단하는 학습코드 유형 판단부; 및 상기 사용자 학습코드의 유형에 맞춰 생성된 클라우드 리소스 활용맵에 따라 클라우드 서버의 리소스를 활용하도록 제어하는 클라우드 제어부;를 포함한다.

Description

인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법{CLOUD LEARNING DEVICE AND METHOD THROUGH ARTIFICIAL INTELLIGENCE-BASED RESOURCE UTILIZATION PATTERN PREDICTION}
본 발명은 클라우드 자원 활용 기술에 관한 것으로, 보다 상세하게는 인공지능을 활용하여 사용자의 학습코드를 클라우드 상에서 실행하기 위한 최적의 리소스를 구성할 수 있는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법에 관한 것이다.
최근 딥러닝 알고리즘은 다양한 분야에서 우수한 성능을 보이며 인공지능의 응용 사례를 넓히고 있다. 딥러닝 모델의 학습은 단시간에 많은 컴퓨팅 자원을 필요로 하기 때문에 주로 클라우드 환경 하에서 학습 작업이 이루어지고 있다.
하지만, 클라우드 컴퓨팅 서비스를 통해서 제공되는 자원의 종류가 너무 많은 탓에 사용자들은 다양한 서비스를 활용하여 최적의 딥러닝 학습 환경을 구축하는데 큰 어려움을 겪고 있다. 클라우드 인스턴스들 간의 가격 역시 큰 차이를 보이기에 성능 및 비용 측면에서 최적의 효율을 보이는 인스턴스를 선택하여 학습 작업을 진행하는 것은 매우 중요하면서도 어려운 일이다.
한편, 딥러닝(인공지능) 플랫폼은 인공지능 기술들, 예를 들어 영상처리, 음성인식, 자연어처리 등을 이용하여 필요에 의해서 사용자가 사용이 가능하게 해주는 제품이나 서비스를 개발하기 위한 도구를 의미할 수 있다. 최근 구현되고 있는 인공지능의 핵심 기술들은 다양한 분야로 응용 가능한 범용적인 특성을 갖고 있으며, 인공지능은 딥러닝 플랫폼의 핵심 기술에 해당할 수 있다.
한국공개특허 제10-2017-0078012호 (2017.07.07)
본 발명의 일 실시예는 인공지능을 활용하여 사용자의 학습코드를 클라우드 상에서 실행하기 위한 최적의 리소스를 구성할 수 있는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법을 제공하고자 한다.
실시예들 중에서, 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치는 사용자 학습코드를 수신하는 학습코드 수신부; 학습코드 모집단에 있는 샘플 학습코드의 사전 분석을 통해 구축된 학습코드 유형 모델을 기초로 상기 사용자 학습코드의 유형을 판단하는 학습코드 유형 판단부; 및 상기 사용자 학습코드의 유형에 맞춰 생성된 클라우드 리소스 활용맵에 따라 클라우드 서버의 리소스를 활용하도록 제어하는 클라우드 제어부;를 포함한다.
상기 학습코드 유형 판단부는 상기 샘플 학습코드의 인공지능 연산 특징을 분석하여 CPU 집중 연산 유형, GPU 집중 연산 유형, 메모리 집중 연산 유형 및 가속기 집중 연산 유형 중 어느 하나를 상기 사용자 학습코드의 유형으로서 결정할 수 있다.
상기 학습코드 유형 판단부는 상기 샘플 학습코드의 인공지능 연산 동안 소정의 시간 간격(time interval)마다 예측된 CPU, GPU, 메모리 및 가속기 중 적어도 하나의 사용량을 기초로 상기 인공지능 연산 특성을 결정할 수 있다.
상기 학습코드 유형 판단부는 상기 사용자 학습코드를 상기 학습코드 유형 모델에 제공하여 상기 사용자 학습코드에 관한 코드 섹션별 유형을 결정할 수 있다.
상기 클라우드 제어부는 상기 사용자 학습코드에 관한 코드 섹션별 유형을 분석하여 상기 클라우드 리소스 활용맵을 생성할 수 있다.
상기 클라우드 제어부는 상기 사용자 학습코드에 대하여 상기 코드 섹션별 유형에 따른 동적인 리소스 할당을 스케쥴 할 수 있도록 상기 클라우드 리소스 활용맵을 구성할 수 있다.
상기 클라우드 제어부는 상기 클라우드 리소스 활용맵에 최적이고 특정 기준 이하의 로드가 할당된 클라우드 서버를 선택하여 상기 사용자 학습코드를 제공할 수 있다.
실시예들 중에서, 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습방법은 사용자 학습코드를 수신하는 단계; 학습코드 모집단에 있는 샘플 학습코드의 사전 분석을 통해 구축된 학습코드 유형 모델을 기초로 상기 사용자 학습코드의 유형을 판단하는 단계; 및 상기 사용자 학습코드의 유형에 맞춰 생성된 클라우드 리소스 활용맵에 따라 클라우드 서버의 리소스를 활용하도록 제어하는 단계를 포함한다.
개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
본 발명의 일 실시예에 따른 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법은 인공지능을 활용하여 사용자의 학습코드를 클라우드 상에서 실행하기 위한 최적의 리소스를 구성할 수 있다.
도 1은 본 발명에 따른 클라우드 학습 시스템을 설명하는 도면이다.
도 2는 도 1의 클라우드 학습 장치의 시스템 구성을 설명하는 도면이다.
도 3은 도 1의 클라우드 학습 장치의 기능적 구성을 설명하는 도면이다.
도 4는 본 발명에 따른 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습방법을 설명하는 순서도이다.
도 5는 본 발명에 따른 사용자 학습코드의 유형 판단 과정을 설명하는 도면이다.
도 6은 본 발명에 따른 클라우드 리소스 활용맵의 일 실시예를 설명하는 도면이다.
본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.
도 1은 본 발명에 따른 클라우드 학습 시스템을 설명하는 도면이다.
도 1을 참조하면, 클라우드 학습 시스템(100)은 사용자 단말(110), 클라우드 학습 장치(130), 클라우드 서버(150) 및 데이터베이스(170)를 포함할 수 있다.
사용자 단말(110)은 클라우드 서비스를 이용할 수 있는 컴퓨팅 장치에 해당할 수 있고, 스마트폰, 노트북 또는 컴퓨터로 구현될 수 있으며, 반드시 이에 한정되지 않고, 태블릿 PC 등 다양한 디바이스로도 구현될 수 있다. 사용자 단말(110)은 클라우드 학습 장치(130)와 네트워크를 통해 연결될 수 있고, 복수의 사용자 단말(110)들은 클라우드 학습 장치(130)와 동시에 연결될 수 있다. 또한, 사용자 단말(110)은 클라우드 서버(150)와 직접 연결될 수 있으며, 클라우드 서비스 이용을 위한 전용 프로그램 또는 애플리케이션을 설치하여 실행시킬 수 있다.
클라우드 학습 장치(130)는 클라우드 컴퓨팅 환경에서 사용자 학습코드를 기반으로 하는 딥러닝 관련 작업 시 최적의 환경을 구성하도록 리소스의 효율적 관리를 수행하는 시스템, 또는 이에 해당하는 서버로 구현될 수 있다. 클라우드 학습 장치(130)는 사용자 단말(110)과 네트워크를 통해 연결될 수 있고 관련 데이터를 주고받을 수 있다.
또한, 클라우드 학습 장치(130)는 적어도 하나의 외부 시스템과 연동하여 동작할 수 있다. 예를 들어, 외부 시스템은 클라우드 서비스를 위한 클라우드 서버(150), 딥러닝 학습을 위한 인공지능 서버, 서비스 결제를 위한 결제 서버 또는 사용자 인증을 위한 인증 서버 등을 포함할 수 있다.
일 실시예에서, 클라우드 학습 장치(130)는 데이터베이스(170)와 연동하여 클라우드 컴퓨팅 환경에서 딥러닝 작업을 위해 작성된 사용자 학습코드의 유형을 결정하고 학습코드 유형에 따른 리소스 활용맵을 기초로 클라우드 리소스를 구성하기 위해 필요한 데이터를 저장할 수 있다. 또한, 클라우드 학습 장치(130)는 프로세서, 메모리, 사용자 입출력부 및 네트워크 입출력부를 포함하여 구현될 수 있으며, 이에 대해서는 도 2에서 보다 자세히 설명한다.
클라우드 서버(150)는 클라우드 서비스를 제공하는 서버에 해당할 수 있다. 클라우드 서버(150)는 사용자 환경에 적합한 다양한 클라우드 리소스를 제공할 수 있으며, 클라우드 리소스들의 조합을 다양한 인스턴스로 구현하여 제공할 수 있다. 이를 위해, 클라우드 서버(150)는 복수의 자원풀(resource pool)들과 연결되어 구현될 수 있다. 클라우드 서버(150)는 클라우드 학습 장치(130)와 네트워크를 통해 연결될 수 있으며, 사용자 단말(110)과도 직접 연결될 수 있다. 클라우드 서버(150)는 클라우드 학습 장치(130)에서 수행되는 딥러닝 학습을 위한 다양한 클라우드 인스턴스들을 제공할 수 있으며, 일 실시예에서 클라우드 서버(150)는 딥러닝 플랫폼을 제공하는 서버의 역할을 수행할 수 있다. 다른 실시예에서, 클라우드 서버(150)는 복수개로 구현될 수 있으며, 이 경우 각 클라우드 서버(150)는 클라우드 학습 장치(130)와 독립적으로 연결될 수 있다.
데이터베이스(170)는 클라우드 학습 장치(130)의 동작 과정에서 필요한 다양한 정보들을 저장하는 저장장치에 해당할 수 있다. 데이터베이스(170)는 딥러닝 알고리즘 및 이에 관한 사용자 학습코드에 관한 정보를 저장할 수 있고, 학습코드 유형에 관한 정보와 학습코드별 리소스 활용맵에 관한 정보를 저장할 수 있으며, 반드시 이에 한정되지 않고, 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습 과정에서 다양한 형태로 수집 또는 가공된 정보들을 저장할 수 있다.
도 2는 도 1의 클라우드 학습 장치의 시스템 구성을 설명하는 도면이다.
도 2를 참조하면, 클라우드 학습 장치(130)는 프로세서(210), 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)를 포함하여 구현될 수 있다.
프로세서(210)는 클라우드 학습 장치(130)가 동작하는 과정에서의 각 단계들을 처리하는 프로시저를 실행할 수 있고, 그 과정 전반에서 읽혀지거나 작성되는 메모리(230)를 관리할 수 있으며, 메모리(230)에 있는 휘발성 메모리와 비휘발성 메모리 간의 동기화 시간을 스케줄할 수 있다. 프로세서(210)는 클라우드 학습 장치(130)의 동작 전반을 제어할 수 있고, 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)와 전기적으로 연결되어 이들 간의 데이터 흐름을 제어할 수 있다. 프로세서(210)는 클라우드 학습 장치(130)의 CPU(Central Processing Unit)로 구현될 수 있다.
메모리(230)는 SSD(Solid State Drive) 또는 HDD(Hard Disk Drive)와 같은 비휘발성 메모리로 구현되어 클라우드 학습 장치(130)에 필요한 데이터 전반을 저장하는데 사용되는 보조기억장치를 포함할 수 있고, RAM(Random Access Memory)과 같은 휘발성 메모리로 구현된 주기억장치를 포함할 수 있다.
사용자 입출력부(250)는 사용자 입력을 수신하기 위한 환경 및 사용자에게 특정 정보를 출력하기 위한 환경을 포함할 수 있다. 예를 들어, 사용자 입출력부(250)는 터치 패드, 터치 스크린, 화상 키보드 또는 포인팅 장치와 같은 어댑터를 포함하는 입력장치 및 모니터 또는 터치스크린과 같은 어댑터를 포함하는 출력장치를 포함할 수 있다. 일 실시예에서, 사용자 입출력부(250)는 원격 접속을 통해 접속되는 컴퓨팅 장치에 해당할 수 있고, 그러한 경우, 클라우드 학습 장치(130)는 서버로서 수행될 수 있다.
네트워크 입출력부(270)은 네트워크를 통해 외부 장치 또는 시스템과 연결하기 위한 환경을 포함하고, 예를 들어, LAN(Local Area Network), MAN(Metropolitan Area Network), WAN(Wide Area Network) 및 VAN(Value Added Network) 등의 통신을 위한 어댑터를 포함할 수 있다.
도 3은 도 1의 클라우드 학습 장치의 기능적 구성을 설명하는 도면이다.
도 3을 참조하면, 클라우드 학습 장치(130)는 학습코드 수신부(310), 학습코드 유형 판단부(330), 클라우드 제어부(350) 및 제어부(370)를 포함할 수 있다.
학습코드 수신부(310)는 사용자 학습코드를 수신할 수 있다. 여기에서, 사용자 학습코드는 소정의 딥러닝 알고리즘을 구현한 딥러닝 학습코드로서 사용자에 의해 직접 생성되거나 입력된 학습코드에 해당할 수 있다. 즉, 사용자 학습코드의 실행을 통해 딥러닝 알고리즘이 구현된 결과 소정의 테스트 데이터셋에 관한 학습 동작이 수행될 수 있으며, 학습 과정에 대한 모니터링을 통해 딥러닝 학습에 관한 다양한 성능 메트릭(metric)이 측정될 수 있다. 또한, 사용자 학습코드는 소정의 프로그래밍 언어에 따라 작성될 수 있으며, 딥러닝 알고리즘의 특성이나 딥러닝 학습 방식에 따라 복수의 코드 섹션들을 포함할 수 있다. 예를 들어, 코드 섹션은 사용자 학습코드의 연산 구간, 함수 구간 및 반복 구간 등에 해당할 수 있다.
또한, 학습코드 수신부(310)는 사용자 단말(110)과 연동하여 사용자 학습코드의 수신을 위한 전용 인터페이스를 제공할 수 있으며, 사용자 단말(110)로부터 수신된 사용자 학습코드를 데이터베이스(170)에 저장하여 보관할 수 있다.
또한, 학습코드 수신부(310)는 사용자 학습코드를 수신하여 소정의 전처리 동작을 수행할 수 있다. 예를 들어, 학습코드 수신부(310)는 사용자 학습코드를 소정의 크기 이내로 제한하거나, 다수의 부분 학습코드들로 분할하는 등의 전처리 동작들을 선택적으로 수행할 수 있다. 또한, 학습코드 수신부(310)는 메타데이터 추출모듈을 포함할 수 있고, 메타데이터 추출모듈을 통해 사용자 학습코드로부터 메타데이터를 추출할 수 있다. 예를 들어, 추출된 메타데이터는 학습코드의 컴파일 시간, 빌드 시간, 프로그래밍 언어 및 바이너리 정보 등을 포함할 수 있다.
학습코드 유형 판단부(330)는 학습코드 모집단에 있는 샘플 학습코드의 사전 분석을 통해 구축된 학습코드 유형 모델을 기초로 사용자 학습코드의 유형을 판단할 수 있다. 여기에서, 학습코드 유형 모델은 학습코드를 입력으로 수신하여 해당 학습코드의 유형을 출력으로 생성하도록 구축된 딥러닝 모델에 해당할 수 있다. 학습코드 유형 모델은 샘플 학습코드에 관한 데이터셋에 해당하는 학습코드 모집단을 기초로 사전 학습을 통해 구축될 수 있으며, 학습코드의 유형 정보는 사전에 정의되어 활용될 수 있다.
예를 들어, 학습코드의 유형 정보는 학습코드의 실행에 의해 구현되는 딥러닝 알고리즘의 인공지능 연산 특징을 유형화하여 정의될 수 있으며, 인공지능 연산 특징은 딥러닝 알고리즘의 특성 메트릭들에 관한 조합으로 표현될 수 있다. 즉, 학습코드 유형 모델은 샘플 학습코드의 메타데이터에서 추출되는 학습코드 파라미터와 딥러닝 알고리즘의 인공지능 연산 특징들 간의 상관관계를 학습한 결과로서 구축될 수 있으며, 학습코드 유형 판단부(330)는 학습코드 유형 모델을 이용하여 사용자 학습코드에 대응되는 유형 정보를 결정할 수 있다.
일 실시예에서, 학습코드 유형 판단부(330)는 샘플 학습코드의 인공지능 연산 특징을 분석하여 CPU 집중 연산 유형, GPU 집중 연산 유형, 메모리 집중 연산 유형 및 가속기 집중 연산 중 어느 하나를 사용자 학습코드의 유형으로서 결정할 수 있다. 보다 구체적으로, CPU 집중 연산 유형은 샘플 학습코드의 실행에 의해 구현되는 인공지능 연산이 GPU 보다는 CPU를 주로 활용하여 수행되는 것에 적합한 유형에 해당할 수 있고, GPU 집중 연산 유형은 해당 인공지능 연산이 GPU를 주로 활용하여 수행되는 것에 적합한 유형에 해당할 수 있으며, 메모리 집중 연산 유형은 해당 인공지능 연산의 수행 과정에서 연산 자원보다는 메모리를 주요 자원으로 활용하여 수행되는 것에 적합한 유형에 해당할 수 있다.
또한, 가속기 집중 연산 유형은 사용자 학습코드의 실행에 관한 동작이 클라우드 환경에서 데이터 처리의 향상을 위한 가속기를 주로 활용하여 수행되는 것에 적합한 유형에 해당할 수 있다. 여기에서, 가속기는 하드웨어 및 소프트웨어 기반의 가속기를 포함할 수 있으며, 특히 사용자 학습코드의 실행으로 구현되는 딥러닝 알고리즘의 학습을 향상시키는데 활용될 수 있다. 예를 들어, 가속기는 TPU(Tensor Processing Unit), NPU(Neural Processing Unit), FPGA(Field Programmable Gate Array) 등을 포함할 수 있으며, 딥러닝 학습 과정에서 전력 요구량을 줄임으로써 비용(cost)을 감소시키거나 또는 연산 처리 능력을 높임으로써 성능(latency)을 개선시킬 수 있다. 한편, 학습코드 유형 판단부(330)는 사용자 학습코드의 유형으로서 대표적인 유형들을 추가로 정의하여 선택적으로 활용할 수 있음은 물론이다.
일 실시예에서, 학습코드 유형 판단부(330)는 샘플 학습코드의 인공지능 연산 동안 소정의 시간 간격(time interval)마다 예측된 CPU, GPU, 메모리 및 가속기 중 적어도 하나의 사용량을 기초로 인공지능 연산 특징을 결정할 수 있다. 학습코드의 실행에 의해 구현되는 딥러닝 알고리즘의 인공지능 연산 특징은 연산 과정에 사용되는 리소스들의 특성 메트릭에 관한 조합으로 표현될 수 있다. 이때, 특성 메트릭들에는 CPU, GPU, 메모리 및 가속기의 사용량(usage)에 관한 통계적 메트릭(예를 들어, 평균, 메디안, 분산, 표준편차 등)이 포함될 수 있으며, 필요에 따라 각 리소스에 관한 비용(cost) 및 시간(latency), 그리고 각 리소스들 사이의 사용 비율(use ratio) 등의 메트릭들이 포함될 수 있다. 학습코드 유형 판단부(330)는 특성 메트릭을 조합하여 인공지능 연산 특징을 정의하고 각 샘플 학습코드의 사전 분석을 통해 인공지능 연산 특징에 관한 학습 데이터를 수집할 수 있으며, 학습 데이터들은 학습코드 유형 모델의 구축 과정에서 활용될 수 있다.
일 실시예에서, 학습코드 유형 판단부(330)는 사용자 학습코드를 학습코드 유형 모델에 제공하여 사용자 학습코드에 관한 코드 섹션별 유형을 결정할 수 있다. 이때, 학습코드 유형 모델은 사용자 학습코드를 입력으로 수신하여 사용자 학습코드를 복수의 코드 섹션들로 분할하고 각 코드 섹션에 대한 유형을 출력으로 생성하도록 사전 학습을 통해 구축될 수 있다. 즉, 학습코드 유형 판단부(330)는 학습코드 유형 모델에 따라 사용자 학습코드 전체에 대한 유형을 판단하거나 또는 사용자 학습코드 부분들에 대한 유형들을 독립적으로 판단할 수도 있다.
클라우드 제어부(350)는 사용자 학습코드의 유형에 맞춰 생성된 클라우드 리소스 활용맵에 따라 클라우드 서버(150)의 리소스를 활용하도록 제어할 수 있다. 여기에서, 클라우드 리소스 활용맵은 사용자 학습코드의 유형에 따른 리소스 구성 정보를 정의하는 리소스 구성 템플릿에 해당할 수 있다. 이때, 클라우드 리소스 활용맵은 클라우드 환경을 구현하는 주요 자원들(예를 들어, CPU, GPU, TPU, 메모리, 네트워크 등)에 대한 상세 스펙 정보를 포함할 수 있으며, 동일한 유형에 대해 적어도 하나의 자원 구성 리스트에 대한 매칭 정보를 포함할 수 있다. 클라우드 제어부(350)는 사용자 학습코드의 예측된 유형에 따라 클라우드 리소스 활용맵을 기초로 클라우드 환경을 효율적으로 구성할 수 있으며, 이를 위해 클라우드 서버(150)와 연동하여 동작할 수 있다. 즉, 클라우드 제어부(350)는 클라우드 리소스에 관한 구성 신호를 생성하여 클라우드 서버(150)에 전달할 수 있고, 클라우드 서버(150)는 해당 구성 신호를 참조하여 자원 풀(resource pool)에서 가용 자원을 탐색한 후 클라우드 리소스 구성에 관한 동작을 처리할 수 있다.
일 실시예에서, 클라우드 제어부(350)는 사용자 학습코드에 관한 코드 섹션별 유형을 분석하여 클라우드 리소스 활용맵을 생성할 수 있다. 클라우드 제어부(350)는 사용자 학습코드에 대해 코드 섹션별 유형에 관한 통계 정보를 생성하고 해당 통계 정보에 따른 리소스 구성 정보를 포함하여 클라우드 리소스 활용맵을 생성할 수 있다. 이후, 클라우드 제어부(350)는 학습코드 유형 모델을 통해 사용자 학습코드의 코드 섹션별 유형을 판단한 다음 클라우드 리소스 활용맵을 기초로 코드 섹션별 유형의 통계 정보에 매칭되는 리소스 구성 정보를 결정할 수 있으며, 리소스 구성 정보를 클라우드 서버(150)에 전달하여 사용자 학습코드에 대응되는 리소스 구성을 처리할 수 있다.
또한, 사용자 학습코드가 복수의 코드 섹션들로 분할되고 각 코드 섹션별 유형이 결정된 경우 클라우드 제어부(350)는 코드 섹션별 유형에 관한 유형 패턴을 분류하고 유형 패턴별 리소스 구성 정보를 포함하여 클라우드 리소스 활용맵을 생성할 수 있다. 이에 따라, 클라우드 제어부(350)는 사용자 학습코드의 코드 섹션별 유형에 관한 유형 패턴에 맞춰 리소스 구성을 제어할 수 있다.
일 실시예에서, 클라우드 제어부(350)는 사용자 학습코드에 대하여 코드 섹션별 유형에 따른 동적인 리소스 할당을 스케쥴 할 수 있도록 클라우드 리소스 활용맵을 구성할 수 있다. 이 경우, 클라우드 리소스 활용맵은 사용자 학습코드의 코드 섹션별 유형에 관한 스케쥴링 정보를 포함하여 생성될 수 있다. 즉, 클라우드 리소스 활용맵은 리소스 구성 정보와 리소스 스케쥴링 정보를 포함할 수 있다. 예를 들어, 클라우드 리소스 활용맵은 사용자 학습코드의 코드 섹션 별로 리소스 스케쥴링을 위한 리소스 할당 및 해제 규칙을 포함할 수 있고, 리소스 할당 규칙에는 가용자원의 탐색, 예약, 대기, 대체 및 해제에 관한 규칙과, 가용자원의 우선순위에 따른 할당 및 해제 순서에 관한 규칙 등이 포함될 수 있다. 클라우드 제어부(350)는 클라우드 리소스 활용맵에 따라 사용자 학습코드의 각 코드 섹션에 최적화된 리소스 환경을 구축할 수 있다.
일 실시예에서, 클라우드 제어부(350)는 클라우드 리소스 활용맵에 최적이고 특정 기준 이하의 로드가 할당된 클라우드 서버(150)를 선택하여 사용자 학습코드를 제공할 수 있다. 이를 위해, 클라우드 제어부(350)는 복수의 클라우드 서버(150)들과 연동하여 동작할 수 있으며, 주기적으로 각 클라우드 서버(150)로부터 서버 상태 및 자원 상태에 관한 정보를 수신할 수 있다. 클라우드 제어부(350)는 클라우드 리소스 활용맵을 기초로 사용자 학습코드에 매칭되는 리소스 구성 정보를 결정할 수 있고, 리소스 구성 정보를 수용할 수 있는 클라우드 서버(150)를 최종 결정할 수 있다. 이때, 수용 가능한 클라우드 서버(150)가 복수인 경우 클라우드 제어부(350)는 소정의 기준을 적용하여 최적의 클라우드 서버(150)를 선택할 수 있다. 예를 들어, 클라우드 제어부(350)는 현재 서버의 연산 로드(computation load) 또는 리소스 로드(resource load)의 최소값을 기준으로 수용 가능한 클라우드 서버(150)들 중 어느 하나를 결정할 수 있다.
제어부(370)는 클라우드 학습 장치(130)의 전체적인 동작을 제어하고, 학습코드 수신부(310), 학습코드 유형 판단부(330) 및 클라우드 제어부(350) 간의 제어 흐름 또는 데이터 흐름을 관리할 수 있다.
도 4는 본 발명에 따른 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습방법을 설명하는 순서도이다.
도 4를 참조하면, 클라우드 학습 장치(130)는 학습코드 수신부(310)를 통해 사용자 학습코드를 수신할 수 있다(단계 S410). 클라우드 학습 장치(130)는 학습코드 유형 판단부(330)를 통해 학습코드 모집단에 있는 샘플 학습코드의 사전 분석을 통해 구축된 학습코드 유형 모델을 기초로 사용자 학습코드의 유형을 판단할 수 있다(단계 S430). 클라우드 학습 장치(130)는 클라우드 제어부(350)를 통해 사용자 학습코드의 유형에 맞춰 생성된 클라우드 리소스 활용맵에 따라 클라우드 서버의 리소스를 활용하도록 제어할 수 있다(단계 S450).
도 5는 본 발명에 따른 사용자 학습코드의 유형 판단 과정을 설명하는 도면이다.
도 5를 참조하면, 클라우드 학습 장치(130)는 학습코드 유형 판단부(330)를 통해 학습코드 유형 모델을 기초로 사용자 학습코드(550)의 유형을 판단할 수 있다. 이때, 사용자 학습코드(550)의 유형은 학습코드의 실행을 통해 구현되는 딥러닝 알고리즘(530)의 인공지능 연산 특징을 기초로 결정될 수 있다. 예를 들어, 클라우드 학습 장치(130)는 사용자 학습코드(550)의 인공지능 연산 특징을 분석하여 CPU 집중 연산 유형, GPU 집중 연산 유형, 메모리 집중 연산 유형 및 가속기 집중 연산 유형 중 어느 하나를 사용자 학습코드(550)의 유형으로서 결정할 수 있다. 도 5에서, 사용자 학습코드 (a)의 경우 CPU 집중 연산 유형으로 분류될 수 있고, (b)의 경우 GPU 집중 연산 유형으로 분류될 수 있다. 또한, (c)의 경우 메모리 집중 연산 유형으로 분류될 수 있고, (d)의 경우 가속기 집중 연산 유형으로 분류될 수 있다. 이때, 사용자 학습코드(550)의 유형은 클라우드의 자원풀(510)에 의해 관리하는 리소스들 중 특정 유형의 리소스에 따라 인공지능 연산 성능이 결정될 수 있음을 나타낼 수 있다.
도 6은 본 발명에 따른 클라우드 리소스 활용맵의 일 실시예를 설명하는 도면이다.
도 6을 참조하면, 클라우드 학습 장치(130)는 사용자 학습코드의 유형에 맞춰 생성된 클라우드 리소스 활용맵에 따라 클라우드 서버(150)의 리소스를 활용하도록 제어할 수 있다. 이때, 클라우드 리소스 활용맵은 사용자 학습코드의 유형에 따른 리소스 구성 정보를 포함하여 생성될 수 있다. 예를 들어, 도 6에서, 클라우드 리소스 활용맵(610)은 학습코드 유형 별로 클라우드 리소스에 관한 구성 정보를 포함하여 사전에 구축될 수 있다. 특히, 동일한 학습코드 유형의 경우에도 다양한 조합에 따라 복수의 자원 구성 리스트들에 매칭될 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 클라우드 학습 시스템
110: 사용자 단말 130: 클라우드 학습 장치
150: 클라우드 서버 170: 데이터베이스
210: 프로세서 230: 메모리
250: 사용자 입출력부 270: 네트워크 입출력부
310: 학습코드 수신부 330: 학습코드 유형 판단부
350: 클라우드 제어부 370: 제어부

Claims (8)

  1. 사용자 학습코드를 수신하는 학습코드 수신부;
    학습코드 모집단에 있는 샘플 학습코드의 사전 분석을 통해 구축된 학습코드 유형 모델을 기초로 상기 사용자 학습코드의 유형을 판단하는 학습코드 유형 판단부; 및
    상기 사용자 학습코드의 유형에 맞춰 생성된 클라우드 리소스 활용맵에 따라 클라우드 서버의 리소스를 활용하도록 제어하는 클라우드 제어부;를 포함하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
  2. 제1항에 있어서, 상기 학습코드 유형 판단부는
    상기 샘플 학습코드의 인공지능 연산 특징을 분석하여 CPU 집중 연산 유형, GPU 집중 연산 유형, 메모리 집중 연산 유형 및 가속기 집중 연산 유형 중 어느 하나를 상기 사용자 학습코드의 유형으로서 결정하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
  3. 제2항에 있어서, 상기 학습코드 유형 판단부는
    상기 샘플 학습코드의 인공지능 연산 동안 소정의 시간 간격(time interval)마다 예측된 CPU, GPU, 메모리 및 가속기 중 적어도 하나의 사용량을 기초로 상기 인공지능 연산 특징을 결정하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
  4. 제1항에 있어서, 상기 학습코드 유형 판단부는
    상기 사용자 학습코드를 상기 학습코드 유형 모델에 제공하여 상기 사용자 학습코드에 관한 코드 섹션별 유형을 결정하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
  5. 제1항에 있어서, 상기 클라우드 제어부는
    상기 사용자 학습코드에 관한 코드 섹션별 유형을 분석하여 상기 클라우드 리소스 활용맵을 생성하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
  6. 제5항에 있어서, 상기 클라우드 제어부는
    상기 사용자 학습코드에 대하여 상기 코드 섹션별 유형에 따른 동적인 리소스 할당을 스케쥴 할 수 있도록 상기 클라우드 리소스 활용맵을 구성하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
  7. 제6항에 있어서, 상기 클라우드 제어부는
    상기 클라우드 리소스 활용맵에 최적이고 특정 기준 이하의 로드가 할당된 클라우드 서버를 선택하여 상기 사용자 학습코드를 제공하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
  8. 사용자 학습코드를 수신하는 단계;
    학습코드 모집단에 있는 샘플 학습코드의 사전 분석을 통해 구축된 학습코드 유형 모델을 기초로 상기 사용자 학습코드의 유형을 판단하는 단계; 및
    상기 사용자 학습코드의 유형에 맞춰 생성된 클라우드 리소스 활용맵에 따라 클라우드 서버의 리소스를 활용하도록 제어하는 단계를 포함하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습방법.
KR1020210176140A 2021-12-09 2021-12-09 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법 KR20230087308A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210176140A KR20230087308A (ko) 2021-12-09 2021-12-09 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210176140A KR20230087308A (ko) 2021-12-09 2021-12-09 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법

Publications (1)

Publication Number Publication Date
KR20230087308A true KR20230087308A (ko) 2023-06-16

Family

ID=86948548

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210176140A KR20230087308A (ko) 2021-12-09 2021-12-09 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법

Country Status (1)

Country Link
KR (1) KR20230087308A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170078012A (ko) 2015-12-29 2017-07-07 전자부품연구원 클라우드 자원 모니터링 및 예측을 통한 자원 할당 최적화 방법 및 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170078012A (ko) 2015-12-29 2017-07-07 전자부품연구원 클라우드 자원 모니터링 및 예측을 통한 자원 할당 최적화 방법 및 시스템

Similar Documents

Publication Publication Date Title
CN110807515B (zh) 模型生成方法和装置
US11036552B2 (en) Cognitive scheduler
US10977076B2 (en) Method and apparatus for processing a heterogeneous cluster-oriented task
CN110852421A (zh) 模型生成方法和装置
KR102337070B1 (ko) 이상 데이터 자동 검출 및 자동 라벨링 기술을 이용한 학습 데이터베이스 구축 방법 및 시스템
KR102293791B1 (ko) 반도체 소자의 시뮬레이션을 위한 전자 장치, 방법, 및 컴퓨터 판독가능 매체
KR20230087316A (ko) 인공지능 기반 클라우드 서비스 서버 결정 장치 및 방법
CN111340221A (zh) 神经网络结构的采样方法和装置
CN112508723B (zh) 基于自动择优建模的金融风险预测方法、装置和电子设备
KR20200114233A (ko) 사용자 이용 패턴을 신경망 알고리즘으로 분석하여 다음 어플리케이션을 예측하는 모바일 디바이스 메모리 관리 장치 및 방법
CN116057518A (zh) 使用机器学习模型的自动查询谓词选择性预测
KR20220094564A (ko) 딥러닝 모델 서빙 최적화를 위한 모델 자동 경량화 방법 및 장치, 이를 이용한 클라우드 추론 서비스 제공 방법
KR102142943B1 (ko) 클라우드 기반의 인공지능 연산 서비스 방법 및 이를 수행하는 장치
CN116848580A (zh) 用于针对多方对话的话语解析的结构自感知模型
CN115826729A (zh) 硬盘电源管理方法、装置、电子设备、介质及产品
KR20230065017A (ko) 인공지능 분석 기반 프로그램 소스코드의 요약문 생성 장치 및 방법
KR102613365B1 (ko) 인공지능 기반 클라우드 서비스 서버 결정 장치 및 방법
KR102452206B1 (ko) 빅데이터 분석을 위한 인공지능 기반의 클라우드 최적화 장치 및 방법
KR20230087309A (ko) 학습 클라우드 유형 기반의 인공지능 클라우드 학습장치 및 방법
CN112817560A (zh) 一种基于表函数的计算任务处理方法、系统及计算机可读存储介质
KR102504939B1 (ko) 클라우드 기반 딥러닝 작업의 수행시간 예측 시스템 및 방법
KR20230087308A (ko) 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법
CN116109102A (zh) 基于遗传算法的资源调配方法及系统
US11676050B2 (en) Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees using leaf nodes
US11645125B2 (en) Method and apparatus for executing workflow including functions written in heterogeneous programing language

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal