KR20230087308A - 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법 - Google Patents
인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법 Download PDFInfo
- Publication number
- KR20230087308A KR20230087308A KR1020210176140A KR20210176140A KR20230087308A KR 20230087308 A KR20230087308 A KR 20230087308A KR 1020210176140 A KR1020210176140 A KR 1020210176140A KR 20210176140 A KR20210176140 A KR 20210176140A KR 20230087308 A KR20230087308 A KR 20230087308A
- Authority
- KR
- South Korea
- Prior art keywords
- learning
- cloud
- code
- type
- learning code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/4557—Distribution of virtual machine instances; Migration and load balancing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45591—Monitoring or debugging support
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 도 1의 클라우드 학습 장치의 시스템 구성을 설명하는 도면이다.
도 3은 도 1의 클라우드 학습 장치의 기능적 구성을 설명하는 도면이다.
도 4는 본 발명에 따른 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습방법을 설명하는 순서도이다.
도 5는 본 발명에 따른 사용자 학습코드의 유형 판단 과정을 설명하는 도면이다.
도 6은 본 발명에 따른 클라우드 리소스 활용맵의 일 실시예를 설명하는 도면이다.
110: 사용자 단말 130: 클라우드 학습 장치
150: 클라우드 서버 170: 데이터베이스
210: 프로세서 230: 메모리
250: 사용자 입출력부 270: 네트워크 입출력부
310: 학습코드 수신부 330: 학습코드 유형 판단부
350: 클라우드 제어부 370: 제어부
Claims (8)
- 사용자 학습코드를 수신하는 학습코드 수신부;
학습코드 모집단에 있는 샘플 학습코드의 사전 분석을 통해 구축된 학습코드 유형 모델을 기초로 상기 사용자 학습코드의 유형을 판단하는 학습코드 유형 판단부; 및
상기 사용자 학습코드의 유형에 맞춰 생성된 클라우드 리소스 활용맵에 따라 클라우드 서버의 리소스를 활용하도록 제어하는 클라우드 제어부;를 포함하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
- 제1항에 있어서, 상기 학습코드 유형 판단부는
상기 샘플 학습코드의 인공지능 연산 특징을 분석하여 CPU 집중 연산 유형, GPU 집중 연산 유형, 메모리 집중 연산 유형 및 가속기 집중 연산 유형 중 어느 하나를 상기 사용자 학습코드의 유형으로서 결정하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
- 제2항에 있어서, 상기 학습코드 유형 판단부는
상기 샘플 학습코드의 인공지능 연산 동안 소정의 시간 간격(time interval)마다 예측된 CPU, GPU, 메모리 및 가속기 중 적어도 하나의 사용량을 기초로 상기 인공지능 연산 특징을 결정하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
- 제1항에 있어서, 상기 학습코드 유형 판단부는
상기 사용자 학습코드를 상기 학습코드 유형 모델에 제공하여 상기 사용자 학습코드에 관한 코드 섹션별 유형을 결정하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
- 제1항에 있어서, 상기 클라우드 제어부는
상기 사용자 학습코드에 관한 코드 섹션별 유형을 분석하여 상기 클라우드 리소스 활용맵을 생성하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
- 제5항에 있어서, 상기 클라우드 제어부는
상기 사용자 학습코드에 대하여 상기 코드 섹션별 유형에 따른 동적인 리소스 할당을 스케쥴 할 수 있도록 상기 클라우드 리소스 활용맵을 구성하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
- 제6항에 있어서, 상기 클라우드 제어부는
상기 클라우드 리소스 활용맵에 최적이고 특정 기준 이하의 로드가 할당된 클라우드 서버를 선택하여 상기 사용자 학습코드를 제공하는 것을 특징으로 하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치.
- 사용자 학습코드를 수신하는 단계;
학습코드 모집단에 있는 샘플 학습코드의 사전 분석을 통해 구축된 학습코드 유형 모델을 기초로 상기 사용자 학습코드의 유형을 판단하는 단계; 및
상기 사용자 학습코드의 유형에 맞춰 생성된 클라우드 리소스 활용맵에 따라 클라우드 서버의 리소스를 활용하도록 제어하는 단계를 포함하는 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210176140A KR102792245B1 (ko) | 2021-12-09 | 2021-12-09 | 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210176140A KR102792245B1 (ko) | 2021-12-09 | 2021-12-09 | 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230087308A true KR20230087308A (ko) | 2023-06-16 |
KR102792245B1 KR102792245B1 (ko) | 2025-04-08 |
Family
ID=86948548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210176140A Active KR102792245B1 (ko) | 2021-12-09 | 2021-12-09 | 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102792245B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102734080B1 (ko) * | 2024-01-01 | 2024-11-25 | 주식회사 플랜터 | 다이나믹 메모리 조정 및 고속 스트림 처리를 위한 ai 최적화 클라우드 컴퓨팅 시스템 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140110486A (ko) * | 2013-03-08 | 2014-09-17 | 주식회사 알투소프트 | 모바일 클라우드 컴퓨팅 환경에서의 리소스 관리 시스템 및 그 방법 |
KR20170078012A (ko) | 2015-12-29 | 2017-07-07 | 전자부품연구원 | 클라우드 자원 모니터링 및 예측을 통한 자원 할당 최적화 방법 및 시스템 |
KR20200133484A (ko) * | 2019-05-20 | 2020-11-30 | 주식회사 에이젠글로벌 | 분산 병렬 기반 인공지능 예측 모델 관제 장치 및 방법 |
KR20210148586A (ko) * | 2020-06-01 | 2021-12-08 | 삼성전자주식회사 | 스케줄러, 스케줄러의 동작 방법 및 이를 포함한 가속기 시스템 |
-
2021
- 2021-12-09 KR KR1020210176140A patent/KR102792245B1/ko active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140110486A (ko) * | 2013-03-08 | 2014-09-17 | 주식회사 알투소프트 | 모바일 클라우드 컴퓨팅 환경에서의 리소스 관리 시스템 및 그 방법 |
KR20170078012A (ko) | 2015-12-29 | 2017-07-07 | 전자부품연구원 | 클라우드 자원 모니터링 및 예측을 통한 자원 할당 최적화 방법 및 시스템 |
KR20200133484A (ko) * | 2019-05-20 | 2020-11-30 | 주식회사 에이젠글로벌 | 분산 병렬 기반 인공지능 예측 모델 관제 장치 및 방법 |
KR20210148586A (ko) * | 2020-06-01 | 2021-12-08 | 삼성전자주식회사 | 스케줄러, 스케줄러의 동작 방법 및 이를 포함한 가속기 시스템 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102734080B1 (ko) * | 2024-01-01 | 2024-11-25 | 주식회사 플랜터 | 다이나믹 메모리 조정 및 고속 스트림 처리를 위한 ai 최적화 클라우드 컴퓨팅 시스템 |
Also Published As
Publication number | Publication date |
---|---|
KR102792245B1 (ko) | 2025-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110852421B (zh) | 模型生成方法和装置 | |
KR102337070B1 (ko) | 이상 데이터 자동 검출 및 자동 라벨링 기술을 이용한 학습 데이터베이스 구축 방법 및 시스템 | |
KR102613367B1 (ko) | 딥러닝 모델 서빙 최적화를 위한 모델 자동 경량화 방법 및 장치, 이를 이용한 클라우드 추론 서비스 제공 방법 | |
CN116057518A (zh) | 使用机器学习模型的自动查询谓词选择性预测 | |
KR102610431B1 (ko) | 인공지능 분석 기반 프로그램 소스코드의 요약문 생성 장치 및 방법 | |
CN111340221A (zh) | 神经网络结构的采样方法和装置 | |
US11645125B2 (en) | Method and apparatus for executing workflow including functions written in heterogeneous programing language | |
CN114118433B (zh) | 一种设备的配置参数的推荐方法及装置 | |
KR20210066545A (ko) | 반도체 소자의 시뮬레이션을 위한 전자 장치, 방법, 및 컴퓨터 판독가능 매체 | |
KR20230087316A (ko) | 인공지능 기반 클라우드 서비스 서버 결정 장치 및 방법 | |
KR102142943B1 (ko) | 클라우드 기반의 인공지능 연산 서비스 방법 및 이를 수행하는 장치 | |
Ma et al. | Ordinal optimization-based performance model estimation method for HDFS | |
CN119539089B (zh) | 一种多硬件混合大模型推理的方法、系统及相关装置 | |
KR102792245B1 (ko) | 인공지능 기반 리소스 활용패턴예측을 통한 클라우드 학습장치 및 방법 | |
KR102613365B1 (ko) | 인공지능 기반 클라우드 서비스 서버 결정 장치 및 방법 | |
KR20230087309A (ko) | 학습 클라우드 유형 기반의 인공지능 클라우드 학습장치 및 방법 | |
CN118485292A (zh) | 基于人工智能的工作流自动生成和算力分配方法及装置 | |
KR20230087319A (ko) | 인공지능 기반 클라우드 학습장치 및 방법 | |
KR102504939B1 (ko) | 클라우드 기반 딥러닝 작업의 수행시간 예측 시스템 및 방법 | |
CN117370008A (zh) | 资源分配方法及装置、存储介质及电子设备 | |
CN116109102A (zh) | 基于遗传算法的资源调配方法及系统 | |
WO2023184810A1 (zh) | 应用程序定义方法及装置、电子设备、存储介质和计算机程序产品 | |
US11676050B2 (en) | Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees using leaf nodes | |
KR102613366B1 (ko) | 인공지능 기반 클라우드 서비스 장치 및 방법 | |
KR20230087310A (ko) | 인공지능 기반 클라우드 학습 서비스 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20211209 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230927 Patent event code: PE09021S01D |
|
E90F | Notification of reason for final refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20240610 Patent event code: PE09021S02D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20250227 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20250402 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20250403 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |