WO2023243896A1

WO2023243896A1 - 인공신경망의 추론 분산 비율 결정 전자 장치 및 그 동작 방법

Info

Publication number: WO2023243896A1
Application number: PCT/KR2023/007112
Authority: WO
Inventors: 박찬종; 정재일; 반동하; 장준익
Original assignee: 삼성전자 주식회사
Priority date: 2022-06-17
Filing date: 2023-05-24
Publication date: 2023-12-21

Abstract

상태 추론 모델 및 적어도 하나의 인스트럭션이 저장된 메모리; 송수신부; 및 상기 적어도 하나의 인스트럭션을 실행하는 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는 상기 송수신부를 통해 복수의 디바이스 각각으로부터 제1 시점에서 제1 상태 정보를 획득하고, 상기 제1 상태 정보를 상기 상태 추론 모델에 입력하여 상기 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점의 복수의 디바이스 각각의 제2 상태 정보를 획득하고, 상기 획득된 각 디바이스의 제2 상태 정보에 기초하여, 상기 복수의 디바이스 각각의 상기 인공신경망의 추론 분산 비율을 결정하되, 상기 전자 장치는 상기 복수의 디바이스의 네트워크 상태에 기초하여 상기 복수의 디바이스 중에서 결정되는 전자 장치가 제공된다.

Description

인공신경망의 추론 분산 비율 결정 전자 장치 및 그 동작 방법

본 개시는, 복수의 디바이스의 상태 정보를 예측하여 복수의 디바이스 사이의 인공신경망에 대한 추론 분산 비율을 결정하는 전자 장치 및 그 동작 방법에 관한 것이다.

인공신경망은 사람 또는 동물 두뇌의 신경망에 착안되어 컴퓨터 하드웨어 또는 소프트웨어로 구현된 컴퓨팅 시스템으로 인공신경망의 분류(classification), 추론(inference) 등을 이용하여 다양한 분야에서 활용되고 있다.

인공신경망의 추론을 수행하는 디바이스의 연산량을 줄이기 위하여 하나의 디바이스가 인공신경망의 추론을 수행하지 않고, 인공신경망이 분산되어 복수의 디바이스에서 추론 과정이 수행될 수 있다.

인공신경망을 분산 추론하기 위해서 각 디바이스의 성능에 따라 인공신경망이 분할되고, 분할 비율에 따라 각 디바이스에서 인공신경망의 추론 과정이 분산 수행될 수 있다.

본 발명의 일 실시예에 따른 전자 장치는 상태 추론 모델 및 적어도 하나의 인스트럭션이 저장된 메모리; 송수신부; 및 상기 적어도 하나의 인스트럭션을 실행하는 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는 상기 송수신부를 통해 복수의 디바이스 각각으로부터 제1 시점에서 제1 상태 정보를 획득하고, 상기 제1 상태 정보를 상기 상태 추론 모델에 입력하여 상기 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점의 복수의 디바이스 각각의 제2 상태 정보를 획득하고, 상기 획득된 각 디바이스의 제2 상태 정보에 기초하여, 상기 복수의 디바이스 각각의 상기 인공신경망의 추론 분산 비율을 결정하되, 상기 전자 장치는 상기 복수의 디바이스의 네트워크 상태에 기초하여 상기 복수의 디바이스 중에서 결정된다.

상기 제1 상태 정보 및 제2 상태 정보는, 상기 복수의 디바이스 각각의 CPU(center processing unit)의 사용률, GPU(graphic processing unit)의 사용률, CPU의 온도, GPU의 온도, 실행 중인 어플리케이션(application)의 개수 및 경과 시간(elapsed time) 중 적어도 하나를 포함할 수 있다.

상기 제2 상태 정보는, 경과 시간을 포함하고, 상기 적어도 하나의 프로세서는, 상기 복수의 디바이스 각각의 상기 경과 시간의 역수를 정규화하고, 상기 정규화된 경과 시간의 역수를 상기 복수의 디바이스 각각의 상기 인공신경망의 추론 분산 비율로 결정할 수 있다.

상기 적어도 하나의 프로세서(120)는, 상기 제1 시점에서 소정의 어플리케이션 실행 여부, 화면 켜짐 여부 및 카메라 실행 여부 중 적어도 하나를 포함하는 제3 상태 정보를 더 획득하고, 상기 상태 추론 모델에 상기 제3 상태 정보를 더 입력하여 상기 제2 상태 정보를 획득할 수 있다.

상기 적어도 하나의 프로세서는, 상기 복수의 디바이스 각각에 상기 결정된 추론 분산 비율 및 상기 인공신경망의 추론 시작점을 상기 송수신부를 통해 전송할 수 있다.

상기 적어도 하나의 프로세서는, 상기 인공신경망을 상기 결정된 추론 분산 비율에 따라 분할하고, 상기 분할된 인공신경망을 상기 추론 분산 비율에 대응되는 상기 복수의 디바이스 각각에 송수신부를 통해 전송할 수 있다.

상기 상태 추론 모델은, 제3 시점의 학습용 상태 정보 및 상기 제3 시점으로부터 소정의 시간 간격 이후인 제4 시점의 정답용 상태 정보를 입력으로 하여, 회귀 (regression) 학습된 것일 수 있다.

상기 네트워크 상태는, 제1 디바이스가 상기 제1 디바이스를 제외한 상기 복수의 디바이스 각각으로부터 수신한 테스트 정보에 의한 각 디바이스의 네트워크 I/O(input/output) 패킷량이고, 상기 제1 디바이스는 상기 복수의 디바이스 중에서 임의로 선정된 것일 수 있다.

상기 전자 장치는, 상기 복수의 디바이스 중에서 네트워크 I/O 패킷량이 소정의 패킷량 이하인 적어도 하나의 후보 디바이스가 선정되고, 상기 적어도 하나의 후보 디바이스 중에서 유선 네트워크로 연결된 하나의 후보 디바이스일 수 있다.

상기 전자 장치는, 상기 적어도 하나의 후보 디바이스 중에서 GPU 처리량이 가장 높은 후보 디바이스일 수 있다.

본 발명의 일 측면에 따른 전자 장치에 의해 수행되는 방법은 상기 전자 장치를 포함하는 복수의 디바이스 각각으로부터 제1 시점의 제1 상태 정보를 획득하는 단계; 상기 제1 상태 정보를 상태 추론 모델에 입력하여 상기 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점의 상기 복수의 디바이스 각각의 제2 상태 정보를 획득하는 단계; 및 상기 획득된 각 디바이스의 제2 상태 정보에 기초하여, 상기 복수의 디바이스 각각의 상기 인공신경망의 추론 분산 비율을 결정하는 단계를 포함하되, 상기 전자 장치는 상기 복수의 디바이스의 네트워크 상태에 기초하여 상기 복수의 디바이스 중에서 결정된다.

상기 제1 상태 정보 및 제2 상태 정보는, 상기 복수의 디바이스 각각의 CPU(center processing unit)의 사용률, GPU의 사용률, CPU의 온도, GPU의 온도, 실행 중인 어플리케이션(application)의 개수 및 경과 시간(elapsed time) 중 적어도 하나를 포함할 수 있다.

상기 제2 상태 정보는, 경과 시간을 포함하고, 상기 추론 분산 비율을 결정하는 단계는, 상기 복수의 디바이스 각각의 상기 경과 시간의 역수를 정규화(normalization)하는 단계; 및 상기 정규화된 경과 시간의 역수를 상기 복수의 디바이스 각각의 상기 인공신경망의 추론 분산 비율로 결정하는 단계를 포함할 수 있다.

상기 제2 상태 정보를 획득하는 단계는, 상기 제1 시점에서 소정의 어플리케이션 실행 여부, 화면 켜짐 여부 및 카메라 실행 여부 중 적어도 하나를 포함하는 제3 상태 정보를 획득하는 단계 및 상기 상태 추론 모델에 상기 제3 상태 정보를 더 입력하여 상기 제2 상태 정보를 획득하는 단계를 포함할 수 있다.

상기 방법은, 상기 복수의 디바이스 각각에 상기 결정된 추론 분산 비율 및 상기 인공신경망의 추론 시작점을 전송하는 단계를 더 포함할 수 있다.

상기 방법은, 상기 인공신경망을 상기 결정된 추론 분산 비율에 따라 분할하는 단계; 및 상기 분할된 인공신경망을 상기 추론 분산 비율에 대응되는 상기 복수의 디바이스 각각에 전송하는 단계를 더 포함할 수 있다.

본 발명의 일 측면에 따르면, 방법을 수행하기 위해 프로세서에 의해 실행가능한 컴퓨터 판독가능한 프로그램 코드 또는 명령을 저장하기 위한 비일시적 컴퓨터 판독가능 기록매체로서, 상기 방법은, 전자 장치를 포함하는 복수의 디바이스 각각으로부터 제1 시점의 제1 상태 정보를 획득하는 단계; 상기 제1 상태 정보를 상태 추론 모델에 입력하여 상기 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점의 상기 복수의 디바이스 각각의 제2 상태 정보를 획득하는 단계; 및 상기 획득된 각 디바이스의 제2 상태 정보에 기초하여, 상기 복수의 디바이스 각각의 상기 인공신경망의 추론 분산 비율을 결정하는 단계를 포함하되, 상기 전자 장치는 상기 복수의 디바이스의 네트워크 상태에 기초하여 상기 복수의 디바이스 중에서 결정된 것이다.

본 발명의 특정 실시예의 상기 및 다른 측면, 특징 및 이점은 첨부된 도면과 함께 취해진 다음의 설명으로부터 더욱 명백해질 것이다.

도 1은 일 실시예에 따른 복수의 디바이스의 연결 상태를 나타낸다.

도 2는 일 실시예에 따른 인공신경망의 분할 추론을 위해 복수의 디바이스에 분할된 인공신경망을 나타낸다.

도 3은 일 실시예에 따른 전자 장치의 기능을 나타내는 예시적인 도면이다.

도 4는 일 실시예에 따른 전자 장치가 제1 상태 정보를 입력받아 제2 상태정보를 추론하는 동작을 설명하기 위한 도면이다.

도 5는 일 실시예에 따른 전자 장치가 제1 상태 정보 및 추가 정보를 입력받아 제2 상태정보를 추론하는 동작을 설명하기 위한 예시적인 도면이다.

도 6은 결정된 추론 비율에 따라 인공신경망의 일부를 적어도 하나의 디바이스에 송신하고, 각 디바이스가 인공신경망의 추론을 수행하는 동작을 설명하기 위한 예시적인 도면이다.

도 7은 복수의 디바이스 중에서 인공신경망 추론 비율을 결정하는 전자 장치를 선정하는 예시적인 도면이다.

도 8은 일 실시예에 따른 전자 장치의 구성을 나타내는 블록도이다.

도 9는 일 실시예에 따른 각 디바이스의 구성을 나타내는 블록도이다.

도 10은 일 실시예에 따른 전자 장치에 의한 인공신경망의 추론 분산 비율을 결정하는 방법을 나타내는 순서도이다.

도 11은 일 실시예에 따른 인공신경망의 추론 분산 비율을 결정하는 방법을 나타내는 순서도이다.

본 명세서 전체에서 "a, b 또는 c 중 적어도 하나"라는 표현은 a만, b만, c만, a와 b 모두, a와 c 모두, b와 c 모두 또는 a, b 및 c 모두를 나타낸다.

아래에서는 첨부한 도면을 참조하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 개시의 실시예를 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

본 개시의 실시예들에서 사용되는 용어는 본 개시의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 실시예의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 명세서에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 용어들은 본 명세서에 기재된 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가질 수 있다.

또한, 본 명세서에 기재된 “...부”, “...모듈” 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 “직접적으로 연결” 또는 “물리적으로 연결”되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 “전기적으로 연결”되어 있는 경우도 포함한다. 본 개시에서, “송신(transmit)”, “수신(receive)” 및 “통신(communicate)” 이라는 용어들은 직접 통신 및 간접 통신을 모두 포함한다. 또한 어떤 부분이 어떤 구성요소를 “포함(include, comprise)”한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

본 개시 전체에서, 특별히 반대되는 기재가 없는 한 “또는(or)”은 포괄적(inclusive)이며 배타적(exclusive)이지 않다. 따라서, 명백히 달리 표시되거나 문맥상 달리 표시되지 않는 한, “A 또는 B”는 “A, B, 또는 둘 모두”를 나타낼 수 있다. 본 개시에서, “~중 적어도 하나” 또는 “하나 이상의 ~”라는 문구는, 열거된 항목들 중 하나 이상의 항목들의 서로 다른 조합이 사용될 수도 있고, 열거된 항목들 중 임의의 하나의 항목만이 필요한 경우를 의미할 수도 있다. 예를 들어, “A, B, 및 C 중 적어도 하나”는 다음의 조합들 중 임의의 것을 포함할 수 있다: A, B, C, A 및 B, A 및 C, B 및 C, 또는 A 및 B 및 C.

“제어기(controller, 컨트롤러)”는 적어도 하나의 동작을 제어하는 임의의 디바이스, 시스템 또는 그 부분을 나타낼 수 있다. 제어기는 하드웨어, 하드웨어 및 소프트웨어의 조합, 또는 펌웨어로 구현될 수 있다. 특정 제어기에 연관된 기능은, 국부적 또는 원격의 집중형 또는 분산형일 수 있다.

이하 설명되는 본 개시의 다양한 실시예들은 하나 이상의 컴퓨터 프로그램들에 의해 구현 또는 지원될 수 있고, 컴퓨터 프로그램들은 컴퓨터 판독 가능한 프로그램 코드(code)로부터 형성되고, 컴퓨터로 판독 가능한 매체에 수록될 수 있다. 본 개시에서, “애플리케이션(application)” 및 “프로그램(program)”은 컴퓨터 판독 가능한 프로그램 코드에서의 구현에 적합한 하나 이상의 컴퓨터 프로그램, 소프트웨어 컴포넌트, 명령어 세트, 프로시저(procedure), 함수, 개체(object), 클래스, 인스턴스, 관련 데이터, 또는 그것의 일부를 나타낼 수 있다. “컴퓨터 판독 가능한 프로그램 코드”는, 소스 코드, 목적 코드, 및 실행 가능한 코드를 포함하는 다양한 유형의 컴퓨터 코드를 포함할 수 있다. “컴퓨터 판독 가능한 매체”는, ROM(read only memory), RAM(random access memory), 하드 디스크 드라이브(HDD), CD(compact disc), DVD(digital video disc), 또는 다양한 유형의 메모리와 같이, 컴퓨터에 의해 액세스될 수 있는 다양한 유형의 매체를 포함할 수 있다.

또한, 컴퓨터 판독 가능한 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, '비일시적 저장 매체'는 실재(tangible)하는 장치이고, 일시적인 전기적 또는 다른 신호들을 전송하는 유선, 무선, 광학적, 또는 다른 통신 링크들을 배제할 수 있다. 한편, 이 '비일시적 저장 매체'는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다. 예를 들어, '비일시적 저장 매체'는 데이터가 임시적으로 저장되는 버퍼를 포함할 수 있다. 컴퓨터 판독 가능한 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함할 수 있다. 컴퓨터 판독 가능한 매체는, 데이터가 영구적으로 저장될 수 있는 매체와 데이터가 저장되고 나중에 덮어쓰기 될 수 있는 매체, 이를테면 재기입 가능한 광 디스크 또는 소거 가능한 메모리 디바이스를 포함한다.

일 실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예를 들어, compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예를 들어, 플레이 스토어^TM)를 통해 또는 두 개의 사용자 장치들(예를 들어, 스마트폰) 간에 직접, 온라인으로 배포(예를 들어, 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품(예를 들어, 다운로더블 앱(downloadable app))의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.

기타 특정 단어들 및 문구들에 대한 정의는 본 개시의 전체에 걸쳐 제공될 수 있다. 본 개시가 속하는 기술분야의 통상의 지식을 가진 자는, 다양한 경우들에서, 정의된 단어들 및 문구들이 과거 및 장래의 사용들에도 적용될 수 있음을 이해할 수 있을 것이다.

본 명세서에서 후술하는 각 구성 요소는 자신의 주요 기능 외에 다른 구성 요소가 수행하는 기능의 일부 또는 전부를 추가적으로 수행할 수 있으며, 각 구성 요소의 주요 기능 중 일부는 전적으로 다른 구성 요소에 의해 수행될 수 있다.

본 명세서에서 용어 '기계 학습' 또는 '머신 러닝(machine learning)'은 인공 지능의 한 분야로, 경험을 통해 일일이 코드로 명시하지 않은 동작을 데이터로부터 학습하여 실행할 수 있는 알고리즘을 의미한다.

본 명세서에서 용어 '인공신경망'은 기계 학습에 의해 학습된 인간의 신경망을 모사하여 만들어진 컴퓨팅 시스템으로 학습에 의해 인공신경망에 정보가 입력되면, 입력에 대한 결과가 출력될 수 있다.

본 명세서에서 용어 '디바이스'는 전자적 신호를 이용하여 어떤 동작을 수행하기 위한 전자 장치를 의미할 수 있다. 본 명세서에서 용어 '디바이스'는 '전자 장치'와 혼용하여 사용될 수 있다.

본 명세서에서 인용되는 도면을 보다 충분히 이해하기 위하여 각 도면의 간단한 설명이 제공된다.

학습된 인공신경망은 분류(classification) 및 추론(inference)을 수행하여, 주어진 문제에 대한 답을 얻어 낼 수 있기 때문에 다양한 분야에서 활용되고 있다. 다만, 인공신경망의 추론에 있어 하드웨어 자원이 다수 사용될 수 있기 때문에 인공신경망의 추론을 수행하는 주체가 하나의 디바이스인 경우에, 상기 하나의 디바이스에 과도한 연산량이 요구될 수 있다.

복수의 디바이스가 서로 네트워크 연결되어 있는 경우, 상기 인공신경망을 분할하여 분산 추론할 수 있도록 복수의 디바이스를 포함하는 분산 추론 시스템이 제공될 수 있다.

도 1을 참조하면, 분산 추론 시스템은 전자 장치(100), 제1 디바이스(200), 제2 디바이스(300) 및 제3 디바이스(400)를 포함할 수 있다. 다만, 도 1은 예시적인 것에 불과하며, 네트워크 상황에 따라 추가 디바이스를 더 포함할 수도 있고 일부 디바이스를 포함하지 않을 수도 있다. 이에 한정되지 않는다.

여기서, 전자 장치(100), 제1 디바이스(200), 제2 디바이스(300) 및 제3 디바이스(400)는 서로 각각 네트워크 통신을 수행할 수 있는 장치일 수 있고, 각 장치는 인공신경망의 일부 또는 전체를 추론하는 데 이용될 수 있다.

본 명세서에서는 전자 장치(100)가 인공신경망의 추론 분산 비율을 결정하는 것으로 설명하지만, 이는 예시적인 것에 불과하며 전자 장치(100)이외에 제1 디바이스(200), 제2 디바이스(300) 및 제3 디바이스(400) 중에서 하나의 디바이스가 인공신경망의 추론 분산 비율을 결정할 수도 있다. 이에 한정되지 않는다.

전자 장치(100), 제1 디바이스(200), 제2 디바이스(300) 및 제3 디바이스(400)는 기 공지된 유선 또는 무선 통신을 이용하여 네트워크를 구성할 수 있다. 예를 들어, 각 디바이스가 통신하는 방법은 근거리 통신 네트워크(예: 불루투스, WiFi direct 또는 IrDA(infrared data association)) 또는 원거리 통신 네트워크(예: 셀룰러 네트워크, 인터넷 또는 컴퓨터 네트워크(예: LAN 또는 WAN))를 통하여 디바이스가 서로 통신을 수행할 수 있다.

도 2를 참조하면, 인공신경망(10)은 입력층과 출력층 사이에 다수의 은닉층(hidden layer)가 있는 다중 퍼셉트론(multi-perceptron)일 수 있다. 또한, 인공신경망(10)은 순환 신경망(RNN, recurrent neural network), 콘볼루션 신경망(CNN, convolutional neural network), 심층 신경망(DNN, deep neural network) 등 기 공지된 인공신경망 모델일 수 있다. 본 명세서에서는 설명의 편의를 위하여 인공신경망(10)은 심층 신경망으로 설명하지만, 이에 한정되지 않는다.

심층 신경망은 입력층과 출력층 사이에 다중의 은닉층(hidden layer)을 포함하는 인공 신경망일 수 있다. 또한, 심층 신경망은 다중의 은닉층을 포함하여 다양한 비선형적 관계를 학습할 수 있다

또한, 인공신경망(10)은 추론을 위한 인공신경망 모델로 미리 학습된 모델일 수 있고, 입력 정보를 인공신경망(10)에 입력하여 결과를 추론하기 위한 과정은 전자 장치(100)가 결정한 추론 비율에 따라 인공신경망(10)이 분할된 복수의 과정으로 분할될 수 있다.

예를 들어, 전자 장치(100)가 제1 디바이스(200)의 분할 비율을 15%로 결정하고, 제2 디바이스(300)의 분할 비율을 15%로 결정하고, 제3 디바이스(400)의 분할 비율을 35%로 결정하고, 전자 장치(100)의 분할 비율을 35%로 결정한 경우를 가정한다. 이 경우, 전자 장치(100)는 각 분할 비율에 따라 순서대로 인공신경망 전체를 분할하여 각 디바이스에 추론 과정을 할당할 수 있다. 이에 따라, 제1 디바이스(200)에는 인공신경망(10)의 첫 15%에 해당하는 제1 과정(11)이 할당되고, 제2 디바이스(300)에는 인공신경망(10)의 제1 과정(11) 이후의 15%에 해당하는 제2 과정(13)이 할당되고, 제3 디바이스(400)에는 인공신경망(10)의 제2 과정(13) 이후의 35%에 해당하는 제3 과정(15)이 할당되고, 전자 장치(100)에는 인공신경망(10)의 나머지 추론 과정인 제4 과정(17)이 할당될 수 있다.

분할된 인공신경망(10)의 추론 과정이 각 디바이스에 분산되면 각 디바이스는 제1 디바이스(200), 제2 디바이스(300), 제3 디바이스(400) 및 전자 장치(100)의 순서대로 추론 과정을 수행함으로써 전체 인공신경망(10)의 추론 과정이 수행될 수 있다.

보다 구체적으로, 제1 디바이스(200)에 입력 값이 입력되면 제1 디바이스(200)는 제1 과정(11)을 수행하고 전체 추론 과정의 제1 중간 결과 값을 제2 디바이스(300)에 송신할 수 있다. 이어서, 제2 디바이스(300)는 수신된 제1 중간 결과 값을 제2 과정(13)의 입력으로 하여, 제2 과정(13)을 수행한 결과인 제2 중간 결과값을 제3 디바이스(400)에 송신할 수 있다. 제3 디바이스(400)는 수신된 제2 중간 결과값을 제3 과정(15)의 입력으로 하여, 제3 과정(13)을 수행한 결과인 제3 중간 결과값을 전자 장치(100)에 송신할 수 있다. 마지막으로 전자 장치(100)는 수신된 제3 중간 결과값을 제4 과정(17)의 입력으로 하여, 전체 인공신경망(10)의 추론 결과를 출력할 수 있다.

이와 같이 인공신경망(10)을 분할하여 분할된 추론 과정을 각 디바이스가 분산 처리함으로써 하나의 디바이스에 과도한 자원이 사용되는 것을 방지할 수 있는 효과를 포함하는 다양한 효과가 있을 수 있다.

전자 장치(100)가 인공신경망(10)의 추론 분산 비율은 각 디바이스에 포함된 CPU 또는 GPU의 연산 성능 비율에 따라 연산 성능이 더 좋은 디바이스에 더 큰 추론 분산 비율이 결정될 수 있다. 또한, 추론 분산 비율은 현재 CPU 또는 GPU의 사용량에 따라 사용량이 적은 디바이스에 더 많은 추론 분산 비율이 할당되도록 각 디바이스의 추론 분산 비율이 결정될 수 있다.

다만, 연산 성능 비율에 따라 추론 분산 비율을 결정되는 경우, 사용자가 디바이스를 사용하는 CPU 또는 GPU의 점유율을 고려하지 않는 문제가 있다. 또한, CPU 또는 GPU 사용량에 따라 분배 비율을 결정되는 경우에도 사용자가 이용하는 어플리케이션(application)의 실행 여부, 카메라 사용 여부 등에 따라 디바이스의 상태가 달라지므로 추론 분산 비율이 결정된 이후, 디바이스의 CPU 또는 GPU 사용량에 따라 정확하게 분배되지 않을 수 있다.

일 실시예에 따른 전자 장치(100)는 상태 예측 모델을 이용하여 각 디바이스의 상태 정보를 입력으로 하여, 인공신경망(10)을 이용하여 추론하는 과정을 수행할 시점에서 각 디바이스의 상태를 추론할 수 있다. 추론된 각 디바이스의 상태에 따라 추론 분산 비율을 결정하기 때문에, 각 디바이스의 사용량에 따라 동적(dynamic)으로 각 디바이스의 추론 분산 비율이 보다 정확하게 결정될 수 있다.

이하 도 3, 도 4 및 도 5를 참조하여 동적으로 인공신경망의 추론 분산 비율을 결정하는 전자 장치(100)를 상세하게 설명한다.

도 3을 참조하면, 도 2의 전자 장치(100)는 상태 추론부(121) 및 추론 비율 연산부(123)를 포함할 있다. 다만, 전자 장치(100)에 포함되는 기능은 이에 한정되지 않는다. 전자 장치(100)는 일부 구성을 생략할 수 있고, 다른 기능을 수행하는 구성을 추가로 포함할 수 있다. 예를 들어, 일 실시예에 따른 전자 장치(100)는 카메라부, 디스플레이부등을 더 포함할 수 있다.

여기서, 상태 추론부(121)는 도 2의 인공신경망(10)과는 별개의 인공신경망 모델로 디바이스의 상태 정보를 입력하면 입력된 시점 이후의 디바이스의 상태 정보를 예측하도록 학습된 상태 추론 모델을 포함할 수 있다. 여기서 상태 추론 모델은 순환 신경망으로 구현될 수 있다.

일 실시예에 따른 상태 추론 모델은 소정의 제3 시점의 학습용 상태 정보 및 상기 소정의 제3 시점으로부터 소정의 시간 간격 이후인 제4 시점의 정답용 상태 정보를 입력으로 하여, 회귀 (regression) 학습된 것일 수 있다.

다시 말해, 상태 추론 모델은 학습용 상태 정보를 입력으로 하여 추론된 상태 정보와 정답용 상태 정보를 Ground trugh로 보아 손실 함수를 연산하고, 연산된 손실 함수(loss function)의 출력 값이 줄어들도록 학습될 수 있다.

상태 추론부(121)는 인공신경망(10)을 분산 추론하기 위한 네트워크에 연결된 복수의 디바이스로부터 수신 받은 소정의 제1 시점에서 각 디바이스의 제1 상태 정보를 입력받을 수 있다. 또한, 상태 추론 모델은 각 디바이스의 제1 상태 정보를 입력으로 하여, 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점에서의 각 디바이스의 제2 상태 정보를 추론할 수 있다.

또한, 상태 추론부(121)는 제1 시점 이전의 각 디바이스의 상태 정보를 추가로 입력받아 제2 시점에서의 각 디바이스의 제2 상태 정보를 추론할 수도 있다.

여기서, 각 디바이스의 제1 상태 정보 및 제2 상태 정보는 인공신경망을 이용하여 추론하기 위한 각 디바이스의 연산 가능한 양과 관계가 있는 상태 정보 일 수 있다. 예를 들어, 일 실시예에 따른 제1 상태 정보 및 제2 상태 정보는 각 디바이스의 CPU(center processing unit)의 사용률, GPU(graphic processing unit)의 사용률, CPU의 온도, GPU의 온도, 실행 중인 어플리케이션(application)의 개수 및 경과 시간(elapsed time) 중 적어도 하나를 포함할 수 있다.

여기서, 경과 시간은 단위시간에 처리할 수 있는 명령어수로 컴퓨터의 연산속도를 나타내는 단위인 플롭스(FLOPS, floating-point operations per second)의 역수를 의미할 수 있다. 또한, 본 명세서에서 경과 시간은 심층 신경망 모델의 1 블록당 예상 연산 소요시간을 의미할 수 있다. 즉, 경과 시간은 디바이스가 도2의 인공신경망(10)을 처리할 수 있는 정도를 나타내는 기준이 될 수 있다.

일 실시예에 따른 상태 추론부(121)는 소정의 디바이스의 제1 상태 정보를 입력하여 제2 시점에서 경과 시간을 추론할 수 있고, 또는 제2 상태 정보로 소정의 디바이스의 CPU(center processing unit)의 사용률, GPU(graphic processing unit)의 사용률, CPU의 온도, GPU의 온도 및 실행 중인 어플리케이션(application)의 개수를 추론하여 추론된 제2 상태 정보를 이용하여 제2 시점에서의 경과 시간을 연산할 수도 있다.

또한, 일 실시예에 따른 상태 추론부(121)는 제1 상태 정보 이외에 소정의 어플리케이션 실행 여부, 화면 켜짐 여부 및 카메라 실행 여부 중 적어도 하나를 포함하는 제3 상태 정보를 추가로 입력받을 수 있다. 소정의 어플리케이션이 실행되는 경우, 화면이 켜지게 되는 경우 및 카메라가 실행되는 경우에 디바이스에서 CPU 및 GPU 사용량이 증가할 것으로 예측할 수 있으므로, 이에 대한 입력을 추가로 입력 받아, 제2 시점에서 경과 시간을 추론할 수 있다.

이 경우, 상태 추론부(121)에 포함된 상태 추론 모델은 소정의 제3 시점의 소정의 어플리케이션 실행 여부, 화면 켜짐 여부 및 카메라 실행 여부 중 적어도 하나를 포함하는 학습용 상태 정보 및 제4 시점의 정답용 상태 정보를 입력받아 학습될 수 있다.

추론 비율 연산부(123)는 상태 추론부(121)로부터 각 디바이스의 제2 상태 정보를 입력받아, 도 2의 인공신경망(10)의 추론 분산 비율을 연산할 수 있다. 일 실시예에 따른 추론 비율 연산부(123)는 하기의 수학식 1과 같이 각 디바이스의 경과 시간의 역수를 정규화할 수 있다. 또한, 정규화된 경과 시간의 역수를 상기 인공신경망의 추론 분산 비율(r_i)로 결정할 수 있다.

여기서, t_i는 i번째 디바이스의 추론된 제2 시점의 경과 시간을 의미할 수 있고, n은 복수의 디바이스 전체 개수를 의미할 수 있다.

예를 들어, 도 2의 제1 디바이스(200)의 예측된 경과 시간이 0.5이고, 제2 디바이스(300)의 예측된 경과 시간이 0.4이고, 제3 디바이스(400)의 예측된 경과 시간이 0.4이고, 전자 장치(100)의 예측된 경과 시간이 0.1인 경우, 제1 디바이스(200)의 추론 분산 비율은 0.1176이고, 제2 디바이스(300) 및 제3 디바이스(400)의 추론 분산 비율은 0.1471이고, 전자 장치(100)의 추론 분산 비율은 0.5882로 결정될 수 있다.

다시 도 2를 참조하면, 일 실시예에 따른 전자 장치(100)는 결정된 각 디바이스의 추론 분산 비율 및 인공신경망의 추론 과정의 시작점을 전달할 수 있다. 이 경우, 복수의 디바이스는 인공신경망(10) 전체 구조를 저장하고 있을 수 있다. 예를 들어, 결정된 제1 디바이스(200)의 추론 분산 비율이 0.1176이면, 전자 장치(100)는 제1 디바이스(200)에 결정된 추론 분산 비율 0.1176과 시작점을 전달할 수 있다. 또한, 결정된 제2 디바이스(300)의 추론 분산 비율이 0.1471이면, 전자 장치(100)는 결정된 추론 분산 비율 0.1471 및 시작점인 전체 인공신경망(10)의 11.76 % 지점을 송신할 수 있다. 이와 같이 각 디바이스에 추론 분산 비율과 시작점을 할당하여, 각 디바이스가 분산된 인공신경망(10)의 추론 과정을 수행할 수 있다.

도 4는 일 실시예에 따른 전자 장치가 제1 디바이스의 제1 상태 정보를 입력받아 제2 상태 정보를 추론하는 동작을 설명하기 위한 도면이다.

도 4를 참조하면, 상태 추론부(121)는 도 2의 제1 디바이스(200)에 대한 제1 시점(T)에서의 제1 상태 정보(450), 제1 시점(T) 이전의 소정 시점(T-1)의 상태 정보(430)와 그 이전 시점(T-2)의 상태 정보(410)를 입력 받을 수 있다. 도 4에서는 3개 시점의 제1 디바이스(200)에 대한 상태 정보를 입력 받는 것으로 도시되어 있으나, 제1 시점(T)의 상태 정보(450) 만을 입력 받을 수도 있고, 제1 시점(T)의 상태 정보(450) 및 제1 시점 이전의 시점(T-1)의 상태 정보(430) 만을 입력 받을 수도 있다.

여기서 제1 상태 정보(450)는 CPU 사용량, GPU 사용량, 실행되는 어플리케이션의 개수, CPU의 온도, GPU의 온도 및 경과 시간(Elapsed time)을 포함할 수 있다.

상태 추론부(121)는 3개 시점의 상태 정보(410,430,450)를 입력 받아, 제2 시점(T+1)에서의 도 2의 제1 디바이스(200)에 대한 제2 상태 정보(470)를 추론할 수 있다. 여기서 추론된 제2 상태 정보(470)는 CPU 사용량 50%, GPU 사용량 65%, 실행되는 어플리케이션의 개수 23개, CPU 온도 58 ℃, GPU 온도 57 ℃ 및 경과 시간 0.65초 일 수 있다.

상태 추론부(121)가 제2 시점(T+1) 이후의 시점에서 도 2의 제1 디바이스(200)에 대한 상태를 추론하는 경우, 추론된 제2 상태 정보(470)가 다시 입력으로 이용될 수 있다.

도 5는 일 실시예에 따른 전자 장치가 제1 상태 정보 및 제3 상태 정보를 입력받아 제2 상태 정보를 추론하는 동작을 설명하기 위한 예시적인 도면이다.

도 5를 참조하면, 상태 추론부(121)는 도 4의 입력된 상태 정보(410,430,450) 이외에 제3 상태 정보(501)를 추가로 입력 받을 수 있다. 제1 시점(T)에서 입력받은 제3 상태 정보(501)는 특정 어플리케이션(App 1)의 실행 여부 및 화면 켜짐 여부를 포함할 수 있다. 이 경우, 미리 학습된 상태 추론 모델은 도 4의 제2 상태 정보(470)에서 보다 더 많은 CPU 사용, GPU 사용을 추론할 수 있으며, 더 높은 CPU 온도 및 GPU 온도도 추론할 수 있다.

또한, 상태 추론부(121)는 제3 상태 정보(501)를 입력 받아, 도 4의 제2 상태 정보(470)의 경과 시간 0.65초 보다 더 긴 제1 디바이스(200)의 경과 시간 0.85초를 추론할 수 있다. 상태 추론부(121)로부터 제2 상태 정보(503)를 전달받은 도 3의 추론 비율 연산부(123)는 추론된 경과 시간을 기초로 상기 수학식 1에 따라 제1 디바이스(200)의 추론 분산 비율을 더 낮게 결정할 수 있다.

도 5에서는 디바이스의 제3 상태 정보가 특정 어플리케이션의 실행 여부 및 화면 켜짐 여부를 포함하는 것으로 설명하였지만 이는 예시적인 것에 불과하며, 제3 상태 정보는 GPU 또는 CPU가 소모될 수 있는 환경이 조성될 수 있는 기 공지된 디바이스의 상태 정보일 수 있다. 예를 들어, 제3 상태 정보는 카메라 켜짐 여부를 더 포함할 수 있다.

상태 추론부(121)가 CPU 또는 GPU 사용량을 포함하는 제1 상태 정보 이외에 이후 디바이스의 CPU 또는 GPU 사용량을 크게 변화시킬 수 있는 제3 상태 정보를 추가로 획득하여 제2 상태 정보를 추론할 수 있기 때문에, 특정 어플리케이션의 실행으로 CPU 또는 GPU 사용량이 크게 늘어날 것을 보다 정확하게 예측하여 추론 분산 비율에 반영될 수 있는 효과를 포함하는 다양한 효과가 존재할 수 있다.

다시 도 2를 참조하면, 일 실시예에 따라 분산 추론 시스템에 포함된 복수의 디바이스의 저장 공간 절약을 위해 복수의 디바이스에 인공신경망(10)이 저장되어 있지 않을 수 있다. 이 경우, 전자 장치(100)에는 인공신경망(10)이 저장되어 있고, 전자 장치(100)가 결정한 추론 분산 비율에 따라, 각 디바이스가 수행할 인공신경망(10)의 추론 과정에 필요한 인공신경망(10)의 일부를 전송할 수 있다.

도 2 및 도 6을 참조하면, 전자 장치(100)가 제1 디바이스(200), 제2 디바이스(300), 제3 디바이스(400) 및 전자 장치(100)의 추론 분산 비율을 결정하고, 각 디바이스의 추론 분산 비율에 따라 할당된 도 2의 인공신경망 일부를 전송할 수 있다. 이 경우, 제1 디바이스(200), 제2 디바이스(300) 및 제3 디바이스(400)에는 추론을 위한 인공신경망이 저장되어 있지 않을 수 있고, 전자 장치(100)에는 상기 인공신경망이 저장되어 있을 수 있다.

전자 장치(100)는 제1 디바이스(200)의 추론 분산 비율이 0.25로 결정되면, 제1 디바이스(200)에 전체 인공신경망의 처음부터 25%에 해당하는 제1 과정(61)을 송신할 수 있다. 또한, 전자 장치(100)는 제2 디바이스(200)의 추론 분산 비율이 0.1로 결정되면, 제2 디바이스(300)에 전체 인공신경망의 25% 지점에서 전체 추론 과정의 10%에 해당하는 제2 과정(63)을 송신할 수 있고, 제3 디바이스(400)의 추론 분산 비율이 0.25로 결정되면 제3 디바이스(400)에 전체 인공신경망의 35% 지점에서 전체의 25%에 해당하는 제3 과정(65)을 송신할 수 있다. 이 경우, 전자 장치(100)는 전체 인공신경망의 60% 지점에서 시작하는 전체 인공신경망의 40%에 해당하는 추론 과정을 수행할 수 있다.

이하에서는 각 디바이스가 수행할 추론 과정이 송신된 이후에 추론 과정 및 추론 분산 비율 재설정 과정을 설명한다.

제1 디바이스(200)는 추론을 수행할 인공신경망의 입력 값을 입력으로 제1 과정(61)을 수행하고 제1 중간 결과 값을 획득할 수 있다. 이어서, 제1 디바이스(200)는 획득된 제1 중간 결과 값 및 제1 과정(61)을 수행한 시점에서 제1 디바이스(200)의 상태 정보를 제2 디바이스(300)에게 송신할 수 있다.

제2 디바이스(300)는 수신된 제1 중간 결과 값을 제2 과정(63)의 입력으로 하여 제2 중간 결과 값을 획득할 수 있다. 이어서, 제2 디바이스(300)는 획득된 제2 중간 결과 값, 제2 과정(63)을 수행한 시점에서 제2 디바이스(300)의 상태 정보 및 수신받은 제1 디바이스(200)의 상태 정보를 제3 디바이스(400)에게 송신할 수 있다.

제3 디바이스(400)는 수신된 제2 중간 결과 값을 제3 과정(65)의 입력으로 하여 제3 중간 결과 값을 획득할 수 있다. 이어서, 제3 디바이스(400)는 획득된 제3 중간 결과 값, 제3 과정(65)을 수행한 시점에서 제3 디바이스(400)의 상태 정보, 수신된 제1 디바이스(200), 제2 디바이스(300)의 상태 정보를 전자 장치(100)에게 송신할 수 있다.

전자 장치(100)는 수신된 제3 중간 결과 값을 인공신경망의 나머지 과정의 입력으로 하여 최종 추론 결과를 획득할 수 있고, 수신된 각 디바이스의 상태 정보 및 최종 추론 결과를 획득한 시점의 전자 장치(100)의 상태 정보를 기초로 이후 시점의 각 디바이스의 상태 정보를 추론하여 추론 분산 비율을 재설정할 수 있다.

다시 도 1을 참조하면, 복수의 디바이스 중에서 기 선정된 추론 분산 비율을 결정하는 전자 장치(100)는 다른 디바이스에 비하여 네트워크 연결이 좋거나 수행 가능한 연산량이 큰 디바이스일 수 있다. 다시 말해, 전자 장치(100)는 복수의 디바이스 중에서 각 디바이스의 네트워크 상태에 기초하여 결정된 디바이스일 수 있다.

여기서, 네트워크 상태는 복수의 디바이스 중에서 임의로 선정된 제1 디바이스가 상기 제1 디바이스와는 상이한 각 디바이스로부터 수신한 테스트 정보에 의한 각 디바이스의 네트워크 I/O(input/output) 패킷량일 수 있다.

또한, 전자 장치(100)는 복수의 디바이스 중에서 네트워크 I/O 패킷량이 소정의 패킷량 이하인 적어도 하나의 후보 디바이스가 선정되고, 적어도 하나의 후보 디바이스 중에서 유선 네트워크로 연결된 하나의 후보 디바이스일 수 있다.

일 실시예에 따른 전자 장치(100)는 적어도 하나의 후보 디바이스 중에서 GPU 처리량이 가장 높은 후보 디바이스일 수 있다.

이와 같이, 복수의 디바이스 중에서 임의로 선정된 제1 디바이스가 추론 분산 비율을 결정하는 전자 장치(100)를 선정할 수 있다.

이하 도 7을 참조하여 분산 추론 시스템에 포함되지 않는 디바이스에 의해 추론 분산 비율을 결정하는 전자 장치(100)를 선정하는 방법을 설명한다.

도 7은 복수의 디바이스 중에서 인공신경망의 추론 비율을 결정하는 전자 장치를 선정하는 예시적인 도면이다.

도 7을 참조하면, 전자 장치(100), 제1 디바이스(200), 제2 디바이스(300) 및 제3 디바이스(400) 이외에 인공신경망의 추론 비율을 결정하는 전자 장치를 선정하기 위한 제4 디바이스(500)가 존재할 수 있다.

제4 디바이스(500)는 각 디바이스로부터 테스트 정보를 수신받고, 수신된 테스트 정보에 의해 각 디바이스의 네트워크 I/O 패킷량을 측정할 수 있다.

제4 디바이스(500)는 전자 장치(100), 제1 디바이스(200), 제2 디바이스(300) 및 제3 디바이스(400) 중에서 네트워크 I/O 패킷량이 소정의 패킷량 이하인 적어도 하나의 후보 디바이스를 선정할 수 있다. 이 경우, 선정된 후보 디바이스가 전자 장치(100) 1개 라면, 제4 디바이스(500)는 전자 장치(100)를 인공신경망의 추론 분산 비율을 결정하는 전자 장치로 선정할 수 있다.

또한, 제4 디바이스(500)는 선정된 후보 디바이스 중에서 유선 네트워크로 연결된 디바이스가 존재하는 지 여부를 판단할 수 있다. 제4 디바이스(500)는 후보 디바이스 중에서 유선 네트워크로 연결된 디바이스가 존재하는 경우, 유선 네트워크로 연결된 후보 디바이스 중에서, GPU 처리량이 가장 높은 디바이스를 인공신경망의 추론 분산 비율을 결정하는 전자 장치로 선정할 수 있다.

후보 디바이스 중에서 유선 네트워크로 연결된 디바이스가 존재하지 않는 경우, 제4 디바이스(500)는 복수의 후보 디바이스 중에서 GPU 처리량이 가장 높은 디바이스를 인공신경망의 추론 분산 비율을 결정하는 전자 장치로 선정할 수 있다.

일 실시예에 따른 복수의 디바이스 중에서 선정된 전자 장치(100)는 다른 디바이스에 대해 좋은 네트워크 환경을 지닌 디바이스이거나, GPU 처리량이 높은 디바이스이므로, 인공 신경망의 분산 추론을 보다 안정적으로 수행할 수 있다.

도 8을 참조하면, 일 실시예에 따른 전자 장치(100)는 메모리(110), 프로세서(120) 및 송수신부(130)를 포함할 수 있다. 다양한 실시 예에 따르면, 전자 장치(100)의 구성은 도 8에 도시된 바에 한정되지 않으며, 도 8에 도시되지 않은 구성을 추가로 포함하거나 도 8에 도시된 구성 중 일부를 생략할 수도 있다.

예를 들면, 도 8에는 도시되어 있지 않지만 전자 장치(100)는 인공신경망 및 입력 데이터를 입력받을 수 있는 입력부, 결과를 출력할 수 있는 출력부를 더 포함할 수 있다.

또한 후술할 프로세서(120)의 동작은 메모리(110)에 저장된 소프트웨어 모듈로 구현될 수도 있다. 예컨대, 소프트웨어 모듈은 메모리(110)에 저장될 수 있고, 프로세서(120)에 의해 실행됨으로써 동작될 수 있다.

메모리(110)는 프로세서(120)와 전기적으로 연결되고 전자 장치(100)에 포함된 구성들의 동작과 관련된 명령 또는 데이터를 저장할 수 있다. 다양한 실시 예에 따르면, 메모리(110)는 송수신부(130)를 이용하여 획득된 각 디바이스의 제1 상태 정보, 제3 상태 정보, 인공신경망 모델, 상태 추론 모델의 추론을 수행하기 위한 동작들에 대한 인스트럭션들(instructions) 등을 저장할 수 있다.

일 실시 예에 따르면, 메모리(110)는 전자 장치(100)의 기능을 개념적으로 구분한 각 부에 포함되는 적어도 일부의 모듈들이 프로세서(120)에 의해 실행되는 소프트웨어로 구현되는 경우 그러한 소프트웨어 모듈을 실행하기 위한 인스트럭션들을 저장할 수도 있다.

프로세서(120)는 전자 장치(100)에 포함된 구성들과 전기적으로 연결되어, 전자 장치(100)에 포함된 구성들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 실행할 수 있다. 일 실시 예에 따르면, 프로세서(120)는 다른 구성들 중 적어도 하나로부터 수신된 명령 또는 데이터를 메모리(110)에 로드하여 처리하고, 결과 데이터를 메모리(110)에 저장할 수 있다.

또한, 도 8에서는 설명의 편의를 위해 프로세서(120)가 하나의 프로세서(120)로 동작하는 것으로 표현하였으나, 후술할 학습 모델 및 전자 장치의 기능을 개념적으로 구분한 적어도 하나의 기능을 복수의 프로세서로 구현될 수 있다. 이 경우, 프로세서(120)는 하나의 프로세서(120)로서 동작하는 것이 아니라, 복수의 프로세서가 별개의 하드웨어로 구현되어 각 동작을 수행하도록 구현될 수 있다. 이에 한정되지 않는다.

송수신부(130)는 전자 장치(100)와 외부의 다른 전자 장치 사이의 유선 또는 무선 통신 채널의 수립 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다.

또한, 다양한 실시 예에 따르면, 송수신부(130)는 무선 통신 모듈(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있고, 그 중 해당하는 통신 모듈을 이용하여 근거리 통신 네트워크 (예: 블루투스, WiFi direct 또는 IrDA(infrared data association)) 또는 원거리 통신 네트워크(예: 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN))를 통하여 외부 전자 장치와 통신할 수 있다.

도 2의 인공신경망의 분산 추론을 위한 복수 디바이스는 상술한 전자 장치(100)의 메모리(110), 프로세서(120) 및 송수신부(130)와 동일한 기능을 수행하는 구성을 각각 포함할 수 있다. 각 구성의 기능은 상술한 바와 같으므로 상세한 설명은 생략하기로 한다.

도 9는 일 실시예에 따른 전자 장치를 선정하는 디바이스의 구성을 나타내는 블록도이다.

도 9를 참조하면, 일 실시예에 따른 제4 디바이스(500)는 메모리(510), 프로세서(520) 및 송수신부(530)를 포함할 수 있다. 다양한 실시 예에 따르면, 전자 장치의 구성은 도 9에 도시된 바에 한정되지 않으며, 도 9에 도시되지 않은 구성을 추가로 포함하거나 도 9에 도시된 구성 중 일부를 생략할 수도 있다.

메모리(510)는 프로세서(520)와 전기적으로 연결되고 전자 장치에 포함된 구성들의 동작과 관련된 명령 또는 데이터를 저장할 수 있다. 다양한 실시 예에 따르면, 메모리(510)는 송수신부(530)를 이용하여 획득된 네트워크 I/O 패킷량을 이용하여 추론 분산 비율을 선정하는 전자 장치를 결정하는 동작들에 대한 인스트럭션들(instructions) 등을 저장할 수 있다.

프로세서(520)는 전자 장치에 포함된 구성들과 전기적으로 연결되어, 전자 장치에 포함된 구성들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 실행할 수 있다. 일 실시 예에 따르면, 프로세서(520)는 다른 구성들 중 적어도 하나로부터 수신된 명령 또는 데이터를 메모리(510)에 로드하여 처리하고, 결과 데이터를 메모리(510)에 저장할 수 있다.

또한, 도 9에서는 설명의 편의를 위해 프로세서(520)가 하나의 프로세서(520)로 동작하는 것으로 표현하였으나, 후술할 학습 모델 및 전자 장치의 기능을 개념적으로 구분한 적어도 하나의 기능을 복수의 프로세서로 구현될 수 있다. 이 경우, 프로세서(520)는 하나의 프로세서(520)로서 동작하는 것이 아니라, 복수의 프로세서가 별개의 하드웨어로 구현되어 각 동작을 수행하도록 구현될 수 있다.

송수신부(530)는 전자 장치와 외부의 다른 전자 장치 사이의 유선 또는 무선 통신 채널의 수립 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 일 실시 예에 따르면, 송수신부(530)는 유선 통신 또는 무선 통신을 통해 외부의 다른 전자 장치로부터 데이터를 수신하거나 또는 외부의 다른 기지국을 제어하는 서버를 포함하는 전자 장치에 대해 데이터를 송신할 수 있다.

다양한 실시 예에 따르면, 송수신부(530)는 무선 통신 모듈(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있고, 그 중 해당하는 통신 모듈을 이용하여 근거리 통신 네트워크 (예: 블루투스, WiFi direct 또는 IrDA(infrared data association)) 또는 원거리 통신 네트워크(예: 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN))를 통하여 외부 전자 장치와 통신할 수 있다.

도 2 및 도 10을 참조하면, 전자 장치(100)는 복수의 디바이스로부터 각각 미리 정해진 제1 시점의 제1 상태 정보를 획득할 수 있다(S1010).

여기서, 제1 상태 정보는 각 디바이스의 CPU의 사용률, GPU의 사용률, CPU의 온도, GPU의 온도, 실행 중인 어플리케이션의 개수 및 경과 시간 중 적어도 하나를 포함할 수 있다.

전자 장치(100)는 제1 시점에서 소정의 어플리케이션 실행 여부, 화면 켜짐 여부 및 카메라 실행 여부 중 적어도 하나를 포함하는 제3 상태 정보를 획득할 수 있다.

또한, 전자 장치(100)는 적어도 제1 상태 정보를 입력된 시점 이후의 상태 정보를 예측하도록 학습된 상태 추론 모델에 입력하여 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점의 각 디바이스의 제2 상태 정보를 획득할 수 있다(S1020).

상태 추론 모델은 소정의 제3 시점의 학습용 상태 정보 및 상기 소정의 제3 시점으로부터 소정의 시간 간격 이후인 제4 시점의 정답용 상태 정보를 입력으로 하여, 회귀 (regression) 학습된 것일 수 있다.

여기서, 제2 상태 정보는 제2 시점의 각 디바이스의 CPU의 사용률, GPU의 사용률, CPU의 온도, GPU의 온도, 실행 중인 어플리케이션의 개수 및 경과 시간 중 적어도 하나를 포함할 수 있다.

전자 장치(100)는 획득된 각 디바이스의 제2 상태 정보에 기초하여, 각 디바이스의 인공신경망의 추론 분산 비율을 결정할 수 있다(S1030).

전자 장치(100)는 각 디바이스의 상기 경과 시간의 역수를 정규화할 수 있고, 정규화된 경과 시간의 역수를 인공신경망의 추론 분산 비율로 결정할 수 있다.

도 11은 일 실시예에 따른 인공신경망의 추론 분산 비율을 결정하는 전자 장치를 선정하는 방법을 나타내는 순서도이다.

도 11을 참조하면, 복수의 디바이스 중에서 제1 디바이스가 무작위로 선정될 수 있다(S1110).

무작위로 선정된 제1 디바이스는 제1 디바이스 이외의 복수의 디바이스로부터 테스트 정보를 수신 받고(S1120), 각 디바이스의 네트워크 I/O 패킷량이 소정의 패킷량 이하인지를 판단하여, 네트워크 I/O 패킷량이 소정의 패킷량 이하인 적어도 하나의 후보 디바이스를 선정할 수 있다(S1130).

제1 디바이스는 선정된 후보 디바이스 중에서 유선 네트워크에 연결된 디바이스가 존재하는 지 여부를 판단(S1140)하여 유선 네트워크에 연결된 디바이스가 존재하는 경우(S1140의 예), 유선 네트워크에 연결된 디바이스를 다시 후보 디바이스로 선정할 수 있다(S1150).

선정된 후보 디바이스 중에서, GPU 성능이 가장 좋은 디바이스가 인공신경망의 추론 분산 비율을 결정하는 전자장치로 선정될 수 있다(S1160).

일 실시예에 따른 인공 신경망을 분할 추론하기 위해 복수의 디바이스의 추론 분산 비율을 결정하는 전자 장치는 상태 정보를 입력하면 입력된 시점 이후의 상태 정보를 예측하도록 학습된 상태 추론 모델이 저장된 메모리, 송수신부 및 상기 메모리에 저장된 하나 이상의 인스트럭션들을 실행하는 적어도 하나의 프로세서를 포함할 수 있다. 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시 상기 송수신부를 통해 상기 복수의 디바이스의 미리 정해진 제1 시점에서 제1 상태 정보를 획득할 수 있다. 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시 상기 적어도 제1 상태 정보를 상기 상태 추론 모델에 입력하여 상기 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점의 각 디바이스의 제2 상태 정보를 획득할 수 있다. 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시 상기 획득된 각 디바이스의 제2 상태 정보에 기초하여, 상기 각 디바이스의 상기 인공신경망의 추론 분산 비율을 결정할 수 있다. 상기 전자 장치는 상기 복수의 디바이스의 네트워크 상태에 기초하여 상기 복수의 디바이스 중에서 결정된 것일 수 있다.

상기 제1 상태 정보 및 제2 상태 정보는, 각 디바이스의 CPU(center processing unit)의 사용률, GPU(graphic processing unit)의 사용률, CPU의 온도, GPU의 온도, 실행 중인 어플리케이션(application)의 개수 및 경과 시간(elapsed time) 중 적어도 하나를 포함할 수 있다.

상기 제2 상태 정보는, 경과 시간을 포함하고, 상기 적어도 하나의 프로세서는, 각 디바이스의 상기 경과 시간의 역수를 정규화하고, 상기 정규화된 경과 시간의 역수를 각 디바이스의 상기 인공신경망의 추론 분산 비율로 결정할 수 있다.

상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시, 상기 제1 시점에서 소정의 어플리케이션 실행 여부, 화면 켜짐 여부 및 카메라 실행 여부 중 적어도 하나를 포함하는 제3 상태 정보를 더 획득하고, 상기 상태 추론 모델에 상기 제3 상태 정보를 더 입력하여 상기 제2 상태 정보를 획득할 수 있다.

상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시 각 디바이스에 상기 결정된 추론 분산 비율 및 상기 인공신경망의 추론 시작점을 상기 송수신부를 통해 전송할 수 있다.

상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시 상기 인공신경망을 상기 결정된 추론 분산 비율에 따라 분할하고, 상기 분할된 인공신경망을 상기 추론 분산 비율에 대응되는 각 디바이스에 송수신부를 통해 전송할 수 있다.

상기 상태 추론 모델은, 소정의 제3 시점의 학습용 상태 정보 및 상기 소정의 제3 시점으로부터 소정의 시간 간격 이후인 제4 시점의 정답용 상태 정보를 입력으로 하여, 회귀 (regression) 학습된 것일 수 있다.

상기 네트워크 상태는, 상기 복수의 디바이스 중에서 임의로 선정된 제1 디바이스가 상기 제1 디바이스와는 상이한 각 디바이스로부터 수신한 테스트 정보에 의한 각 디바이스의 네트워크 I/O(input/output) 패킷량일 수 있다.

일 실시예에 따른 인공신경망의 추론 분산 비율을 결정하는 방법은 상기 전자 장치를 포함하는 복수의 디바이스로부터 각각 미리 정해진 제1 시점의 제1 상태 정보를 획득하는 단계; 상기 적어도 제1 상태 정보를 입력된 시점 이후의 상태 정보를 예측하도록 학습된 상태 추론 모델에 입력하여 상기 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점의 각 디바이스의 제2 상태 정보를 획득하는 단계; 및 상기 획득된 각 디바이스의 제2 상태 정보에 기초하여, 상기 각 디바이스의 상기 인공신경망의 추론 분산 비율을 결정하는 단계를 포함하되, 상기 전자 장치는 상기 복수의 디바이스의 네트워크 상태에 기초하여 상기 복수의 디바이스 중에서 결정된 것일 수 있다.

상기 제1 상태 정보 및 제2 상태 정보는, 각 디바이스의 CPU(center processing unit)의 사용률, GPU의 사용률, CPU의 온도, GPU의 온도, 실행 중인 어플리케이션(application)의 개수 및 경과 시간(elapsed time) 중 적어도 하나를 포함할 수 있다.

상기 제2 상태 정보는, 경과 시간을 포함하고, 상기 추론 분산 비율을 결정하는 단계는, 각 디바이스의 상기 경과 시간의 역수를 정규화(normalization)하는 단계; 및 상기 정규화된 경과 시간의 역수를 상기 인공신경망의 추론 분산 비율로 결정하는 단계를 포함할 수 있다.

상기 제1 상태 정보를 획득하는 단계는, 상기 제1 시점에서 소정의 어플리케이션 실행 여부, 화면 켜짐 여부 및 카메라 실행 여부 중 적어도 하나를 포함하는 제3 상태 정보를 획득하는 단계를 더 포함하고, 상기 제2 상태 정보를 획득하는 단계는, 상기 상태 추론 모델에 상기 제3 상태 정보를 더 입력하여 상기 제2 상태 정보를 획득하는 단계를 포함할 수 있다.

상기 방법은, 각 디바이스에 상기 결정된 추론 분산 비율 및 상기 인공신경망의 추론 시작점을 전송하는 단계를 더 포함할 수 있다.

상기 방법은, 상기 인공신경망을 상기 결정된 추론 분산 비율에 따라 분할하는 단계; 상기 분할된 인공신경망을 상기 추론 분산 비율에 대응되는 각 디바이스에 전송하는 단계를 더 포함할 수 있다.

기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적 저장매체'는 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다. 예로, '비일시적 저장매체'는 데이터가 임시적으로 저장되는 버퍼를 포함할 수 있다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 컴퓨터 판독 가능한 매체는, 하나 이상의 프로그램 코드(code)를 포함할 수 있다. 하나 이상의 프로그램 코드는 전자 장치에서 실행될 때, 상기 전자 장치를 포함하는 복수의 디바이스로부터 각각 미리 정해진 제1 시점의 제1 상태 정보를 획득하는 단계; 상기 적어도 제1 상태 정보를 입력된 시점 이후의 상태 정보를 예측하도록 학습된 상태 추론 모델에 입력하여 상기 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점의 각 디바이스의 제2 상태 정보를 획득하는 단계; 및 상기 획득된 각 디바이스의 제2 상태 정보에 기초하여, 상기 각 디바이스의 상기 인공신경망의 추론 분산 비율을 결정하는 단계를 포함하는 방법을 실행하되, 상기 전자 장치는 상기 복수의 디바이스의 네트워크 상태에 기초하여 상기 복수의 디바이스 중에서 결정된 것일 수 있다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서 개시된, 기록매체는, 개시된 방법의 실시예들 중에서 적어도 하나를 실행시키기 위한 프로그램이 저장된 것일 수 있다.

일 실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어를 통해 또는 두개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품(예: 다운로더블 앱(downloadable app))의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.

이상에서 본 발명의 실시예를 첨부 도면을 참조하여 도시하고 설명하였다. 본 명세서 및 도면에 개시된 실시예들은 개시의 기술적 내용을 쉽게 설명하고 개시의 이해를 돕기 위해 구체적인 예를 제공하기 위한 것일 뿐, 개시의 범위를 한정하려는 것은 아니다. 당업자는 본 발명의 기술적 사상이나 본질적인 특징을 변경하지 않고, 첨부된 청구범위 및 그 균등물에 의해 청구되는 개시의 요지를 벗어나지 않는 범위에서 다른 구체적인 형태로 용이하게 변형될 수 있음을 이해할 것이다. 따라서, 본 발명의 범위는 여기에 개시된 실시예 외에도 본 발명의 기술적 사상에 기초하여 도출되는 모든 변경 또는 수정된 것을 포함하는 것으로 해석되어야 한다.

Claims

전자 장치(100)에 있어서,

상태 추론 모델 및 적어도 하나의 인스트럭션이 저장된 메모리(110);

송수신부(130); 및

상기 하나 이상의 인스트럭션들을 실행하는 적어도 하나의 프로세서(120)를 포함하고,

상기 적어도 하나의 프로세서(120)는,

상기 송수신부(130)를 통해 복수의 디바이스 각각으로부터 제1 시점에서 제1 상태 정보를 획득하고,

상기 제1 상태 정보를 상기 상태 추론 모델에 입력하여 상기 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점의 복수의 디바이스 각각의 제2 상태 정보를 획득하고,

상기 획득된 각 디바이스의 제2 상태 정보에 기초하여, 상기 복수의 디바이스 각각의 상기 인공신경망의 추론 분산 비율을 결정하되,

상기 전자 장치(100)는 상기 복수의 디바이스의 네트워크 상태에 기초하여 상기 복수의 디바이스 중에서 결정된 것인, 전자 장치.
제1항에 있어서,

상기 제1 상태 정보 및 제2 상태 정보는,

상기 복수의 디바이스 각각의 CPU(center processing unit)의 사용률, GPU(graphic processing unit)의 사용률, CPU의 온도, GPU의 온도, 실행 중인 어플리케이션(application)의 개수 및 경과 시간(elapsed time) 중 적어도 하나를 포함하는, 전자 장치.
제1항 또는 제2항에 있어서,

상기 제2 상태 정보는,

경과 시간을 포함하고,

상기 적어도 하나의 프로세서(120)는,

상기 복수의 디바이스 각각의 상기 경과 시간의 역수를 정규화하고,

상기 정규화된 경과 시간의 역수를 상기 복수의 디바이스 각각의 상기 인공신경망의 추론 분산 비율로 결정하는, 전자 장치.
제1항 내지 제3항 중 어느 한 항에 있어서,

상기 적어도 하나의 프로세서(120)는,

상기 제1 시점에서 소정의 어플리케이션 실행 여부, 화면 켜짐 여부 및 카메라 실행 여부 중 적어도 하나를 포함하는 제3 상태 정보를 더 획득하고,

상기 상태 추론 모델에 상기 제3 상태 정보를 더 입력하여 상기 제2 상태 정보를 획득하는, 전자 장치.
제1항 내지 제4항 중 어느 한 항에 있어서,

상기 적어도 하나의 프로세서(120)는,

상기 복수의 디바이스 각각에 상기 결정된 추론 분산 비율 및 상기 인공신경망의 추론 시작점을 상기 송수신부(130)를 통해 전송하는, 전자 장치.
제1항 내지 제5항 중 어느 한 항에 있어서,

상기 적어도 하나의 프로세서(120)는,

상기 인공신경망을 상기 결정된 추론 분산 비율에 따라 분할하고,

상기 분할된 인공신경망을 상기 추론 분산 비율에 대응되는 상기 복수의 디바이스 각각에 송수신부(130)를 통해 전송하는, 전자 장치.
제1항 내지 제6항 중 어느 한 항에 있어서,

상기 상태 추론 모델은,

제3 시점의 학습용 상태 정보 및 상기 제3 시점으로부터 소정의 시간 간격 이후인 제4 시점의 정답용 상태 정보를 입력으로 하여, 회귀 (regression) 학습된 것인, 전자 장치.
제1항 내지 제7항 중 어느 한 항에 있어서,

상기 네트워크 상태는,

제1 디바이스가 상기 제1 디바이스를 제외한 상기 복수의 디바이스 각각으로부터 수신한 테스트 정보에 의한 각 디바이스의 네트워크 I/O(input/output) 패킷량이고,

상기 제1 디바이스는 상기 복수의 디바이스 중에서 임의로 선정된 것인, 전자 장치.
제8항에 있어서,

상기 전자 장치(100)는,

상기 복수의 디바이스 중에서 네트워크 I/O 패킷량이 소정의 패킷량 이하인 적어도 하나의 후보 디바이스가 선정되고, 상기 적어도 하나의 후보 디바이스 중에서 유선 네트워크로 연결된 하나의 후보 디바이스인, 전자 장치.
제9항에 있어서,

상기 전자 장치(100)는,

상기 적어도 하나의 후보 디바이스 중에서 GPU 처리량이 가장 높은 후보 디바이스인, 전자 장치.
전자 장치(100)에 의해 수행되는 방법에 있어서,

상기 전자 장치(100)를 포함하는 복수의 디바이스 각각으로부터 제1 시점의 제1 상태 정보를 획득하는 단계(S1010);

상기 제1 상태 정보를 상태 추론 모델에 입력하여 상기 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점의 상기 복수의 디바이스 각각의 제2 상태 정보를 획득하는 단계(S1020); 및

상기 획득된 각 디바이스의 제2 상태 정보에 기초하여, 상기 복수의 디바이스 각각의 상기 인공신경망의 추론 분산 비율을 결정하는 단계(S1030)를 포함하되,

상기 전자 장치(100)는 상기 복수의 디바이스의 네트워크 상태에 기초하여 상기 복수의 디바이스 중에서 결정된 것인, 방법.
제11항에 있어서,

상기 제1 상태 정보 및 제2 상태 정보는,

상기 복수의 디바이스 각각의 CPU(center processing unit)의 사용률, GPU의 사용률, CPU의 온도, GPU의 온도, 실행 중인 어플리케이션(application)의 개수 및 경과 시간(elapsed time) 중 적어도 하나를 포함하는, 방법.
제11항 또는 제12항에 있어서,

상기 제2 상태 정보는,

경과 시간을 포함하고,

상기 추론 분산 비율을 결정하는 단계(S1030)는,

상기 복수의 디바이스 각각의 상기 경과 시간의 역수를 정규화(normalization)하는 단계; 및

상기 정규화된 경과 시간의 역수를 상기 복수의 디바이스 각각의 상기 인공신경망의 추론 분산 비율로 결정하는 단계를 포함하는, 방법.
제11항 내지 제13항 중 어느 한 항에 있어서,

상기 네트워크 상태는,

제1 디바이스가 상기 제1 디바이스를 제외한 상기 복수의 디바이스 각각으로부터 수신한 테스트 정보에 의한 각 디바이스의 네트워크 I/O(input/output) 패킷량이고,

상기 제1 디바이스는 상기 복수의 디바이스 중에서 임의로 선정된 것인, 방법.
방법을 수행하기 위해 프로세서에 의해 실행가능한 컴퓨터 판독가능한 프로그램 코드 또는 명령을 저장하기 위한 컴퓨터 판독가능 기록매체로서, 상기 방법은,

전자 장치(100)를 포함하는 복수의 디바이스 각각으로부터 제1 시점의 제1 상태 정보를 획득하는 단계(S1010);

상기 제1 상태 정보를 상태 추론 모델에 입력하여 상기 제1 시점으로부터 소정의 시간 간격 이후인 제2 시점의 상기 복수의 디바이스 각각의 제2 상태 정보를 획득하는 단계(S1020); 및

상기 획득된 각 디바이스의 제2 상태 정보에 기초하여, 상기 복수의 디바이스 각각의 상기 인공신경망의 추론 분산 비율을 결정하는 단계(S1030)를 포함하되,

상기 전자 장치(100)는 상기 복수의 디바이스의 네트워크 상태에 기초하여 상기 복수의 디바이스 중에서 결정된 것인, 컴퓨터 판독가능 기록 매체.