KR102427737B1

KR102427737B1 - 표현적 병목 현상이 최소화된 인공 신경망을 기반으로 하는 전자 장치 및 그의 동작 방법

Info

Publication number: KR102427737B1
Application number: KR1020200120504A
Authority: KR
Inventors: 한동윤; 윤상두; 허병호; 유영준
Original assignee: 네이버 주식회사; 라인 가부시키가이샤
Priority date: 2020-09-18
Filing date: 2020-09-18
Publication date: 2022-08-01
Also published as: JP2022051484A; KR20220037711A; JP7041244B1

Abstract

다양한 실시예들에 따른 전자 장치 및 그의 동작 방법은, 복수의 중간 레이어들을 갖는 인공 신경망을 기반으로, 입력되는 데이터를 처리하도록 구성될 수 있다. 다양한 실시예들에 따르면, 인공 신경망은, 중간 레이어들에서의 표현적 병목 현상이 최소화되도록 중간 레이어들의 가중치 매트릭스에 대한 랭크를 확장시키기 위해, 중간 레이어들의 각각에 대해 입력 채널 사이즈가 증가되고, 비선형 활성화 함수를 이용하며, 중간 레이어들 사이에서 확장 레이어들의 개수가 증가되도록 설계될 수 있다.

Description

표현적 병목 현상이 최소화된 인공 신경망을 기반으로 하는 전자 장치 및 그의 동작 방법{ELECTRONIC DEVICE BASED ON ARTIFICIAL NEURAL NETWORK THAT REPRESENTATIONAL BOTTLENECK IS MINIMIZED, AND OPERATING METHOD THEREOF}

다양한 실시예들은 표현적 병목 현상이 최소화된 인공 신경망을 기반으로 하는 전자 장치 및 그의 동작 방법에 관한 것이다.

콘볼루션 신경망(convolutional neural network; CNN)은 인공 신경망(artificial neural network)의 한 종류로, 데이터 처리를 위해 폭넓게 이용되고 있다. 콘볼루션 신경망의 계산 속도를 개선하기 위해, 중간 레이어(intermediate layer)들의 디멘션(dimension)이 감소되고 있다. 그러나, 중간 레이어들의 디멘션이 감소됨에 따라, 중간 레이어들의 한정된 랭크(rank)로 인해 표현적 병목 현상(representational bottleneck)이 발생되며, 이는 정보의 손실을 유발한다. 이로 인해, 콘볼루션 신경망의 정확성 및 효율성이 저하될 수 있다.

다양한 실시예들은, 표현적 병목 현상이 최소화된 인공 신경망을 기반으로 하는 전자 장치 및 그의 동작 방법을 제공한다.

다양한 실시예들에 따른 전자 장치의 동작 방법은, 입력되는 데이터를 검출하는 단계, 및 복수의 중간 레이어들을 갖는 인공 신경망을 기반으로, 상기 데이터를 처리하는 단계를 포함하고, 상기 인공 신경망은, 상기 중간 레이어들에서의 표현적 병목 현상이 최소화되도록, 상기 중간 레이어들의 가중치 매트릭스(weight matrix)에 대한 랭크(rank)가 확장되도록 설계될 수 있다.

다양한 실시예들에 따른 컴퓨터 프로그램은, 상기 동작 방법을 상기 전자 장치에 실행시키기 위해 비-일시적인 컴퓨터 판독 가능한 기록 매체에 저장될 수 있다.

다양한 실시예들에 따른 기록 매체는, 상기 동작 방법을 상기 전자 장치에 실행시키기 위한 프로그램이 기록되어 있는 비-일시적인 컴퓨터 판독 가능하게 구성될 수 있다.

다양한 실시예들에 따른 전자 장치는, 메모리, 및 상기 메모리와 연결되고, 상기 메모리에 저장된 적어도 하나의 명령을 실행하도록 구성된 프로세서를 포함하고, 상기 프로세서는, 복수의 중간 레이어들을 갖는 인공 신경망을 기반으로, 입력되는 데이터를 처리하도록 구성되고, 상기 인공 신경망은, 상기 중간 레이어들에서의 표현적 병목 현상이 최소화되도록, 상기 중간 레이어들의 가중치 매트릭스에 대한 랭크가 확장되도록 설계될 수 있다.

다양한 실시예들에 따르면, 전자 장치가 표현적 병목 현상이 최소화된 인공 신경망을 기반으로 데이터를 처리할 수 있다. 이 때 인공 신경망은 중간 레이어들의 가중치 매트릭스에 대한 랭크가 확장되도록 설계되며, 이에 따라 인공 신경망에서 발생될 수 있는 표현적 병목 현상이 최소화될 수 있다. 보다 상세하게는, 인공 신경망은, 중간 레이어들의 각각에 대해 입력 채널 사이즈가 증가되고, 비선형 활성화 함수를 이용하며, 중간 레이어들 사이에서 확장 레이어들의 개수가 증가되도록 설계됨에 따라, 중간 레이어들의 가중치 매트릭스에 대한 랭크가 확장될 수 있다. 이로 인해, 인공 신경망에서 표현적 병목 현상에 따른 정보의 손실이 방지되며, 이로써 인공 신경망의 정확성 및 효율성과 같은 성능이 향상될 수 있다.

도 1은 다양한 실시예들에 따른 전자 장치를 도시하는 도면이다.
도 2, 도 3, 및 도 4는 다양한 실시예들에 따른 인공 신경망을 설명하기 위한 도면들이다.
도 5는 다양한 실시예들에 따른 전자 장치의 동작 방법을 도시하는 도면이다.

이하, 본 문서의 다양한 실시예들이 첨부된 도면을 참조하여 설명된다.

도 1은 다양한 실시예들에 따른 전자 장치(100)를 도시하는 도면이다. 도 2, 도 3, 및 도 4는 다양한 실시예들에 따른 인공 신경망을 설명하기 위한 도면들이다.

도 1을 참조하면, 다양한 실시예들에 따른 전자 장치(100)는 카메라 모듈(110), 연결 단자(120), 통신 모듈(130), 입력 모듈(140), 표시 모듈(150), 오디오 모듈(160), 메모리(170) 또는 프로세서(180) 중 적어도 어느 하나를 포함할 수 있다. 어떤 실시예에서, 전자 장치(100)의 구성 요소들 중 적어도 어느 하나가 생략될 수 있으며, 적어도 하나의 다른 구성 요소가 추가될 수 있다. 어떤 실시예에서, 전자 장치(100)의 구성 요소들 중 적어도 어느 두 개가 하나의 통합된 회로로 구현될 수 있다. 예를 들면, 전자 장치(100)는 스마트폰(smart phone), 휴대폰, 내비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(personal digital assistants), PMP(portable multimedia player), 태블릿 PC, 게임 콘솔(game console), 웨어러블 디바이스(wearable device), IoT(internet of things) 디바이스, 가전 기기, 의료 기기, 로봇(robot), 또는 서버 중 적어도 어느 하나를 포함할 수 있다.

카메라 모듈(110)은 전자 장치(100)에서 영상을 촬영할 수 있다. 이 때 카메라 모듈(110)은 전자 장치(100)의 미리 정해진 위치에 설치되어, 영상을 촬영할 수 있다. 그리고, 카메라 모듈(110)은 영상 데이터를 생성할 수 있다. 예를 들면, 카메라 모듈(110)은 렌즈, 적어도 하나의 이미지 센서, 이미지 시그널 프로세서 또는 플래시 중 적어도 어느 하나를 포함할 수 있다.

연결 단자(120)는 전자 장치(100)에서 외부 장치(102)와 물리적으로 연결될 수 있다. 예를 들면, 외부 장치(102)는 다른 전자 장치를 포함할 수 있다. 이를 위해, 연결 단자(120)는 적어도 하나의 커넥터를 포함할 수 있다. 예를 들면, 커넥터는 HDMI 커넥터, USB 커넥터, SD 카드 커넥터 또는 오디오 커넥터 중 적어도 어느 하나를 포함할 수 있다.

통신 모듈(130)은 전자 장치(100)에서 외부 장치(102, 104)와 통신을 수행할 수 있다. 통신 모듈(130)은 전자 장치(100)와 외부 장치(102, 104) 간 통신 채널을 수립하고, 통신 채널을 통해, 외부 장치(102, 104)와 통신을 수행할 수 있다. 여기서, 외부 장치(102, 104)는 위성, 기지국, 서버 또는 다른 전자 장치 중 적어도 어느 하나를 포함할 수 있다. 통신 모듈(130)은 유선 통신 모듈 또는 무선 통신 모듈 중 적어도 어느 하나를 포함할 수 있다. 유선 통신 모듈은 연결 단자(102)를 통해, 외부 장치(102)와 유선으로 연결되어, 유선으로 통신할 수 있다. 무선 통신 모듈은 근거리 통신 모듈 또는 원거리 통신 모듈 중 적어도 어느 하나를 포함할 수 있다. 근거리 통신 모듈은 외부 장치(102)와 근거리 통신 방식으로 통신할 수 있다. 예를 들면, 근거리 통신 방식은, 블루투스(Bluetooth), 와이파이 다이렉트(WiFi direct), 또는 적외선 통신(IrDA; infrared data association) 중 적어도 어느 하나를 포함할 수 있다. 원거리 통신 모듈은 외부 장치(104)와 원거리 통신 방식으로 통신할 수 있다. 여기서, 원거리 통신 모듈은 네트워크(190)를 통해 외부 장치(104)와 통신할 수 있다. 예를 들면, 네트워크(190)는 셀룰러 네트워크, 인터넷, 또는 LAN(local area network)이나 WAN(wide area network)과 같은 컴퓨터 네트워크 중 적어도 어느 하나를 포함할 수 있다.

입력 모듈(140)은 전자 장치(100)의 적어도 하나의 구성 요소에 사용될 신호를 입력할 수 있다. 입력 모듈(140)은, 사용자가 전자 장치(100)에 직접적으로 신호를 입력하도록 구성되는 입력 장치 또는 주변 환경을 감지하여 신호를 발생하도록 구성되는 센서 장치 중 적어도 어느 하나를 포함할 수 있다. 예를 들면, 입력 장치는 마이크로폰(microphone), 마우스(mouse) 또는 키보드(keyboard) 중 적어도 어느 하나를 포함할 수 있다. 어떤 실시예에서, 센서 장치는 터치를 감지하도록 설정된 터치 회로(touch circuitry) 또는 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 센서 회로 중 적어도 어느 하나를 포함할 수 있다.

표시 모듈(150)은 전자 장치(100)의 시각적으로 정보를 표시할 수 있다. 예를 들면, 표시 모듈(150)은 디스플레이, 홀로그램 장치 또는 프로젝터 중 적어도 어느 하나를 포함할 수 있다. 일 예로, 표시 모듈(150)은 입력 모듈(140)의 터치 회로 또는 센서 회로 중 적어도 어느 하나와 조립되어, 터치 스크린으로 구현될 수 있다.

오디오 모듈(160)은 전자 장치(100)에서 오디오 신호를 처리할 수 있다. 오디오 모듈(160)은 오디오 입력 모듈 또는 오디오 출력 모듈 중 적어도 어느 하나를 포함할 수 있다. 오디오 입력 모듈은 입력 모듈(140)을 통해 입력되는 소리로부터 오디오 신호를 획득할 수 있다. 오디오 출력 모듈은 오디오 신호를 소리로 출력할 수 있다. 예를 들면, 오디오 출력 장치는 스피커 또는 리시버 중 적어도 어느 하나를 포함할 수 있다.

메모리(170)는 전자 장치(100)의 적어도 하나의 구성 요소에 의해 사용되는 다양한 데이터를 저장할 수 있다. 예를 들면, 메모리(170)는 휘발성 메모리 또는 비휘발성 메모리 중 적어도 어느 하나를 포함할 수 있다. 데이터는 적어도 하나의 프로그램 및 이와 관련된 입력 데이터 또는 출력 데이터를 포함할 수 있다. 프로그램은 메모리(170)에 적어도 하나의 명령을 포함하는 소프트웨어로서 저장될 수 있으며, 예컨대 운영 체제, 미들 웨어 또는 어플리케이션 중 적어도 어느 하나를 포함할 수 있다.

프로세서(180)는 메모리(170)의 프로그램을 실행하여, 전자 장치(100)의 적어도 하나의 구성 요소를 제어할 수 있다. 이를 통해, 프로세서(180)는 데이터 처리 또는 연산을 수행할 수 있다. 이 때 프로세서(160)는 메모리(170)에 저장된 명령을 실행할 수 있다. 프로세서(180)는 인공 신경망(artificial neural network)을 기반으로, 데이터를 처리할 수 있다. 인공 신경망은 입력 레이어(input layer), 출력 레이어(output layer), 및 입력 레이어와 출력 레이어 사이의 복수의 중간 레이어(intermediate layer)들을 포함할 수 있다. 각 중간 레이어는, 입력 측 레이어 또는 출력 측 레이어 중 적어도 어느 하나일 수 있다. 바꿔 말하면, 인접한 두 개의 중간 레이어들의 각각이 입력 측 레이어와 출력 측 레이어일 수 있다. 여기서, 확장 레이어(expand layer)와 압축 레이어(condense layer)가 정의될 수 있다. 확장 레이어는, 출력 측 레이어의 디멘션(d_i)이 입력 측 레이어의 디멘션(d_i-1) 보다 클 때(d_i>d_i-1)의 출력 측 레이어로서의 중간 레이어를 나타낼 수 있다. 압축 레이어는, 입력 측 레이어의 디멘션이 출력 측 레이어의 디멘션 보다 클 때(d_i-1>d_i)의 출력 측 레이어로서의 중간 레이어를 나타낼 수 있다.

다양한 실시예들에 따르면, 중간 레이어들에서의 표현적 병목 현상(representational bottleneck)이 최소화되도록, 인공 신경망은 중간 레이어들의 가중치 매트릭스(weight matrix)에 대한 랭크(rank)가 확장되도록 설계될 수 있다. 이를 위해, 인공 신경망은 다음의 세 가지의 조건들에 기반하여, 설계될 수 있다. 예를 들면, 인공 신경망은 콘볼루션 신경망(convolutional neural network; CNN)을 포함할 수 있다. 일 예로, 콘볼루션 신경망의 중간 레이어들, 예컨대 콘볼루션 레이어(convolutional layer)들이 다음의 조건들에 기반하여, 설계될 수 있다. 다른 예로, 콘볼루션 신경망의 중간 레이어들 중 페날트 레이어(penultimate layer)가 다음의 조건들에 기반하여, 설계될 수 있다.

첫 번째 조건은, 중간 레이어들의 각각에 대해 입력 채널 사이즈(input channel size)가 증가되도록 설계되어야 한다는 것일 수 있다. 입력 채널 사이즈는, 각 중간 레이어에서의 인풋 디멘션(input dimension)(d_in) 대 아웃풋 디멘션(output dimension)(d_out)의 비율(d_in/d_out)을 나타낼 수 있다. 여기서, 아웃풋 디멘션(d_out)이 해당 중간 레이어의 디멘션(d_i)을 나타내고, 인풋 디멘션(d_in)은 해당 중간 레이어에 대한 입력 측 레이어의 디멘션(d_i-1)을 나타낼 수 있다. 즉, 해당 중간 레이어의 디멘션(di)이 고정될 때, 해당 중간 레이어에 대한 입력 측 레이어의 디멘션(d_i-1)이 확장됨에 따라, 입력 채널 사이즈가 증가될 수 있다.

두 번째 조건은, 비선형 활성화 함수(nonlinear activation function)을 이용하도록 설계되어야 한다는 것일 수 있다. 여기서, 비선형 활성화 함수는 0이 적은 함수로 결정될 수 있다.

i-번째 중간 레이어의 가중치 매트릭스(

)에 기반하여 해당 중간 레이어에 의해 생성되는 i-번째 특징(feature)이

로 주어질 때, 가중치 매트릭스(

)에 대한 랭크(

)는 해당 중간 레이어의 디멘션(d_i(

≫d_i))과 해당 중간 레이어의 입력 측 레이어의 디멘션(d_i-1) 중 최소값으로 한정될 수 있다.

이며, 여기서

는 다른 점별곱 함수(

)와의 점별곱(pointwise multiplication)을 나타낼 수 있다. 부등식

에 따르면, 가중치 매트릭스(

)에 대한 랭크(

)는 하기 [수학식 1]과 같이

와 점별곱 함수(

)에 의해 한정될 수 있다.

상기 [수학식 1]에 따르면, i-번째 중간 레이어의 가중치 매트릭스(

)에 대한 랭크(

)는,

이 증가됨에 따라, 확장될 수 있다. 즉, i-번째 중간 레이어의 가중치 매트릭스(

)에 대한 랭크(

)는, 해당 중간 레이어의 입력 측 레이어의 디멘션(d_i-1)의 증가됨에 따라, 확장될 수 있다. 아울러, 상기 [수학식 1]에 따르면, i-번째 중간 레이어의 가중치 매트릭스(

)에 대한 랭크(

)는, 적절한 점별곱 함수(

)가 이용됨에 따라, 확장될 수 있다. 즉, i-번째 중간 레이어의 가중치 매트릭스(

)에 대한 랭크(

)는, 비선형 활성화 함수를 점별곱 함수(

)로서 이용함에 따라, 확장될 수 있다.

첫 번째 조건 및 두 번째 조건에 기반하여 인공 신경망이 설계되는 경우, 도 2에 도시된 바와 같이 입력 채널 사이즈가 증가됨에 따라, 랭크가 선형적으로 확장될 수 있다. 구체적으로, 도 2의 (a)에 도시된 바와 같이 각 중간 레이어에 대해, 입력 채널 사이즈가 증가됨에 따라, 랭크가 선형적으로 확장될 수 있다. 그리고, 도 2의 (b)에 도시된 바와 같이 복수의 중간 레이어들에 대해, 입력 채널 사이즈가 증가됨에 따라, 랭크가 선형적으로 확장될 수 있다.

세 번째 조건은, 중간 레이어들 사이에서 확장 레이어들의 개수가 증가되도록 설계되어야 한다는 것일 수 있다. 여기서, 확장 레이어들의 개수는 2와 중간 레이어들의 개수 보다 1 만큼 적은 수 사이의 어느 한 값일 수 있다. 예를 들면, 중간 레이어들의 개수가 5 개일 때, 확장 레이어들의 개수는 2 개, 3 개 또는 4 개일 수 있다. 여기서, 중간 레이어들의 개수가 5 개일 때, 하기 [표 1]과 같이 확장 레이어들의 개수 및 중간 레이어들의 디멘션 구성에 따라, 랭크가 검출될 수 있다.

확장 레이어들의 개수	중간 레이어들의 디멘션 구성	성능 (accuracy)	랭크
1	32-100-100-100-100	61.90	0.87
2	32-64-120-120-120	62.08	0.93
3	32-64-112-112-128	62.10	0.95
4	32-90-100-110-120	62.15	0.96

세 번째 조건에 기반하여 인공 신경망이 설계되는 경우, 도 3에 도시된 바와 같이 확장 레이어들의 개수가 증가됨에 따라, 랭크가 선형적으로 확장될 수 있다. 예를 들면, 중간 레이어들의 개수가 5 개일 때, 도 3의 (a)에 도시된 바와 같이 중간 레이어들 사이에서 확장 레이어들의 개수가 증가됨에 따라, 랭크가 확장될 수 있다. 그리고, 중간 레이어들의 개수가 5 개일 때, 도 3의 (b)에 도시된 바와 같이 표현적 병목 현상이 발생되더라도, 중간 레이어들 사이에서 확장 레이어들의 개수가 증가됨에 따라, 랭크가 선형적으로 확장될 수 있다. 다양한 실시예들에 따르면, 상기한 세 가지의 조건들에 기반하여 인공 신경망이 설계됨에 따라, 랭크가 확장될 수 있다. 구체적으로, 도 4의 (a)는 기존의 인공 신경망의 특이값 분포를 나타내며, 도 4의 (b)는 다양한 실시예들에 따른 인공 신경망의 특이값 분포를 나타낸다. 도 4의 (a)와 (b)를 비교하면, 다양한 실시예들에 따른 인공 신경망과 비교하여, 기존의 인공 신경망이 0에 가까운 특이값을 가지며, 여기서 특이값이 0에 가깝다는 것은 랭크가 낮다는 것을 의미한다. 즉, 기존의 인공 신경망과 비교하여, 다양한 실시예들에 따른 인공 신경망이 보다 확장된 랭크를 가질 수 있다.

상기와 같이 랭크가 확장됨에 따라, 다양한 실시예들에 따른 인공 신경망의 데이터의 처리 성능이 향상될 수 있다. 이를 확인하기 위해, 하기 [표 2]와 같이 기존의 인공 신경망들과 다양한 실시예들에 따른 인공 신경망의 각각을 기반으로, 다양한 타입의 이미지들이 처리되었다. 여기서, 이미지들로부터 특징들, 예컨대 음식과 관련된 특징들, 자동차와 관련된 특징들, 항공기와 관련된 특징들, 및 꽃과 관련된 특징들을 구별하는 성능이 측정되었다. 그 결과, 기존의 인공 신경망들과 비교하여, 다양한 실시예들에 따른 인공 신경망이 적은 수의 파라미터들을 이용하고도, 높은 성능으로, 이미지들로부터 특징들을 구별하였다. 다시 말해, 다양한 실시예들에 따른 인공 신경망이 상기한 세 가지의 조건들에 기반하여 설계됨에 따라, 보다 높은 성능으로 데이터를 처리할 수 있다.

데이터 셋	인공 신경망	성능	이용 파라미터들
음식	ResNet50	87.03	25.6 M
	EfficientNet-B0	87.47	5.3 M
	다양한 실시예들에 따른 인공 신경망	88.41	4.8 M
자동차	ResNet50	92.58	25.6 M
	EfficientNet-B0	90.66	5.3 M
	다양한 실시예들에 따른 인공 신경망	91.45	4.8 M
항공기	ResNet50	89.42	25.6 M
	EfficientNet-B0	87.06	5.3 M
	다양한 실시예들에 따른 인공 신경망	89.52	4.8 M
꽃	ResNet50	97.72	25.6 M
	EfficientNet-B0	97.33	5.3 M
	다양한 실시예들에 따른 인공 신경망	97.82	4.8 M

예를 들면, 다양한 실시예들에 따른 인공 신경망은, 하기 [표 3] 또는 [표 4]와 같은 디멘션 구성으로 설계될 수 있다. 일 예로, 인공 신경망은, 하기 [표 3]과 같이 중간 레이어들에 대해 약 11.5 씩 증가되는 디멘션 구성으로 설계될 수 있다. 다른 예로, 인공 신경망은, 하기 [표 4]와 같이 중간 레이어들에 대해 약 48 씩 증가되는 디멘션 구성으로 설계될 수 있다.

입력	디멘션 구성
224² X 3	32
112² X 32	16
112² X 16	27
56² X 27	38
56² X 38	50
28² X 50	61
28² X 61	72
14² X 72	84
14² X 84	95
14² X 95	106
14² X 106	117
14² X 117	128
14² X 128	140
7² X 140	151
7² X 151	162
7² X 162	174
7² X 174	185
7² X 185	1280
1² X 1280	1000

입력	디멘션 구성
224² X 3	32
112² X 32	96
56² x 96	144
56² x 144	192
28² x 192	240
28² x 240	288
14² x 288	336
14² x 336	384
14² x 384	432
14² x 432	480
14² x 480	528
14² x 528	576
7² x 576	624
7² x 624	1024
7² x 1024	1024
1² x 1024	1000

도 5는 다양한 실시예들에 따른 전자 장치(100)의 동작 방법을 도시하는 도면이다.

도 5를 참조하면, 전자 장치(100)는 510단계에서 입력되는 데이터를 검출할 수 있다. 다음으로, 전자 장치(100)는 520 단계에서 인공 신경망을 기반으로, 데이터를 처리할 수 있다. 예를 들면, 인공 신경망은 콘볼루션 신경망(CNN)을 포함할 수 있다.

다양한 실시예들에 따르면, 중간 레이어들에서의 표현적 병목 현상이 최소화되도록, 인공 신경망은 중간 레이어들의 가중치 매트릭스에 대한 랭크가 확장되도록 설계될 수 있다. 이를 위해, 인공 신경망은 다음의 세 가지의 조건들에 기반하여, 설계될 수 있다.

첫 번째 조건은, 중간 레이어들의 각각에 대해 입력 채널 사이즈가 증가되도록 설계되어야 한다는 것일 수 있다. 입력 채널 사이즈는, 각 중간 레이어에서의 인풋 디멘션(d_in) 대 아웃풋 디멘션(d_out)의 비율(d_in/d_out)을 나타낼 수 있다. 여기서, 아웃풋 디멘션(d_out)이 해당 중간 레이어의 디멘션(d_i)을 나타내고, 인풋 디멘션(d_in)은 해당 중간 레이어에 대한 입력 측 레이어의 디멘션(d_i-1)을 나타낼 수 있다. 즉, 해당 중간 레이어의 디멘션(di)이 고정될 때, 해당 중간 레이어에 대한 입력 측 레이어의 디멘션(d_i-1)이 확장됨에 따라, 입력 채널 사이즈가 증가될 수 있다.

두 번째 조건은, 비선형 활성화 함수를 이용하도록 설계되어야 한다는 것일 수 있다. 여기서, 비선형 활성화 함수는 0이 적은 함수로 결정될 수 있다.

세 번째 조건은, 중간 레이어들 사이에서 확장 레이어들의 개수가 증가되도록 설계되어야 한다는 것일 수 있다. 여기서, 확장 레이어들의 개수는 2와 중간 레이어들의 개수 보다 1 만큼 적은 수 사이의 어느 한 값일 수 있다. 예를 들면, 중간 레이어들의 개수가 5 개일 때, 확장 레이어들의 개수는 2 개, 3 개 또는 4 개일 수 있다.

다양한 실시예들에 따르면, 전자 장치(100)가 표현적 병목 현상이 최소화된 인공 신경망을 기반으로 데이터를 처리할 수 있다. 이 때 인공 신경망은 중간 레이어들의 가중치 매트릭스에 대한 랭크가 확장되도록 설계되며, 이에 따라 인공 신경망에서 발생될 수 있는 표현적 병목 현상이 최소화될 수 있다. 보다 상세하게는, 인공 신경망은, 중간 레이어들의 각각에 대해 입력 채널 사이즈가 증가되고, 비선형 활성화 함수를 이용하며, 중간 레이어들 사이에서 확장 레이어들의 개수가 증가되도록 설계됨에 따라, 중간 레이어들의 가중치 매트릭스에 대한 랭크가 확장될 수 있다. 이로 인해, 인공 신경망에서 표현적 병목 현상에 따른 정보의 손실이 방지되며, 이로써 인공 신경망의 정확성 및 효율성과 같은 성능이 향상될 수 있다.

다양한 실시예들에 따른 전자 장치(100)의 동작 방법은, 입력되는 데이터를 검출하는 단계(510), 및 복수의 중간 레이어들을 갖는 인공 신경망을 기반으로, 데이터를 처리하는 단계(520)를 포함할 수 있다.

다양한 실시예들에 따르면, 인공 신경망은, 중간 레이어들에서의 표현적 병목 현상이 최소화되도록, 중간 레이어들의 각각의 가중치 매트릭스에 대한 랭크가 확장되도록 설계될 수 있다.

다양한 실시예들에 따르면, 인공 신경망은, 중간 레이어들의 랭크를 확장시키기 위해, 중간 레이어들의 각각에 대해 입력 채널 사이즈가 증가되도록 설계될 수 있다.

다양한 실시예들에 따르면, 인공 신경망은, 중간 레이어들의 랭크를 확장시키기 위해, 비선형 활성화 함수를 이용하도록 설계될 수 있다.

다양한 실시예들에 따르면, 인공 신경망은, 중간 레이어들의 랭크를 확장시키기 위해, 중간 레이어들 사이에서 확장 레이어들의 개수가 증가되도록 설계될 수 있다.

다양한 실시예들에 따르면, 입력 채널 사이즈는, 인풋 디멘션(input dimension) 대 아웃풋 디멘션(output dimension)의 비율을 나타낼 수 있다.

다양한 실시예들에 따르면, 확장 레이어들의 각각은, 출력 측 레이어의 디멘션이 입력 측 레이어의 디멘션 보다 클 때의 출력 측 레이어이고, 입력 측 레이어는 중간 레이어들 중 어느 하나이고, 출력 측 레이어는 중간 레이어들 중 다른 하나이며 입력 측 레이어에 인접한 것일 수 있다.

다양한 실시예들에 따르면, 랭크는, 입력 채널 사이즈가 증가됨에 따라, 선형적으로 확장될 수 있다.

다양한 실시예들에 따르면, 랭크는, 확장 레이어들의 개수가 증가됨에 따라, 선형적으로 확장될 수 있다.

다양한 실시예들에 따르면, 확장 레이어들의 개수는, 2와 중간 레이어들의 개수 보다 1만큼 적은 수 사이의 어느 한 값일 수 있다.

다양한 실시예들에 따른 전자 장치(100)는, 메모리(170), 및 메모리(170)와 연결되고, 메모리(170)에 저장된 적어도 하나의 명령을 실행하도록 구성된 프로세서(180)를 포함할 수 있다.

다양한 실시예들에 따르면, 프로세서(180)는, 복수의 중간 레이어들을 갖는 인공 신경망을 기반으로, 입력되는 데이터를 처리하도록 구성될 수 있다.

다양한 실시예들에 따르면, 인공 신경망은, 중간 레이어들에서의 표현적 병목 현상이 최소화되도록, 중간 레이어들의 가중치 매트릭스에 대한 랭크가 확장되도록 설계될 수 있다.

다양한 실시예들에 따르면, 입력 채널 사이즈는, 인풋 디멘션 대 아웃풋 디멘션의 비율을 나타낼 수 있다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

다양한 실시예들에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 이 때 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 그리고, 매체는 단일 또는 수 개의 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 어플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.

본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 해당 실시 예의 다양한 변경, 균등물, 및/또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성 요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및/또는 B 중 적어도 하나", "A, B 또는 C" 또는 "A, B 및/또는 C 중 적어도 하나" 등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", "첫째" 또는 "둘째" 등의 표현들은 해당 구성 요소들을, 순서 또는 중요도에 상관없이 수식할 수 있고, 한 구성 요소를 다른 구성 요소와 구분하기 위해 사용될 뿐 해당 구성 요소들을 한정하지 않는다. 어떤(예: 제 1) 구성 요소가 다른(예: 제 2) 구성 요소에 "(기능적으로 또는 통신적으로) 연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성 요소가 상기 다른 구성 요소에 직접적으로 연결되거나, 다른 구성 요소(예: 제 3 구성 요소)를 통하여 연결될 수 있다.

본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구성된 유닛을 포함하며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 모듈은 ASIC(application-specific integrated circuit)으로 구성될 수 있다.

다양한 실시예들에 따르면, 기술한 구성 요소들의 각각의 구성 요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시예들에 따르면, 전술한 해당 구성 요소들 중 하나 이상의 구성 요소들 또는 단계들이 생략되거나, 또는 하나 이상의 다른 구성 요소들 또는 단계들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성 요소들(예: 모듈 또는 프로그램)은 하나의 구성 요소로 통합될 수 있다. 이런 경우, 통합된 구성 요소는 복수의 구성 요소들 각각의 구성 요소의 하나 이상의 기능들을 통합 이전에 복수의 구성 요소들 중 해당 구성 요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성 요소에 의해 수행되는 단계들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 단계들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 단계들이 추가될 수 있다.

Claims

전자 장치의 동작 방법에 있어서,
입력되는 데이터를 검출하는 단계; 및
복수의 중간 레이어들을 갖는 인공 신경망을 기반으로, 상기 데이터를 처리하는 단계를 포함하고,
상기 인공 신경망은,
상기 중간 레이어들에서의 표현적 병목 현상이 최소화되도록, 상기 중간 레이어들의 각각의 가중치 매트릭스(weight matrix)에 대한 랭크(rank)가 확장되도록 설계되고,
상기 인공 신경망은,
상기 중간 레이어들의 상기 랭크를 확장시키기 위해, 상기 중간 레이어들의 각각에 대해 입력 채널 사이즈가 증가되도록 설계된, 방법.
삭제
전자 장치의 동작 방법에 있어서,
입력되는 데이터를 검출하는 단계; 및
복수의 중간 레이어들을 갖는 인공 신경망을 기반으로, 상기 데이터를 처리하는 단계를 포함하고,
상기 인공 신경망은,
상기 중간 레이어들에서의 표현적 병목 현상이 최소화되도록, 상기 중간 레이어들의 각각의 가중치 매트릭스(weight matrix)에 대한 랭크(rank)가 확장되도록 설계되고,
상기 인공 신경망은,
상기 중간 레이어들의 상기 랭크를 확장시키기 위해, 비선형 활성화 함수를 이용하도록 설계된, 방법.
전자 장치의 동작 방법에 있어서,
입력되는 데이터를 검출하는 단계; 및
복수의 중간 레이어들을 갖는 인공 신경망을 기반으로, 상기 데이터를 처리하는 단계를 포함하고,
상기 인공 신경망은,
상기 중간 레이어들에서의 표현적 병목 현상이 최소화되도록, 상기 중간 레이어들의 각각의 가중치 매트릭스(weight matrix)에 대한 랭크(rank)가 확장되도록 설계되고,
상기 인공 신경망은,
상기 중간 레이어들의 상기 랭크를 확장시키기 위해, 상기 중간 레이어들 사이에서 확장(expand) 레이어들의 개수가 증가되도록 설계된, 방법.
제 1 항에 있어서,
상기 입력 채널 사이즈는,
인풋 디멘션(input dimension) 대 아웃풋 디멘션(output dimension)의 비율을 나타내는, 방법.
제 4 항에 있어서,
상기 확장 레이어들의 각각은,
출력 측 레이어의 디멘션이 입력 측 레이어의 디멘션 보다 클 때의 상기 출력 측 레이어이고,
상기 입력 측 레이어는 상기 중간 레이어들 중 어느 하나이고, 상기 출력 측 레이어는 상기 중간 레이어들 중 다른 하나이며 상기 입력 측 레이어에 인접한 것인, 방법.
제 1 항에 있어서,
상기 랭크는,
상기 입력 채널 사이즈가 증가됨에 따라, 선형적으로 확장된, 방법.
제 4 항에 있어서,
상기 랭크는,
상기 확장 레이어들의 개수가 증가됨에 따라, 선형적으로 확장된, 방법.
제 4 항에 있어서,
상기 확장 레이어들의 개수는,
2와 상기 중간 레이어들의 개수 보다 1만큼 적은 수 사이의 어느 한 값인, 방법.
제 1 항, 또는 제 3 항 내지 제 9 항 중 어느 한 항의 동작 방법을 상기 전자 장치에 실행시키기 위해 비-일시적인 컴퓨터 판독 가능한 기록 매체에 저장되는 컴퓨터 프로그램.
제 1 항, 또는 제 3 항 내지 제 9 항 중 어느 한 항의 동작 방법을 상기 전자 장치에 실행시키기 위한 프로그램이 기록되어 있는 비-일시적인 컴퓨터 판독 가능한 기록 매체.
전자 장치에 있어서,
메모리; 및
상기 메모리와 연결되고, 상기 메모리에 저장된 적어도 하나의 명령을 실행하도록 구성된 프로세서를 포함하고,
상기 프로세서는,
복수의 중간 레이어들을 갖는 인공 신경망을 기반으로, 입력되는 데이터를 처리하도록 구성되고,
상기 인공 신경망은,
상기 중간 레이어들에서의 표현적 병목 현상이 최소화되도록, 상기 중간 레이어들의 가중치 매트릭스에 대한 랭크가 확장되도록 설계되고,
상기 인공 신경망은,
상기 중간 레이어들의 상기 랭크를 확장시키기 위해, 상기 중간 레이어들의 각각에 대해 입력 채널 사이즈가 증가되도록 설계된, 장치.
삭제
전자 장치에 있어서,
메모리; 및
상기 메모리와 연결되고, 상기 메모리에 저장된 적어도 하나의 명령을 실행하도록 구성된 프로세서를 포함하고,
상기 프로세서는,
복수의 중간 레이어들을 갖는 인공 신경망을 기반으로, 입력되는 데이터를 처리하도록 구성되고,
상기 인공 신경망은,
상기 중간 레이어들에서의 표현적 병목 현상이 최소화되도록, 상기 중간 레이어들의 가중치 매트릭스에 대한 랭크가 확장되도록 설계되고,
상기 인공 신경망은,
상기 중간 레이어들의 상기 랭크를 확장시키기 위해, 비선형 활성화 함수를 이용하도록 설계된, 장치.
전자 장치에 있어서,
메모리; 및
상기 메모리와 연결되고, 상기 메모리에 저장된 적어도 하나의 명령을 실행하도록 구성된 프로세서를 포함하고,
상기 프로세서는,
복수의 중간 레이어들을 갖는 인공 신경망을 기반으로, 입력되는 데이터를 처리하도록 구성되고,
상기 인공 신경망은,
상기 중간 레이어들에서의 표현적 병목 현상이 최소화되도록, 상기 중간 레이어들의 가중치 매트릭스에 대한 랭크가 확장되도록 설계되고,
상기 인공 신경망은,
상기 중간 레이어들의 상기 랭크를 확장시키기 위해, 상기 중간 레이어들 사이에서 확장 레이어들의 개수가 증가되도록 설계된, 장치.
제 12 항에 있어서,
상기 입력 채널 사이즈는,
인풋 디멘션 대 아웃풋 디멘션의 비율을 나타내는, 장치.
제 15 항에 있어서,
상기 확장 레이어들의 각각은,
출력 측 레이어의 디멘션이 입력 측 레이어의 디멘션 보다 클 때의 상기 출력 측 레이어이고,
상기 입력 측 레이어는 상기 중간 레이어들 중 어느 하나이고, 상기 출력 측 레이어는 상기 중간 레이어들 중 다른 하나이며 상기 입력 측 레이어에 인접한 것인, 장치.
제 12 항에 있어서,
상기 랭크는,
상기 입력 채널 사이즈가 증가됨에 따라, 선형적으로 확장된, 장치.
제 15 항에 있어서,
상기 랭크는,
상기 확장 레이어들의 개수가 증가됨에 따라, 선형적으로 확장된, 장치.
제 15 항에 있어서,
상기 확장 레이어들의 개수는,
2와 상기 중간 레이어들의 개수 보다 1만큼 적은 수 사이의 어느 한 값인, 장치.