KR102646894B1 - 고정된 기기 또는 이동가능한 기기에 장착되고, 인공지능 반도체를 탑재한 전자 장치 - Google Patents

고정된 기기 또는 이동가능한 기기에 장착되고, 인공지능 반도체를 탑재한 전자 장치 Download PDF

Info

Publication number
KR102646894B1
KR102646894B1 KR1020220178092A KR20220178092A KR102646894B1 KR 102646894 B1 KR102646894 B1 KR 102646894B1 KR 1020220178092 A KR1020220178092 A KR 1020220178092A KR 20220178092 A KR20220178092 A KR 20220178092A KR 102646894 B1 KR102646894 B1 KR 102646894B1
Authority
KR
South Korea
Prior art keywords
camera
npu
neural network
feature map
artificial neural
Prior art date
Application number
KR1020220178092A
Other languages
English (en)
Inventor
유하준
김유준
김녹원
Original Assignee
주식회사 딥엑스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 딥엑스 filed Critical 주식회사 딥엑스
Priority to KR1020220178092A priority Critical patent/KR102646894B1/ko
Priority to US18/317,595 priority patent/US11928836B2/en
Priority to US18/317,642 priority patent/US11948326B2/en
Application granted granted Critical
Publication of KR102646894B1 publication Critical patent/KR102646894B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/95Computational photography systems, e.g. light-field imaging systems
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B15/00Special procedures for taking photographs; Apparatus therefor
    • G03B15/006Apparatus mounted on flying objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/955Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/45Cameras or camera modules comprising electronic image sensors; Control thereof for generating image signals from two or more image sensors being of different type or operating in different modes, e.g. with a CMOS sensor for moving images in combination with a charge-coupled device [CCD] for still images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/57Mechanical or electrical details of cameras or camera modules specially adapted for being embedded in other devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/64Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/69Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/90Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Image Analysis (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Neurology (AREA)
  • Human Computer Interaction (AREA)

Abstract

본 개시들의 예시에 따르면, 이동가능한 또는 고정된 기기에 장착되는 전자 장치가 제공된다. 상기 전자 장치는 다수의 PE들(processing elements)를 포함하고, 하나 또는 복수의 카메라로부터 획득된 하나 이상의 이미지에 기초하여, 적어도 하나의 객체를 감지(detect) 또는 추적(track)하기 위한 추론 결과를 출력하도록 학습된 인공신경망모델의 연산을 처리하도록 구성된 NPU(neural processing unit)와; 그리고 적어도 하나의 카메라에 적용가능한 신호를 생성하는 신호 생성기를 포함할 수 있다.

Description

고정된 기기 또는 이동가능한 기기에 장착되고, 인공지능 반도체를 탑재한 전자 장치{ELECTRONIC APPARATUS MOUNTED IN MOVING OR FIXED DEVICE AND INSTALLED WITH ARTIFICIAL INTELLIGENCE SEMICONDUCTOR}
본 개시는 고정된 기기 또는 이동가능한 기기에 장착되고, 인공지능 반도체를 탑재한 전자 장치에 관한 것이다.
최근에는 인공지능 반도체를 탑재한 전자 장치에 관한 연구가 진행되고 있다.
이동가능한 기기에는 대표적으로 자율주행 자동차, 로봇(robot) 또는 드론(drone) 등이 있다. 예를 들면, 드론은 조종사 없이 자율 비행 또는 무선 전파의 유도에 의해 비행 및 조종이 가능한 비행기나 헬리콥터 모양의 무인항공기(UAV: unmanned aerial vehicle/uninhabited aerial vehicle)을 총칭한다.
드론은 군사용 및 산업용으로 영역을 확장하면서 다양한 분야에 활용되고 있다.
이동가능한 기기는 기기의 이동 속도에 비례하여 빠른 판단을 해야 한다. 따라서 이동가능한 기기는 기기의 빠른 속도에 대응되는 처리속도를 가지는 인공지능 시스템을 필요로 한다.
이동가능한 기기는 먼 거리의 물체를 인식할 수 있어야 한다. 따라서 이동가능한 기기는 먼 거리의 물체를 효과적으로 인식할 수 있는 인공지능 시스템을 필요로 한다.
이동가능한 기기는 장시간 비행할 수 있어야 한다. 따라서 이동가능한 기기는 저전력으로 구동 가능한 인공지능 시스템을 필요로 한다.
따라서, 본 개시들의 예시는 전술한 문제점을 해결하고자, 인공지능 시스템을 탑재한 고정된 또는 이동가능한 기기를 제시하는 것을 목적으로 한다.
본 개시들의 예시에 따르면, 이동가능한 또는 고정된 기기에 장착되는 전자 장치가 제공된다. 상기 전자 장치는 다수의 PE들(processing elements)를 포함하고, 하나 또는 복수의 카메라로부터 획득된 하나 이상의 이미지에 기초하여, 적어도 하나의 객체를 감지(detect) 또는 추적(track)하기 위한 추론 결과를 출력하도록 학습된 인공신경망모델의 연산을 처리하도록 구성된 NPU(neural processing unit)와; 그리고 적어도 하나의 카메라에 적용가능한 신호를 생성하는 신호 생성기를 포함할 수 있다.
상기 이동가능한 기기의 일 예시는 드론일 수 있다. 이하, 예시적으로 드론을 중심으로 설명하기로 하나, 이는 예시일 뿐이며 본 개시에서 제시하는 예시들은 드론에만 국한되는 것은 아니다. 이동가능한 기기는 자동차, 선박, 비행기, 로봇 등일 수 있다.
제1 개시의 일 예시에 따르면, 이동가능한 기기에 장착되는 전자 장치를 제시한다. 상기 전자 장치는 하나 또는 복수의 카메라로부터 획득된 하나 이상의 이미지에 기초하여, 적어도 하나의 객체를 감지(detect) 또는 추적(track)하기 위한 추론 결과를 출력하도록 학습된 인공신경망모델의 연산을 처리하도록 구성된 NPU(neural processing unit)와; 그리고 적어도 하나의 카메라에 적용가능한 신호를 생성하는 신호 생성기를 포함할 수 있다. 상기 생성된 신호는 상기 적어도 하나의 카메라를 기계적 또는 전기적으로 제어하여, 상기 감지 또는 상기 추적의 정확도를 높이기 위한 적어도 하나의 명령을 포함할 수 있다.
상기 적어도 하나의 명령어는: 상기 적어도 하나의 카메라의 바디, 렌즈 또는 이미지 센서 중 적어도 하나를 X, Y 또는 Z 축 방향으로 이동 또는 회전시키거나, 또는 상기 적어도 하나의 카메라의 초점 거리(focal distance)를 증가시키거나 감소시키기 위해서 사용될 수 있다.
상기 적어도 하나의 명령어는: 상기 적어도 하나의 카메라의 화각(angle of view)을 증가시키거나 감소시키거나, 상기 적어도 하나의 카메라의 관측 시야(field of view, FoV)를 X, Y 또는 Z 축 방향으로 이동 또는 회전시키거나, 상기 적어도 하나의 카메라의 FPS(frame per second)를 증가시키거나 감소시키거나, 또는 상기 적어도 하나의 카메라가 줌-인(Zoom-in)하거나 또는 줌-아웃(zoom-out)하도록 하는데 사용될 수 있다.
상기 하나 또는 복수의 카메라는 렌즈, 이미지 센서 그리고 상기 렌즈를 이동시켜 상기 렌즈와 상기 이미지 센서 간의 거리를 증가시키거나 감소시키기 위한 모터를 포함할 수 있다.
상기 하나 또는 복수의 카메라는: 제1 카메라와 상기 제1 카메라의 화각(angle of view) 보다 작은 화각을 갖는 제2 카메라를 포함하거나, 또는 상기 하나 또는 복수의 카메라는: 광각 카메라(wide-angle camera)와 망원 카메라(telephoto camera)를 포함할 수 있다.
상기 적어도 하나의 객체가 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나 추적되는 경우, 상기 신호는 상기 적어도 하나의 객체의 좌표(coordinate)를 포함하도록 생성될 수 있다.
상기 적어도 하나의 객체의 좌표를 포함하는 신호는 상기 적어도 하나의 카메라가 상기 적어도 하나의 객체를 포함하는 이미지 부분을 보다 큰 사이즈(size)로 캡쳐할 수 있도록 하는데 사용될 수 있다.
상기 하나 또는 복수의 카메라가 제1 카메라와 상기 제1 카메라의 화각 보다 작은 화각을 갖는 제2 카메라를 포함하는 경우, 상기 제2 카메라의 관측 시야(FoV)는 상기 좌표에 기초하여 X, Y 또는 Z 축 방향으로 이동 또는 회전될 수 있다.
상기 하나 또는 복수의 카메라가 제1 카메라와 상기 제1 카메라의 화각 보다 작은 화각을 갖는 제2 카메라를 포함하는 경우, 상기 제1 카메라는 상기 NPU가 상기 적어도 하나의 객체를 감지할 수 있도록 하도록 하는데 사용되고, 상기 제2 카메라는 상기 NPU가 상기 감지된 적어도 하나의 객체를 추적할 수 있도록 하는데 사용될 수 있다.
상기 신호는 상기 이동가능한 기기의 비행 고도 또는 높이에 기초하여 생성될 수 있다.
상기 하나 또는 복수의 카메라 중 적어도 하나는 자외선 카메라, 적외선 카메라, 열화상 카메라 또는 나이트 비전 카메라를 포함할 수 있다.
제1 개시의 일 예시에 따르면, 이동가능한 기기를 이용하여 객체를 감지 또는 추적하는 방법에 제시된다. 상기 방법은 하나 또는 복수의 카메라로부터 획득된 하나 이상의 이미지에 기초하여, 적어도 하나의 객체를 감지(detect) 또는 추적(track)하는 단계와; 상기 감지 또는 상기 추적의 정확도를 높이기 위하여, 상기 적어도 하나의 카메라를 기계적 또는 전기적으로 제어하기 위한 적어도 하나의 명령어를 포함하는 신호를 생성하는 단계와; 상기 생성된 신호에 기초하여, 상기 적어도 하나의 카메라를 기계적 또는 전기적으로 제어하는 단계와; 그리고 상기 생성된 신호에 기초하여 기계적 또는 전기적으로 제어된 적어도 하나의 카메라로부터 획득되는 후속 이미지에 기초하여, 상기 적어도 하나의 객체에 대한 감지 또는 추적을 지속하는 단계를 포함할 수 있다.
제2 개시의 일 예시에 따르면, 이동가능한 기기에 장착되는 전자 장치를 제시한다. 상기 이동가능한 기기에 장착되는 전자 장치는 카메라로부터 캡쳐된 이미지를 처리함으로써 조절가능한 차원(dimension)을 갖는, 조절가능한 입력 특징맵(input feature map)을 결정 데이터에 기초하여 생성하는 ISP(image signal processor)와; 다수의 PE들(processing elements)를 포함하고, 상기 조절가능한 입력 특징맵을 상기 다수의 PE들에 입력함으로써, 인공신경망모델의 연산을 처리하는 NPU(neural processing unit)와; 그리고 적어도 하나의 환경적 조건 데이터(environmental condition data)에 기초하여, 상기 결정 데이터를 생성하는 제어기를 포함할 수 있다.
상기 입력 특징맵의 해상도 또는 사이즈는 상기 결정 데이터에 기초하여 조절가능할 수 있다.
상기 입력 특징맵의 차원은 상기 결정 데이터에 기초하여 조절가능할 수 있다.
상기 입력 특징맵의 차원은 특징맵의 가로 사이즈와 세로 사이즈 그리고 채널의 개수를 포함할 수 있다.
상기 환경적 조건 데이터는: 상기 이동가능한 기기의 비행 고도, 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 상기 이동가능한 기기의 비행 속도를 포함할 수 있다.
제2 개시의 다른 일 예시에 따르면, 이동가능한 기기에 장착되는 전자 장치를 제시한다. 상기 이동가능한 기기에 장착되는 전자 장치는 카메라로부터 획득된 이미지에 기반하여 생성된 하나 또는 복수의 입력 특징맵(input feature map)에 기초하여, 인공신경망모델의 연산을 처리하는 NPU(neural processing unit)와; 그리고 적어도 하나의 입력 특징맵을 위한 신호를 생성하는, 신호 생성기를 포함할 수 있다. 상기 생성된 신호는 상기 적어도 하나의 입력 특징맵의 생성을 제어하거나 또는 상기 적어도 하나의 입력 특징맵의 적어도 하나의 속성을 제어하기 위한 적어도 하나의 명령어를 포함할 수 있다.
상기 하나 또는 복수의 입력 특징맵은 상기 인공신경망모델의 다수의 레이어들 중에서 임의 레이어로 전달될 수 있다.
상기 적어도 하나의 속성은: 상기 적어도 하나의 입력 특징맵의 사이즈, 또는 상기 적어도 하나의 입력 특징맵의 해상도를 포함할 수 있다.
상기 사이즈 또는 해상도는 상기 이동가능한 기기의 비행 고도, 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 상기 이동가능한 기기의 비행 속도에 기초하여 동적으로 조정될 수 있다.
상기 생성된 신호는 상기 이동가능한 기기의 비행 고도, 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 상기 이동가능한 기기의 비행 속도에 기초하여 생성될 수 있다.
상기 이동가능한 기기는 상기 적어도 하나의 입력 특징맵의 상기 적어도 하나의 속성을 변경하기 위한 회로를 더 포함할 수 있다. 상기 적어도 하나의 속성은 사이즈 또는 해상도를 포함할 수 있다.
상기 적어도 하나의 명령어는 상기 적어도 하나의 입력 특징맵이 초(second) 당 더 많이 생성되도록 할 수 있다.
상기 적어도 하나의 속성이 상기 적어도 하나의 입력 특징맵의 사이즈이고, 상기 적어도 하나의 입력 특징맵의 사이즈가 상기 생성된 신호에 기초하여 축소되는 경우, 상기 적어도 하나의 입력 특징맵은 초(second) 당 더 많이 생성될 수 있다.
상기 이동가능한 기기의 비행 고도, 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 상기 이동가능한 기기의 비행 속도가 증가되는 경우, 상기 적어도 하나의 속성에 해당하는 해상도는 상기 생성된 신호에 기초하여 증가될 수 있다.
상기 카메라는: 제1 카메라와 상기 제1 카메라의 화각(angle of view) 보다 작은 화각을 갖는 제2 카메라를 포함하거나, 또는 상기 카메라는: 광각 카메라(wide-angle camera)와 망원 카메라(telephoto camera)를 포함할 수 있다.
상기 카메라는: 자외선 카메라(ultra violet camera), 적외선 카메라(infrared camera), 열화상 카메라(thermal imaging camera) 또는 나이트 비전 카메라(night vision camera)를 포함할 수 있다.
상기 이동가능한 기기의 비행 고도, 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이가 증가되는 경우, 상기 NPU는 상기 적외선 카메라 또는 상기 열화상 카메라로부터 캡쳐된 이미지 내에서 객체를 감지할 수 있다. 이때, 상기 생성된 신호는 상기 적어도 하나의 속성에 대응하는 해상도를 증가시키기 위해서 사용될 수 있다.
제2 개시의 또 다른 일 예시에 따르면, 이동가능한 기기를 이용한 객체 감지 또는 추적 방법이 제시된다. 상기 방법은 환경적 조건 데이터에 기초하여, 결정 데이터를 생성하는 단계와; 상기 결정 데이터에 기초하여, 조절가능한 입력 특징맵(input feature map)을 생성하는 단계와; 그리고 상기 생성된 입력 특징맵에 기초하여 인공신경망모델의 연산을 처리하여, 객체를 감지 또는 추적하는 단계를 포함할 수 있다.
제3 개시의 일 예시에 따르면, 이동가능한 기기를 제시한다. 상기 이동가능한 기기에 장착되는 전자 장치는 카메라로부터의 입력 이미지를 결정 데이터에 기초하여 다수의 이미지 블록들(blocks)로 분할(partitioning)하는 프로세서와; 그리고 상기 다수의 블록들에 기초하여, 인공신경망모델의 연산을 처리하는 NPU(neural processing unit)를 포함할 수 있다. 상기 결정 데이터는 상기 다수의 이미지 블록들의 개수를 결정하도록 설정될 수 있다.
상기 결정 데이터는: 상기 이동가능한 기기의 비행 고도, 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 상기 이동가능한 기기의 비행 속도에 따라 정해질 수 있다.
상기 이동가능한 기기의 비행 고도 또는 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이가 상승되는 경우, 상기 다수의 이미지 블록들의 개수는 증가될 수 있다.
상기 다수의 이미지 블록들의 개수가 제1 임계값 보다 큰 경우, 상기 다수의 이미지 블록들은 상기 NPU에 입력되기 전에 사이즈가 업스케일링(upscaling)될 수 있다.
상기 카메라는 제1 카메라와 상기 제1 카메라의 화각(angle of view) 보다 작은 화각을 갖는 제2 카메라를 포함할 수 있다. 또는, 상기 카메라는: 광각 카메라(wide-angle camera)와 망원 카메라(telephoto camera)를 포함할 수 있다.
상기 카메라는: 가시 광선 카메라, 자외선 카메라(ultra violet camera), 적외선 카메라(infrared camera), 열화상 카메라(thermal imaging camera) 또는 나이트 비전 카메라(night vision camera)를 포함할 수 있다.
제3 개시의 일 예시에 따르면, 이동가능한 기기에 장착되는 전자 장치를 제시한다. 상기 이동가능한 기기에 장착되는 전자 장치는 하나 또는 복수의 카메라로부터 획득된 하나 또는 복수의 이미지들을 다수의 블록들로 분할하는 이미지 전처리기와; 그리고 상기 다수의 이미지 블록들 각각에 기반하여 생성된 하나 또는 복수의 입력 특징맵(input feature maps)에 기초하여, 인공신경망모델의 연산을 처리하는 NPU(neural processing unit)를 포함할 수 있다. 상기 다수의 이미지 블록들의 개수는 상기 이동가능한 기기의 움직임에 기초하여 동적으로 결정될 수 있다.
상기 다수의 이미지 블록들은 상기 인공신경망모델의 연산을 처리하는데 입력으로 사용될 수 있다.
상기 다수의 이미지 블록들의 개수가 제1 임계값 보다 큰 경우, 상기 다수의 이미지 블록들은 상기 NPU에 입력되기 전에 사이즈가 업스케일링(upscaling)될 수 있다.
상기 이동가능한 기기의 비행 고도 또는 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이가 상승되거나 또는 상기 이동가능한 기기의 비행 속도가 증가되는 경우, 상기 다수의 이미지 블록들의 개수는 증가될 수 있다.
상기 하나 또는 복수의 입력 특징맵들은 상기 인공신경망모델의 복수의 레이어들 중 임의 레이어로 전달될 수 있다.
상기 카메라는 제1 카메라와 상기 제1 카메라의 화각(angle of view) 보다 작은 화각을 갖는 제2 카메라를 포함할 수 있다. 또는, 상기 카메라는: 광각 카메라(wide-angle camera)와 망원 카메라(telephoto camera)를 포함할 수 있다.
상기 카메라는: 가시 광선 카메라, 자외선 카메라(ultra violet camera), 적외선 카메라(infrared camera), 열화상 카메라(thermal imaging camera) 또는 나이트 비전 카메라(night vision camera)를 포함할 수 있다
상기 이동가능한 기기의 비행 고도 또는 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이가 상승되는 경우, 상기 열화상 카메라로부터 획득된 이미지 내의 객체(object)가 상기 NPU에 의해서 수행되는 인공신경망모델에 의하여 감지될 수 있고, 상기 가시 광선 카메라로부터 획득된 이미지 내의 객체(object)가 상기 NPU에 의해서 수행되는 인공신경망모델에 의하여 분류(object classification)될 수 있다.
본 개시들에 따르면, 고정된 또는 이동가능한 기기의 카메라를 이용하여 피사체를 감지 내지 추적할 수 있다. 보다 구체적으로, 고정 또는 이동가능한 기기의 촬영 고도가 상승되는 경우, 피사체가 상당히 작게 촬영되게 되기 때문에, 감지 또는 추적 정확도가 낮아질 수 있는 단점이 있다. 그러나 본 개시들의 예시들에 따르면, 이동가능한 기기의 비행 고도가 상승하는 경우에도, 감지 또는 추적의 정확도를 향상시킬 수 있다.
구체적으로, 본 개시들의 예시들에 따르면, 이동가능한 기기의 비행 고도가 상승하는 경우, 자동으로 보다 높은 해상도로 이미지를 촬영함으로써, 감지 또는 추적의 정확도를 향상시킬 수 있다. 이 경우, 초당 프레임 속도(fps)는 저하시킴으로써, 배터리 소모를 절감할 수 있도록 한다. 반면에, 이동가능한 기기의 비행 고도가 하강하는 경우, 자동으로 보다 낮은 해상도로 이미지를 촬영하고, 대신에 초당 프레임 속도(fps)를 상승시킴으로써, 감지 또는 추적의 정확도를 상승시킬 수 있다.
도 1은 예시적인 인공신경망모델을 설명하는 개략적인 개념도이다.
도 2a은 컨볼루션 신경망(CNN)의 기본 구조를 설명하기 위한 도면이다.
도 2b는 컨볼루션 신경망의 동작을 이해하기 쉽게 나타낸 종합도이다.
도 3은 본 개시에 따른 신경 프로세싱 유닛을 설명하는 개략적인 개념도이다.
도 4a는 본 개시에 적용될 수 있는 복수의 프로세싱 엘리먼트 중 하나의 프로세싱 엘리먼트를 설명하는 개략적인 개념도이다.
도 4b는 본 개시에 적용될 수 있는 SFU를 설명하는 개략적인 개념도이다.
도 5는 도 3에 도시된 NPU(100)의 변형예를 나타낸 예시도이다.
도 6a 및 도 6b는 본 개시들이 적용되는 드론(Drone)의 예들을 나타낸다.
도 7은 도 6a 및 도 6b에 도시된 복수의 카메라의 구성을 나타낸 예시도들이다.
도 8은 도 6a 및 도 6b에 도시된 드론의 구성을 예시적으로 나타낸 블록도이다.
도 9a 내지 도 9c는 도 8에 도시된 구성을 제1 개시에 따른 동작 관점에서 나타낸 블록도이다.
도 10은 도 8에 도시된 드론의 구성을 이용하는 제1 개시에 따라 제1 카메라와 제2 카메라가 기계적으로 제어되는 예를 나타낸다.
도 11a 및 도 11b는 피사체를 포함하는 이미지의 예를 나타낸 예시도들이다.
도 12은 제1 개시에 따른 일 방안을 나타낸 흐름도이다.
도 13a 내지 도 13c는 도 8에 도시된 구성을 제2 개시에 따른 동작 관점에서 나타낸 블록도이다.
도 14a 및 도 14b는 피사체를 포함하는 이미지의 예를 나타낸 예시도들이다.
도 15는 제2 개시에 따른 일 방안을 나타낸 흐름도이다.
도 16은 도 8에 도시된 구성을 제3 개시에 따른 동작 관점에서 나타낸 블록도이다.
도 17a 및 도 17b는 피사체를 포함하는 이미지의 예를 나타낸 예시도들이다.
도 18은 제3 개시에 따른 일 방안을 나타낸 흐름도이다.
본 개시의 예시들의 특정한 구조적 내지 단계적 설명들은 단지 본 개시의 개념에 따른 예시를 설명하기 위한 것이다. 따라서 본 개시의 개념에 따른 예시들은 다양한 형태로 실시될 수 있다. 본 개시의 개념에 따른 예시들은 다양한 형태로 실시될 수 있다. 본 개시는 본 개시의 예시들에 한정되는 것으로 해석되어서는 아니 된다.
본 개시의 개념에 따른 예시에 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있다. 이에, 특정 예시들을 도면에 예시하고 본 개시 또는 출원에 대해서 상세하게 설명하고자 한다. 그러나, 이는 본 개시의 개념에 따른 예시를 특정한 개시 형태에 대해 한정하려는 것이 아니다. 본 개시의 개념에 따른 여시는 본 개시의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1 및/또는 제2 등의 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만 사용될 수 있다. 상기 용어들은 본 개시의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있다. 하지만 복수의 구성요소들 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
본 개시에서 사용한 용어는 단지 특정한 예시를 설명하기 위해 사용된 것으로, 본 개시를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 개시에서, "포함하다" 또는 "가지다" 등의 용어는 서술된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이다. 따라서 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 한다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 본 개시에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
예시를 설명함에 있어서 본 개시가 속하는 기술 분야에 익히 알려져 있고 본 개시와 직접적으로 관련이 없는 기술 내용에 대해서는 설명을 생략한다. 이는 불필요한 설명을 생략함으로써 본 개시의 요지를 흐리지 않고 더욱 명확히 전달하기 위함이다.
<용어의 정의>
이하, 본 개시에서 제시되는 개시들의 이해를 돕고자, 본 개시에서 사용되는 용어들에 대하여 간략하게 정리하기로 한다.
NPU: 신경망 프로세싱 유닛(Neural Processing Unit)의 약어로서, CPU(Central processing unit)과 별개로 인공신경망모델의 연산을 위해 특화된 프로세서를 의미할 수 있다. NPU는
ANN: 인공신경망(artificial neural network)의 약어로서, 인간의 지능을 모방하기 위하여, 인간 뇌 속의 뉴런들(Neurons)이 시냅스(Synapse)를 통하여 연결되는 것을 모방하여, 노드들을 레이어(Layer: 계층) 구조로 연결시킨, 네트워크를 의미할 수 있다.
DNN: 심층 신경망(Deep Neural Network)의 약어로서, 보다 높은 인공 지능을 구현하기 위하여, 인공신경망의 은닉 레이어의 개수를 늘린 것을 의미할 수 있다.
CNN: 컨볼루션 신경망(Convolutional Neural Network)의 약어로서, 인간 뇌의 시각 피질에서 영상을 처리하는 것과 유사한 기능을 하는 신경망이다. 컨볼루션 신경망은 영상처리에 적합한 것으로 알려져 있으며, 입력 데이터의 특징들을 추출하고, 특징들의 패턴을 파악하기에 용이한 것으로 알려져 있다.
이하, 첨부한 도면을 참조하여 본 개시의 바람직한 예시를 설명함으로써, 본 개시를 상세히 설명한다. 이하, 본 개시의 예시를 첨부된 도면을 참조하여 상세하게 설명한다.
<인공지능>
인간은 인식(Recognition), 분류(Classification), 추론(Inference), 예측(Predict), 조작/의사결정(Control/Decision making) 등을 할 수 있는 지능을 갖추고 있다. 인공지능(artificial intelligence: AI)은 인간의 지능을 인공적으로 모방하는 것을 의미한다.
인간의 뇌는 뉴런(Neuron)이라는 수많은 신경세포로 이루어져 있다. 각각의 뉴런은 시냅스(Synapse)라고 불리는 연결부위를 통해 수백에서 수천 개의 다른 뉴런들과 연결되어 있다. 인간의 지능을 모방하기 위하여, 생물학적 뉴런의 동작원리와 뉴런 간의 연결 관계를 모델링한 것을, 인공신경망모델이라고 한다. 즉, 인공신경망은 뉴런들을 모방한 노드들을 레이어(Layer: 계층) 구조로 연결시킨, 시스템이다.
이러한 인공신경망모델은 레이어 수에 따라 '단층 신경망'과 '다층 신경망'으로 구분한다. 일반적인 다층신경망은 입력 레이어와 은닉 레이어, 출력 레이어로 구성된다. (1) 입력 레이어(input layer)은 외부의 자료들을 받아들이는 레이어로서, 입력 레이어의 뉴런 수는 입력되는 변수의 수와 동일하다. (2) 은닉 레이어(hidden layer)은 입력 레이어와 출력 레이어 사이에 위치하며 입력 레이어로부터 신호를 받아 특성을 추출하여 출력층으로 전달한다. (3) 출력 레이어(output layer)은 은닉 레이어로부터 신호를 받아 외부로 출력한다. 뉴런 간의 입력신호는 0에서 1 사이의 값을 갖는 각각의 연결강도와 곱해진 후 합산된다. 이 합이 뉴런의 임계치보다 크면 뉴런이 활성화되어 활성화 함수를 통하여 출력 값으로 구현된다.
한편, 보다 높은 인공 지능을 구현하기 위하여, 인공신경망의 은닉 레이어의 개수를 늘린 것을 심층 신경망(Deep Neural Network, DNN)이라고 한다.
DNN은 다양한 구조로 개발되고 있다. 예를 들면, DNN의 일 예시인 합성곱 신경망(convolutional neural network, CNN)은 입력 값 (영상 또는 이미지)의 특징들을 추출하고, 추출된 출력 값의 패턴을 파악하기에 용이한 것으로 알려져 있다. CNN은 합성곱 연산, 활성화 함수 연산, 풀링(pooling) 연산 등이 특정 순서로 처리되는 형태로 구성될 수 있다.
예를 들면, DNN의 레이어 각각에서, 파라미터(i.e., 입력 값, 출력 값, 가중치 또는 커널 등)는 복수의 채널로 구성된 행렬일 수 있다. 파라미터는 합성곱 또는 행렬 곱셈으로 NPU에서 처리될 수 있다. 각 레이어에서 연산이 처리된 출력 값이 생성된다.
예를 들면, 트랜스포머(transformer)는 어텐션(attention) 기술에 기반한 DNN이다. 트랜스포머는 행렬 곱셈(matrix multiplication) 연산을 다수 활용한다. 트랜스포머는 입력 값과 쿼리(query; Q), 키(key; K), 및 값(value; V) 등의 파라미터를 사용하여 출력 값인 어텐션(Q,K,V)를 획득할 수 있다. 트랜스포머는 출력 값 (즉, 어텐션(Q,K,V))에 기초하여 다양한 추론 연산을 처리할 수 있다. 트랜스포머는 CNN 보다 더 우수한 추론 성능을 보여주는 경향이 있다.
도 1은 예시적인 인공신경망모델을 설명하는 개략적인 개념도이다.
이하 신경망 프로세싱 유닛(100)에서 작동될 수 있는 예시적인 인공신경망모델(110a)의 연산에 대하여 설명한다.
도 1의 예시적인 인공신경망모델(110a)은 객체 인식, 음성 인식 등 다양한 추론 기능을 수행하도록 학습된 인공신경망일 수 있다.
인공신경망모델(110a)은 심층 신경망(DNN, Deep Neural Network)일 수 있다.
단, 본 개시의 예시들에 따른 인공신경망모델(110a)은 심층 신경망에 제한되지 않는다.
예를 들어, 인공신경망모델(110a)은 Transformer, YOLO, CNN, PIDNet, BiseNet, RCNN, VGG, VGG16, DenseNet, SegNet, DeconvNet, DeepLAB V3+, U-net, SqueezeNet, Alexnet, ResNet18, MobileNet-v2, GoogLeNet, Resnet-v2, Resnet50, Resnet101, Inception-v3 등의 모델로 구현될 수 있다. 단, 본 개시는 상술한 모델들에 제한되지 않는다. 또한 인공신경망모델(110a)은 적어도 두 개의 서로 다른 모델들에 기초한 앙상블 모델일 수도 있다.
이하 예시적인 인공신경망모델(110a)에 의해서 수행되는 추론 과정에 대해서 설명하기로 한다.
인공신경망모델(110a)은 입력 레이어(110a-1), 제1 연결망(110a-2), 제1 은닉 레이어(110a-3), 제2 연결망(110a-4), 제2 은닉 레이어(110a-5), 제3 연결망(110a-6), 및 출력 레이어(110a-7)을 포함하는 예시적인 심층 신경망 모델이다. 단, 본 개시는 도 1에 도시된 인공신경망모델에만 제한되는 것은 아니다. 제1 은닉 레이어(110a-3) 및 제2 은닉 레이어(110a-5)는 복수의 은닉 레이어로 지칭되는 것도 가능하다.
입력 레이어(110a-1)는 예시적으로, x1 및 x2 입력 노드를 포함할 수 있다. 즉, 입력 레이어(110a-1)는 2개의 입력 값에 대한 정보를 포함할 수 있다.
제1 연결망(110a-2)은 예시적으로, 입력 레이어(110a-1)의 각각의 노드를 제1 은닉 레이어(110a-3)의 각각의 노드로 연결시키기 위한 6개의 가중치 값에 대한 정보를 포함할 수 있다. 각각의 가중치 값은 입력 노드 값과 곱해지고, 곱해진 값들의 누산된 값이 제1 은닉 레이어(110a-3)에 저장된다. 가중치 값과 입력 노드 값은 인공신경망모델의 파라미터로 지칭될 수 있다.
제1 은닉 레이어(110a-3)는 예시적으로 a1, a2, 및 a3 노드를 포함할 수 있다. 즉, 제1 은닉 레이어(110a-3)는 3개의 노드 값에 대한 정보를 포함할 수 있다.
도 3의 제1 프로세싱 엘리먼트(PE1)는 a1 노드의 연산을 처리할 수 있다.
도 3의 제2 프로세싱 엘리먼트(PE2)는 a2 노드의 연산을 처리할 수 있다.
도 3의 제3 프로세싱 엘리먼트(PE3)는 a3 노드의 연산을 처리할 수 있다.제2 연결망(110a-4)은 예시적으로, 제1 은닉 레이어(110a-3)의 각각의 노드를 제2 은닉 레이어(110a-5)의 각각의 노드로 연결시키기 위한 9개의 가중치 값에 대한 정보를 포함할 수 있다. 제2 연결망(110a-4)의 가중치 값은 제1 은닉 레이어(110a-3)로부터 입력되는 노드 값과 각기 곱해지고, 곱해진 값들의 누산된 값이 제2 은닉 레이어(110a-5)에 저장된다.
제2 은닉 레이어(110a-5)는 예시적으로 b1, b2, 및 b3 노드를 포함할 수 있다. 즉, 제2 은닉 레이어(110a-5)는 3개의 노드 값에 대한 정보를 포함할 수 있다.
도 3의 제4 프로세싱 엘리먼트(PE4)는 b1 노드의 연산을 처리할 수 있다.
도 3의 제5 프로세싱 엘리먼트(PE5)는 b2 노드의 연산을 처리할 수 있다.
도 3의 제6 프로세싱 엘리먼트(PE6)는 b3 노드의 연산을 처리할 수 있다.
제3 연결망(110a-6)은 예시적으로, 제2 은닉 레이어(110a-5)의 각각의 노드와 출력 레이어(110a-7)의 각각의 노드를 연결하는 6개의 가중치 값에 대한 정보를 포함할 수 있다. 제3 연결망(110a-6)의 가중치 값은 제2 은닉 레이어(110a-5)로부터 입력되는 노드 값과 각기 곱해지고, 곱해진 값들의 누산된 값이 출력 레이어(110a-7)에 저장된다.
출력 레이어(110a-7)는 예시적으로 y1, 및 y2 노드를 포함할 수 있다. 즉, 출력 레이어(110a-7)는 2개의 노드 값에 대한 정보를 포함할 수 있다.
도 3의 제7 프로세싱 엘리먼트(PE7)는 y1 노드의 연산을 처리할 수 있다.
도 3의 제8 프로세싱 엘리먼트(PE8)는 y2 노드의 연산을 처리할 수 있다.
도 2a은 컨볼루션 신경망(CNN)의 기본 구조를 설명하기 위한 도면이다.
도 2a을 참조하면, 입력 이미지는 특정 사이즈(size)의 행과 특정 사이즈의 열로 구성된 2차원적 행렬로 표시될 수 있다. 입력 이미지는 복수의 채널을 가질 수 있는데, 여기서 채널은 입력 데이터 이미지의 컬러 성분의 수를 나타낼 수 있다.
컨볼루션 과정은 입력 이미지를 지정된 간격으로 순회하면서 커널과 합성곱 연산을 수행하는 것을 의미한다.
컨볼루션 신경망은 현재 레이어의 출력 값(합성곱 또는 행렬 곱셈)을 다음 레이어의 입력 값으로 전달하는 구조를 가질 수 있다.
예를 들면, 합성곱(컨볼루션)은, 두 개의 주요 파라미터(입력 특징맵 및 커널)에 의해 정의된다. 파라미터는 입력 특징맵, 출력 특징맵, 활성화 맵, 가중치, 커널, 및 어텐션(Q,K,V) 등을 포함할 수 있다,
합성곱(컨볼루션)은 입력 특징맵 위로 커널 윈도우를 슬라이딩 한다. 커널이 입력 특징맵을 슬라이딩 하는 단차 사이즈를 보폭(stride)이라고 한다.
합성곱 이후에는 풀링(pooling)이 적용될 수 있다. 또한, 컨볼루션 신경망의 끝단에는 FC (fully-connected)레이어가 배치될 수 있다.
도 2b는 컨볼루션 신경망의 동작을 이해하기 쉽게 나타낸 종합도이다.
도 2b을 참조하면, 예시적으로 입력 이미지가 6 x 6 크기를 갖는 2차원적 행렬인 것으로 나타나 있다. 또한, 도 2b에는 예시적으로 3개의 노드, 즉 채널 1, 채널 2, 채널 3이 사용되는 것으로 나타내었다.
먼저, 합성곱 동작에 대해서 설명하기로 한다.
입력 이미지(도 2b에서는 예시적으로 6 x 6 크기인 것으로 나타내어짐)는 첫 번째 노드에서 채널 1을 위한 커널 1(도 2b에서는 예시적으로 3 x 3 크기인 것으로 나타내어짐)과 합성곱되고, 그 결과로서 특징맵1(도 2b에서는 예시적으로 4 x 4 크기인 것으로 나타내어짐)이 출력된다. 또한, 상기 입력 이미지(도 2b에서는 예시적으로 6 x 6 크기인 것으로 나타내어짐)는 두 번째 노드에서 채널 2를 위한 커널 2(도 2b에서는 예시적으로 3 x 3 크기인 것으로 나타내어짐)와 합성곱되고 그 결과로서 특징맵 2(도 2b에서는 예시적으로 4 x 4 크기인 것으로 나타내어짐)가 출력된다. 또한, 상기 입력 이미지는 세 번째 노드에서 채널 3을 위한 커널 3(도 2b에서는 예시적으로 3 x 3 크기인 것으로 나타내어짐)과 합성곱되고, 그 결과로서 특징맵3(도 2b에서는 예시적으로 4 x 4 크기인 것으로 나타내어짐)이 출력된다.
각각의 합성곱을 처리하기 위해서 NPU(100)의 프로세싱 엘리먼트들(PE1 to PE12)은 MAC 연산을 수행하도록 구성된다.
다음으로, 활성화 함수의 동작에 대해서 설명하기로 한다.
합성곱 동작으로부터 출력되는 특징맵1, 특징맵2 그리고 특징맵3(도 2b에서는 각각의 크기는 예시적으로 4 x 4인 것으로 나타내어짐)에 대해서 활성화 함수가 적용될 수 있다. 활성화 함수가 적용되고 난 이후의 출력은 예시적으로 4 x 4의 크기일 수 있다.
다음으로, 폴링(pooling) 동작에 대해서 설명하기로 한다.
상기 활성화 함수로부터 출력되는 특징맵1, 특징맵2, 특징맵3(도 2b에서는 각각의 크기는 예시적으로 4 x 4인 것으로 나타내어짐)은 3개의 노드로 입력된다. 활성화 함수로부터 출력되는 특징맵들을 입력으로 받아서 폴링(pooling)을 수행할 수 있다. 상기 폴링이라 함은 크기를 줄이거나 행렬 내의 특정 값을 강조할 수 있다. 폴링 방식으로는 최대값 폴링과 평균 폴링, 최소값 폴링이 있다. 최대값 폴링은 행렬의 특정 영역 안에 값의 최댓값을 모으기 위해서 사용되고, 평균 폴링은 특정 영역내의 평균을 구하기 위해서 사용될 수 있다.
도 2b의 예시에서는 4 x 4 크기의 특징맵이 폴링에 의하여 2 x 2 크기로 줄어지는 것으로 나타내었다.
구체적으로, 첫 번째 노드는 채널 1을 위한 특징맵1을 입력으로 받아 폴링을 수행한 후, 예컨대 2 x 2 행렬로 출력한다. 두 번째 노드는 채널 2을 위한 특징맵2을 입력으로 받아 폴링을 수행한 후, 예컨대 2 x 2 행렬로 출력한다. 세 번째 노드는 채널 3을 위한 특징맵3을 입력으로 받아 폴링을 수행한 후, 예컨대 2 x 2 행렬로 출력한다.
전술한 합성곱, 활성화 함수과 폴링이 반복되고 최종적으로는, 도 8a과 같이 fully connected로 출력될 수 있다. 해당 출력은 다시 이미지 인식을 위한 인공 신경망으로 입력될 수 있다. 단, 본 개시는 특징맵, 커널의 크기에 제한되지 않는다.
지금까지 설명한 CNN은 다양한 심층신경망(DNN) 방법 중에서도 컴퓨터 비전(Vision) 분야에서 가장 많이 쓰이는 방법이다. 특히, CNN은 이미지 분류(image classification) 및 객체 검출(objection detection)과 같은 다양한 작업을 수행하는 다양한 연구 영역에서 놀라운 성능을 보였다.
<CNN을 위해 필요한 하드웨어 자원>
도 3은 본 개시에 따른 신경 프로세싱 유닛을 설명하는 개략적인 개념도이다.
도 3에 도시된 신경 프로세싱 유닛(neural processing unit, NPU)(100)은 인공신경망을 위한 동작을 수행하도록 특화된 프로세서이다.
인공신경망은 여러 입력 또는 자극이 들어오면 각각 가중치를 곱해 더해주고, 추가적으로 편차를 더한 값을 활성화 함수를 통해 변형하여 전달하는 인공 뉴런들이 모인 네트워크를 의미한다. 이렇게 학습된 인공신경망은 입력 데이터로부터 추론(inference) 결과를 출력하는데 사용될 수 있다.
NPU(100)는 전기/전자 회로로 구현된 반도체일 수 있다. 전기/전자 회로라 함은 수많은 전자 소자, (예컨대 트렌지스터, 커패시터)를 포함하는 것을 의미할 수 있다.
Transformer 및/또는 CNN 기반의 인공신경망모델인 경우, NPU(100)는 행렬 곱셈 연산, 합성곱 연산, 등을 인공신경망의 구조(architecture)에 따라 선별하여, 처리할 수 있다.
예를 들어, 합성곱 신경망(CNN)의 레이어 각각에서, 입력 데이터에 해당하는 입력 특징맵(Input feature map)과 가중치(Weight)에 해당하는 커널(kernel)은 복수의 채널로 구성된 행렬일 수 있다. 입력 특징맵과 커널의 합성곱 연산이 수행되며, 각 채널에서 합성곱 연산과 풀링 출력 특징맵(output feature map)이 생성된다. 출력 특징맵에 활성화 함수를 적용하여 해당 채널의 활성화맵(activation map)이 생성된다. 이후, 활성화맵에 대한 풀링이 적용될 수 있다. 여기서 포괄적으로 활성화맵은 출력 특징맵으로 지칭될 수 있다.
단, 본 개시의 예시들은 이에 제한되지 않으며, 출력 특징맵은 행렬 곱셈 연산 또는 합성곱 연산등이 적용된 것을 의미한다.
부연 설명하면, 본 개시의 예시들에 따른 출력 특징맵은 포괄적인 의미로 해석되어야 한다. 예를 들면, 출력 특징맵은 행렬 곱셈 연산 또는 합성곱 연산 결과값일 수 있다. 이에, 복수의 프로세싱 엘리먼트(110)는 추가 알고리즘을 위한 처리 회로부를 더 포함하도록 변형 실시되는 것도 가능하다.
NPU(100)는 상술한 인공신경망 연산에 필요한 합성곱 및 행렬 곱셈을 처리하기 위한 복수의 프로세싱 엘리먼트(110) 를 포함하도록 구성될 수 있다.
NPU(100)는 상술한 인공신경망 연산에 필요한 행렬 곱셈 연산, 합성곱 연산, 활성화 함수 연산, 풀링 연산, 스트라이드 연산, 배치 정규화 연산, 스킵 커넥션 연산, 접합 연산, 양자화 연산, 클리핑 연산, 패딩 연산에 최적화된 각각의 처리 회로를 포함하도록 구성될 수 있다.
예를 들면, NPU(100)는 상술한 알고리즘들 중 활성화 함수 연산, 풀링 연산, 스트라이드 연산, 배치 정규화 연산, 스킵 커넥션 연산, 접합 연산, 양자화 연산, 클리핑 연산, 패딩 연산 중 적어도 하나를 처리하기 위한 SFU(150)를 포함하도록 구성될 수 있다.
구체적으로, NPU(100)는 복수의 프로세싱 엘리먼트(processing element: PE) (110), SFU(150), NPU 내부 메모리(120), NPU 컨트롤러(130), 및 NPU 인터페이스(140)를 포함할 수 있다. 복수의 프로세싱 엘리먼트(110), SFU(150), NPU 내부 메모리(120), NPU 컨트롤러(130), 및 NPU 인터페이스(140) 각각은 수많은 트렌지스터들이 연결된 반도체 회로일 수 있다. 따라서, 이들 중 일부는 육안으로는 식별되어 구분되기 어려울 수 있고, 동작에 의해서만 식별될 수 있다.
예컨대, 임의 회로는 복수의 프로세싱 엘리먼트(110)으로 동작하기도 하고, 혹은 NPU 컨트롤러(130)로 동작될 수도 있다. NPU 컨트롤러(130)는 NPU(100)의 인공신경망 추론 동작을 제어하도록 구성된 제어부의 기능을 수행하도록 구성될 수 있다.
NPU(100)는 복수의 프로세싱 엘리먼트(110) 및 SFU(150)에서 추론될 수 있는 인공신경망모델의 파라미터를 저장하도록 구성된 NPU 내부 메모리(120), 및 복수의 프로세싱 엘리먼트(110), SFU(150), 및 NPU 내부 메모리(120)의 연산 스케줄을 제어하도록 구성된 스케줄러를 포함하는 NPU 컨트롤러(130)를 포함할 수 있다.
NPU(100)는 SVC 또는 SFC를 이용한 인코딩 및 디코딩 방식에 대응되어 특징맵을 처리하도록 구성될 수 있다.
복수의 프로세싱 엘리먼트(110)는 인공신경망을 위한 동작의 일부를 수행할 수 있다.
SFU(150)는 인공신경망을 위한 동작의 다른 일부를 수행할 수 있다.
NPU(100)는 복수의 프로세싱 엘리먼트(110)와 SFU(150)를 사용하여 인공신경망모델의 연산을 하드웨어적으로 가속하도록 구성될 수 있다.
NPU 인터페이스(140)는 시스템 버스를 통해서 NPU(100)와 연결된 다양한 구성요소들, 예컨대 메모리와 통신할 수 있다.
NPU 컨트롤러(130)는 신경 프로세싱 유닛(100)의 추론 연산을 위한 복수의 프로세싱 엘리먼트(110)의 연산, SFU(150)의 연산 및 NPU 내부 메모리(120)의 읽기 및 쓰기 순서를 제어하도록 구성된 스케줄러를 포함할 수 있다.
NPU 컨트롤러(130) 내의 스케줄러는 인공신경망모델의 데이터 지역성 정보 또는 구조에 대한 정보에 기초하여 복수의 프로세싱 엘리먼트(110), SFU(150), 및 NPU 내부 메모리(120)를 제어하도록 구성될 수 있다.
NPU 컨트롤러(130) 내의 스케줄러는 복수의 프로세싱 엘리먼트(110) 및 SFU(150)에서 작동할 인공신경망모델의 구조를 분석하거나 또는 이미 분석된 정보를 제공받을 수 있다. 예를 들면, 인공신경망모델이 포함할 수 있는 인공신경망의 데이터는 각각의 레이어의 노드 데이터(즉, 특징맵), 레이어들의 배치 데이터, 지역성 정보 또는 구조에 대한 정보, 각각의 레이어의 노드를 연결하는 연결망 각각의 가중치 데이터 (즉, 가중치 커널) 중 적어도 일부를 포함할 수 있다. 인공신경망의 데이터는 NPU 컨트롤러(130) 내부에 제공되는 메모리 또는 NPU 내부 메모리(120)에 저장될 수 있다.
NPU 컨트롤러(130) 내의 스케줄러는 인공신경망모델의 데이터 지역성 정보 또는 구조에 대한 정보에 기초하여 NPU(100)가 수행할 인공신경망모델의 연산 순서를 스케줄링 할 수 있다.
NPU 컨트롤러(130) 내의 스케줄러는 인공신경망모델의 데이터 지역성 정보 또는 구조에 대한 정보에 기초하여 인공신경망모델의 레이어의 특징맵 및 가중치 데이터가 저장된 메모리 어드레스 값을 획득할 수 있다. 예를 들면, NPU 컨트롤러(130) 내의 스케줄러는 메모리에 저장된 인공신경망모델의 레이어의 특징맵 및 가중치 데이터가 저장된 메모리 어드레스 값을 획득할 수 있다. 따라서 NPU 컨트롤러(130) 내의 스케줄러는 구동할 인공신경망모델의 레이어의 특징맵 및 가중치 데이터를 메인 메모리에서 가져와서 NPU 내부 메모리(120)에 저장할 수 있다.
각각의 레이어의 특징맵은 대응되는 각각의 메모리 어드레스 값을 가질 수 있다.
각각의 가중치 데이터는 대응되는 각각의 메모리 어드레스 값을 가질 수 있다.
NPU 컨트롤러(130) 내의 스케줄러는 인공신경망모델의 데이터 지역성 정보 또는 구조에 대한 정보, 예를 들면, 인공신경망모델의 인공신경망의 레이어들의 배치 데이터, 지역성 정보 또는 구조에 대한 정보에 기초해서 복수의 프로세싱 엘리먼트(110)의 연산 순서를 스케줄링 할 수 있다.
NPU 컨트롤러(130) 내의 스케줄러는 인공신경망모델의 데이터 지역성 정보 또는 구조에 대한 정보에 기초하여 스케줄링 하기 때문에, 일반적인 CPU의 스케줄링 개념과 다르게 동작할 수 있다. 일반적인 CPU의 스케줄링은 공평성, 효율성, 안정성, 반응 시간 등을 고려하여, 최상의 효율을 낼 수 있도록 동작한다. 즉, 우선 순위, 연산 시간 등을 고려해서 동일 시간내에 가장 많은 프로세싱을 수행하도록 스케줄링 한다.
종래의 CPU는 각 프로세싱의 우선 순서, 연산 처리 시간 등의 데이터를 고려하여 작업을 스케줄링 하는 알고리즘을 사용하였다.
이와 다르게 NPU 컨트롤러(130) 내의 스케줄러는 인공신경망모델의 데이터 지역성 정보 또는 구조에 대한 정보에 기초하여 결정된 NPU(100)의 프로세싱 순서대로 NPU(100)를 제어할 수 있다.
더 나아가면, NPU 컨트롤러(130) 내의 스케줄러는 인공신경망모델의 데이터 지역성 정보 또는 구조에 대한 정보 및/또는 사용하려는 신경 프로세싱 유닛(100)의 데이터 지역성 정보 또는 구조에 대한 정보에 기초하여 결정된 프로세싱 순서대로 NPU(100)를 구동할 수 있다.
단, 본 개시는 NPU(100)의 데이터 지역성 정보 또는 구조에 대한 정보에 제한되지 않는다.
NPU 컨트롤러(130) 내의 스케줄러는 인공신경망의 데이터 지역성 정보 또는 구조에 대한 정보를 저장하도록 구성될 수 있다.
즉, NPU 컨트롤러(130) 내의 스케줄러는 적어도 인공신경망모델의 인공신경망의 데이터 지역성 정보 또는 구조에 대한 정보만 활용하더라도 프로세싱 순서를 결정할 수 있다.
더 나아가서, NPU 컨트롤러(130) 내의 스케줄러는 인공신경망모델의 데이터 지역성 정보 또는 구조에 대한 정보 및 NPU(100)의 데이터 지역성 정보 또는 구조에 대한 정보를 고려하여 NPU(100)의 프로세싱 순서를 결정할 수 있다. 또한, 결정된 프로세싱 순서대로 NPU(100)의 프로세싱 최적화도 가능하다.
복수의 프로세싱 엘리먼트(110)는 인공신경망의 특징맵과 가중치 데이터를 연산하도록 구성된 복수의 프로세싱 엘리먼트들(PE1 to PE12)이 배치된 구성을 의미한다. 각각의 프로세싱 엘리먼트는 MAC (multiply and accumulate) 연산기 및/또는 ALU (Arithmetic Logic Unit) 연산기를 포함할 수 있다. 단, 본 개시에 따른 예시들은 이에 제한되지 않는다.
각각의 프로세싱 엘리먼트는 추가적인 특수 기능을 처리하기 위해 추가적인 특수 기능 유닛을 선택적으로 더 포함하도록 구성될 수 있다.
예를 들면, 프로세싱 엘리먼트(PE)는 배치-정규화 유닛, 활성화 함수 유닛, 인터폴레이션 유닛 등을 더 포함하도록 변형 실시되는 것도 가능하다.
SFU(150)는 활성화 함수 연산, 풀링(pooling) 연산, 스트라이드(stride) 연산, 배치 정규화(batch-normalization) 연산, 스킵 커넥션(skip-connection) 연산, 접합(concatenation) 연산, 양자화(quantization) 연산, 클리핑(clipping) 연산, 패딩(padding) 연산 등을 인공신경망의 구조(architecture)에 따라 선별하여, 처리하도록 구성된 회로부를 포함할 수 있다. 즉, SFU(150)는 복수의 특수 기능 연산 처리 회로 유닛들을 포함할 수 있다.
도 5에서는 예시적으로 복수의 프로세싱 엘리먼트들이 도시되었지만, 하나의 프로세싱 엘리먼트 내부에 MAC을 대체하여, 복수의 곱셈기(multiplier) 및 가산기 트리(adder tree)로 구현된 연산기들이 병렬로 배치되어 구성되는 것도 가능하다. 이러한 경우, 복수의 프로세싱 엘리먼트(110)는 복수의 연산기를 포함하는 적어도 하나의 프로세싱 엘리먼트로 지칭되는 것도 가능하다.
복수의 프로세싱 엘리먼트(110)는 복수의 프로세싱 엘리먼트들(PE1 to PE12)을 포함하도록 구성된다. 도 5에 도시된 복수의 프로세싱 엘리먼트들(PE1 to PE12)은 단지 설명의 편의를 위한 예시이며, 복수의 프로세싱 엘리먼트들(PE1 to PE12)의 개수는 제한되지 않는다. 복수의 프로세싱 엘리먼트들(PE1 to PE12)의 개수에 의해서 복수의 프로세싱 엘리먼트(110)의 사이즈 또는 개수가 결정될 수 있다. 복수의 프로세싱 엘리먼트(110)의 사이즈는 N x M 행렬 형태로 구현될 수 있다. 여기서 N 과 M은 0보다 큰 정수이다. 복수의 프로세싱 엘리먼트(110)는 N x M 개의 프로세싱 엘리먼트를 포함할 수 있다. 즉, 프로세싱 엘리먼트는 1개 이상일 수 있다.
복수의 프로세싱 엘리먼트(110)의 사이즈는 NPU(100)이 작동하는 인공신경망모델의 특성을 고려하여 설계할 수 있다.
복수의 프로세싱 엘리먼트(110)는 인공신경망 연산에 필요한 덧셈, 곱셈, 누산 등의 기능을 수행하도록 구성된다. 다르게 설명하면, 복수의 프로세싱 엘리먼트(110)는 MAC(multiplication and accumulation) 연산을 수행하도록 구성될 수 있다.
이하 복수의 프로세싱 엘리먼트(110) 중 제1 프로세싱 엘리먼트(PE1)를 예를 들어 설명한다.
도 4a는 본 개시에 적용될 수 있는 복수의 프로세싱 엘리먼트 중 하나의 프로세싱 엘리먼트를 설명하는 개략적인 개념도이다.
본 개시의 일 예시에 따른 NPU(100)는 복수의 프로세싱 엘리먼트(110), 복수의 프로세싱 엘리먼트(110)에서 추론될 수 있는 인공신경망모델을 저장하도록 구성된 NPU 내부 메모리(120) 및 복수의 프로세싱 엘리먼트(110) 및 NPU 내부 메모리(120)를 제어하도록 구성된 NPU 컨트롤러(130)를 포함하고, 복수의 프로세싱 엘리먼트(110)는 MAC 연산을 수행하도록 구성되고, 복수의 프로세싱 엘리먼트(110)는 MAC 연산 결과를 양자화해서 출력하도록 구성될 수 있다. 단, 본 개시의 예시들은 이에 제한되지 않는다.
NPU 내부 메모리(120)은 메모리 사이즈와 인공신경망모델의 데이터 사이즈에 따라 인공신경망모델의 전부 또는 일부를 저장할 수 있다.
제1 프로세싱 엘리먼트(PE1)는 곱셈기(111), 가산기(112), 누산기(113), 및 비트 양자화 유닛(114)을 포함할 수 있다. 단, 본 개시에 따른 예시들은 이에 제한되지 않으며, 복수의 프로세싱 엘리먼트(110)는 인공신경망의 연산 특성을 고려하여 변형 실시될 수도 있다.
곱셈기(111)는 입력 받은 (N)bit 데이터와 (M)bit 데이터를 곱한다. 곱셈기(111)의 연산 값은 (N+M)bit 데이터로 출력된다.
곱셈기(111)는 하나의 변수와 하나의 상수를 입력 받도록 구성될 수 있다.
누산기(113)는 (L)loops 횟수만큼 가산기(112)를 사용하여 곱셈기(111)의 연산 값과 누산기(113)의 연산 값을 누산 한다. 따라서 누산기(113)의 출력부와 입력부의 데이터의 비트 폭은 (N+M+log2(L))bit로 출력될 수 있다. 여기서 L은 0보다 큰 정수이다.
누산기(113)는 누산이 종료되면, 초기화 신호(initialization reset)를 입력 받아서 누산기(113) 내부에 저장된 데이터를 0으로 초기화 할 수 있다. 단, 본 개시에 따른 예시들은 이에 제한되지 않는다.
비트 양자화 유닛(114)은 누산기(113)에서 출력되는 데이터의 비트 폭을 저감할 수 있다. 비트 양자화 유닛(114)은 NPU 컨트롤러(130)에 의해서 제어될 수 있다. 양자화된 데이터의 비트 폭은 (X)bit로 출력될 수 있다. 여기서 X는 0보다 큰 정수이다. 상술한 구성에 따르면, 복수의 프로세싱 엘리먼트(110)는 MAC 연산을 수행하도록 구성되고, 복수의 프로세싱 엘리먼트(110)는 MAC 연산 결과를 양자화해서 출력할 수 있는 효과가 있다. 특히 이러한 양자화는 (L)loops가 증가할수록 소비 전력을 더 절감할 수 있는 효과가 있다. 또한 소비 전력이 저감되면 발열도 저감할 수 있는 효과가 있다. 특히 발열을 저감하면 NPU(100)의 고온에 의한 오동작 발생 가능성을 저감할 수 있는 효과가 있다.
비트 양자화 유닛(114)의 출력 데이터(X)bit은 다음 레이어의 노드 데이터 또는 합성곱의 입력 데이터가 될 수 있다. 만약 인공신경망모델이 양자화되었다면, 비트 양자화 유닛(114)은 양자화된 정보를 인공신경망모델에서 제공받도록 구성될 수 있다. 단, 이에 제한되지 않으며, NPU 컨트롤러(130)는 인공신경망모델을 분석하여 양자화된 정보를 추출하도록 구성되는 것도 가능하다. 따라서 양자화된 데이터 사이즈에 대응되도록, 출력 데이터(X)bit를 양자화 된 비트 폭으로 변환하여 출력될 수 있다. 비트 양자화 유닛(114)의 출력 데이터(X)bit는 양자화된 비트 폭으로 NPU 내부 메모리(120)에 저장될 수 있다.
본 개시의 일 예시에 따른 NPU(100)의 복수의 프로세싱 엘리먼트(110)는 곱셈기(111), 가산기(112), 및 누산기(113)를 포함한다. 비트 양자화 유닛(114)은 양자화 적용 여부에 따라 취사 선택될 수 있다.
도 4b는 본 개시에 적용될 수 있는 SFU를 설명하는 개략적인 개념도이다.
도 4b를 참고하면 SFU(150)는 여러 기능 유닛을 포함한다. 각각의 기능 유닛은 선택적으로 동작될 수 있다. 각각의 기능 유닛은 선택적으로 턴-온되거나 턴-오프될 수 있다. 즉, 각각의 기능 유닛은 설정이 가능하다.
다시 말해서, SFU(150)는 인공신경망 추론 연산에 필요한 다양한 회로 유닛들을 포함할 수 있다.
예를 들면, SFU(150)의 회로 유닛들은 건너뛰고 연결하기(skip-connection) 동작을 위한 기능 유닛, 활성화 함수(activation function) 동작을 위한 기능 유닛, 풀링(pooling) 동작을 위한 기능 유닛, 양자화(quantization) 동작을 위한 기능 유닛, NMS(non-maximum suppression) 동작을 위한 기능 유닛, 정수 및 부동 소수점 변환(INT to FP32) 동작을 위한 기능 유닛, 배치 정규화(batch-normalization) 동작을 위한 기능 유닛, 보간법(interpolation) 동작을 위한 기능 유닛, 연접(concatenation) 동작을 위한 기능 유닛, 및 바이아스(bias) 동작을 위한 기능 유닛 등을 포함할 수 있다.
SFU(150)의 기능 유닛들은 인공신경망모델의 데이터 지역성 정보에 의해서 선택적으로 턴-온되거나 혹은 턴-오프될 수 있다. 인공신경망모델의 데이터 지역성 정보는 특정 레이어를 위한 연산이 수행될 때, 해당 기능 유닛의 턴-오프 혹은 턴-오프와 관련된 제어 정보를 포함할 수 있다.
SFU(150)의 기능 유닛들 중 활성화된 유닛은 턴-온 될 수 있다. 이와 같이 SFU(150)의 일부 기능 유닛을 선택적으로 턴-오프하는 경우, NPU(100)의 소비 전력을 절감할 수 있다. 한편, 일부 기능 유닛을 턴-오프하기 위하여, 파워 게이팅(power gating)을 이용할 수 있다. 또는, 일부 기능 유닛을 턴-오프하기 위하여, 클럭 게이팅(clock gating)을 수행할 수도 있다.
도 5는 도 3에 도시된 NPU(100)의 변형예를 나타낸 예시도이다.
도 5에 도시된 NPU(100)는 도 3에 예시적으로 도시된 프로세싱 유닛(100)과 비교하면, 복수의 프로세싱 엘리먼트(110)를 제외하곤 실질적으로 동일하기 때문에, 이하 단지 설명의 편의를 위해서 중복 설명은 생략할 수 있다.
도 5에 예시적으로 도시된 복수의 프로세싱 엘리먼트(110)는 복수의 프로세싱 엘리먼트들(PE1 to PE12) 외에, 각각의 프로세싱 엘리먼트들(PE1 to PE12)에 대응되는 각각의 레지스터 파일들(RF1 to RF12)을 더 포함할 수 있다.
도 5에 도시된 복수의 프로세싱 엘리먼트들(PE1 to PE12) 및 복수의 레지스터 파일들(RF1 to RF12)은 단지 설명의 편의를 위한 예시이며, 복수의 프로세싱 엘리먼트들(PE1 to PE12) 및 복수의 레지스터 파일들(RF1 to RF12)의 개수는 제한되지 않는다.
복수의 프로세싱 엘리먼트들(PE1 to PE12) 및 복수의 레지스터 파일들(RF1 to RF12)의 개수에 의해서 복수의 프로세싱 엘리먼트(110)의 사이즈 또는 개수가 결정될 수 있다. 복수의 프로세싱 엘리먼트(110) 및 복수의 레지스터 파일들(RF1 to RF12)의 사이즈는 N x M 행렬 형태로 구현될 수 있다. 여기서 N 과 M은 0보다 큰 정수이다.
복수의 프로세싱 엘리먼트(110)의 어레이 사이즈는 NPU(100)이 작동하는 인공신경망모델의 특성을 고려하여 설계할 수 있다. 부연 설명하면, 레지스터 파일의 메모리 사이즈는 작동할 인공신경망모델의 데이터 사이즈, 요구되는 동작 속도, 요구되는 소비 전력 등을 고려하여 결정될 수 있다.
NPU(100)의 레지스터 파일들(RF1 to RF12)은 프로세싱 엘리먼트들(PE1 to PE12)과 직접 연결된 정적 메모리 유닛이다. 레지스터 파일들(RF1 to RF12)은 예를 들면, 플립플롭, 및/또는 래치 등으로 구성될 수 있다. 레지스터 파일들(RF1 to RF12)은 대응되는 프로세싱 엘리먼트들(PE1 to PE12)의 MAC 연산 값을 저장하도록 구성될 수 있다. 레지스터 파일들(RF1 to RF12)은 NPU 내부 메모리(120)와 가중치 데이터 및/또는 노드 데이터를 제공하거나 제공받도록 구성될 수 있다.
레지스터 파일들(RF1 to RF12)은 MAC 연산 시 누산기의 임시 메모리의 기능을 수행하도록 구성되는 것도 가능하다.
<본 개시들이 적용되는 이동가능한 기기>
도 6a 및 도 6b는 본 개시들이 적용되는 드론(Drone)의 예들을 나타낸다.
도 6a 및 도 6b를 참조하면, 인공지능 객체 인식 기능이 고도화된 이동가능한 기기는 이동하는 타겟 물체를 추적하면서 촬영할 수 있다.
본 개시에 따른 기기는 카메라를 자동으로 조종하도록 구성된다. 구체적으로 카메라를 자종으로 조종하여 기기에 장착된 카메라로 촬영된 영상 내에서 특정 피사체(예컨대, 임의의 사람)를 감지(detection) 또는 추적(tracking)하도록 구성될 수 있다.
본 개시에 따른 기기는 목표 피사체가 이동할 경로 또는 방향을 NPU를 이용하여 예측하도록 구성된다. 따라서 기기에서 예측된 경로 또는 방향으로 이동가능한 기기 또는 카메라를 자동 조정하도록 구성될 수 있다.
도 6a 및 도 6b을 참조하면, 이동가능한 기기(1000)에는 하나 또는 복수의 카메라가 장착될 수 있다. 복수의 카메라는 제1 카메라(1021) 및 제2 카메라(1022)를 포함할 수 있다.
예를 들어, 제1 카메라(1021)는 망원 카메라(telephoto camera)일 수 있다. 제2 카메라(1022)는 망원 카메라(wide-angle camera)일 수 있다. 즉, 제2 카메라(1022)는 제1 카메라(1021) 보다 작은 화각을 가질 수 있다.
또는 제1 카메라(1021)는 가시 광선 카메라일 수 있다. 제2 카메라(1022)는 자외선 카메라(ultra violet camera), 적외선 카메라(infrared camera), 열화상 카메라(thermal imaging camera) 및 나이트 비전 카메라(night vision camera) 중 적어도 하나일 수 있다.
도 7은 도 6a 및 도 6b에 도시된 복수의 카메라의 구성을 나타낸 예시도들이다.
도 7을 참조하면, 제1 카메라(1021)는 제1 렌즈(1021-1), 제1 이미지 센서(1021-2), 제1 렌즈(1021-1)를 물리적으로 조정하는 제1 렌즈 구동 모터(1021-3), 및 제1 ISP(image signal processor)(1021-4)를 포함할 수 있다.
제2 카메라(1022)는 제2 렌즈(1022-1), 제2 이미지 센서(1022-2), 제2 렌즈(1022-1)를 물리적으로 조정하는 제2 렌즈 구동 모터(1022-3), 및 제2 ISP(1022-4)를 포함할 수 있다.
제1 카메라(1021)와 제2 카메라(1022)는 카메라 조정부(1020)와 연결될 수 있다.
카메라 조정부(1020)는 제1 카메라(1021)의 제1 ISP(1021-4), 제1 이미지 센서(1021-2), 및 제1 렌즈 구동 모터(1021-3)와 연결되어, 이들을 제어할 수 있다.
카메라 조정부(1020)는 제2 카메라(1022)의 제2 ISP(1022-4), 제2 이미지 센서(1022-2), 및 제2 렌즈 구동 모터(1022-3)와 연결되어, 이들을 제어할 수 있다.
제1 렌즈 구동 모터(1021-3)는 제1 렌즈(1021-1)를 물리적으로 조정하거나, 제1 이미지 센서(1021-2)를 물리적으로 조정할 수 있다. 따라서 제1 렌즈(1021-1)와 제1 이미지 센서(1021-2) 간의 거리가 증가되거나 또는 감소될 수 있다. 이에 따라, 줌-인(Zoom-in) 또는 줌-아웃(Zoom-out)이 달성되게 된다. 또한, 제1 렌즈 구동 모터(1021-3)는 제1 렌즈(1021-1)를 X 방향, Y 방향, Z 방향으로 이동 또는 회전시킬 수 있다. 따라서, 제1 카메라(1021)가 출력하는 영상의 화각, 초점 거리, 광학 줌 등을 조절할 수 있다.
제2 렌즈 구동 모터(1022-3)는 제2 렌즈(1022-1)를 물리적으로 조정하거나, 제2 이미지 센서(1022-2)를 물리적으로 조정할 수 있다. 따라서 제2 렌즈(1022-1)와 제2 이미지 센서(10222-2) 간의 거리가 증가되거나 또는 감소될 수 있다. 이에 따라, 줌-인(Zoom-in) 또는 줌-아웃(Zoom-out)이 달성되게 된다. 또한, 제2 렌즈 구동 모터(1022-3)는 제2 렌즈(1022-1)를 X 방향, Y 방향, Z 방향으로 이동 또는 회전시킬 수 있다. 따라서, 제2 카메라(1022)가 출력하는 영상의 화각, 초점 거리, 광학 줌 등을 조절할 수 있다.
카메라 조정부(1020)는 제1 렌즈 구동 모터(1021-3)를 제어하도록 구성된다. 제1 렌즈 구동 모터(1021-3)는 제1 카메라(1021)를 X 방향, Y 방향, Z 방향으로 이동 또는 요(Yaw) 회전 또는 피치(pitch) 회전시키도록 구성된다.
카메라 조정부(1020)는 제2 렌즈 구동 모터(1022-3)를 제어하도록 구성된다. 제2 렌즈 구동 모터(1022-3)는 제2 카메라(1022)를 X 방향, Y 방향, Z 방향으로 이동 또는 요(Yaw) 회전 또는 피치(pitch) 회전시키도록 구성된다.
카메라 조정부(1020)는 제1 카메라(1021)의 제1 이미지 센서(1021-2) 또는 제1 ISP(1021-4)를 제어할 수 있다. 카메라 조정부(1020)는 제1 카메라(1021)가 더 높은 해상도의 이미지를 캡쳐할 수 있도록, 제1 이미지 센서(1021-2)를 제어할 수 있다. 제1 ISP(1021-4)는 촬영된 이미지를 다운스케일(또는 다운사이징)하도록 구성될 수 있다.
카메라 조정부(1020)는 제2 카메라(1022)의 제2 이미지 센서(1022-2) 또는 제2 ISP(1022-4)를 제어할 수 있다. 카메라 조정부(1020)는 제2 카메라(1022)가 더 높은 해상도의 이미지를 캡쳐할 수 있도록, 제2 이미지 센서(1022-2)를 제어할 수 있다. 제2 ISP(1022-4)는 촬영된 이미지를 다운스케일(또는 다운사이징)하도록 제어할 수 있다.
도 8은 도 6a 및 도 6b에 도시된 이동가능한 기기의 구성을 예시적으로 나타낸 블록도이다.
도 8을 참조하면, 이동가능한 기기(1000)는 도 1 또는 도 3에 도시된 NPU(100), 메모리(200), 무선 통신부(1010), 카메라 조정부(1020), 센싱부(1030), 시스템 버스(1060), 및 CPU(1080)를 포함할 수 있다.
무선 통신부(1010)는 4G 통신부, 5G 통신부, 6G 통신부 그리고 근거리 통신부 중 하나 이상을 포함할 수 있다. 4G 통신부는 LTE(Long Term Evolution) 또는 LTE-A(LTE-Advanced)를 위한 것일 수 있다. 5G 통신부는 5G NR(New Radio)를 위한 것일 수 있다. 근거리 통신부는 예를 들면 WLAN(Wireless LAN), Wi-Fi(Wireless-Fidelity), Wi-Fi(Wireless Fidelity) Direct, 블루투스(Bluetooth??), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication), Wireless USB(Wireless Universal Serial Bus) 등을 지원할 수 있다.
무선 통신부(1010)는 이동가능한 기기의 비행을 조정하기 위한 신호를 송수신하거나, 촬영된 영상을 전송하거나, 또는 NPU에 의한 추론 결과를 전송하기 위해서 사용될 수 있다.
도 7을 참조하면, 카메라 조정부(1020)는 외부로부터 제어 신호(또는 결정 데이터)를 입력 받을 수 있다.
카메라 조정부(1020)는 제어 신호(또는 결정 데이터)에 의해서 제1 카메라(1021)의 제1 이미지 센서(1021-2), 제1 렌즈 구동 모터(1021-3) 및/또는 제1 ISP(1021-4)를 제어하도록 구성될 수 있다. 카메라 조정부(1020)는 입력 받은 제어 신호(또는 결정 데이터)에 기초하여 제1 이미지 센서(1021-2), 제1 렌즈 구동 모터(1021-3) 및 제1 ISP(1021-4) 중 적어도 하나에 대응되는 제어 신호(또는 결정 데이터)를 제공할 수 있다.
카메라 조정부(1020)는 제어 신호(또는 결정 데이터)에 의해서 제2 카메라(1022)의 제2 이미지 센서(1022-2), 제2 렌즈 구동 모터(1022-3) 및/또는 제2 ISP(1022-4)를 제어하도록 구성될 수 있다. 카메라 조정부(1020)는 입력 받은 제어 신호(또는 결정 데이터)에 기초하여 제2 이미지 센서(1022-2), 제2 렌즈 구동 모터(1022-3) 및 제2 ISP(1022-4) 중 적어도 하나에 대응되는 제어 신호(또는 결정 데이터)를 제공할 수 있다.
여기서, 카메라 조정부(1020)에 입력되는 제어 신호(또는 결정 데이터)와 제1 이미지 센서(1021-2), 제1 렌즈 구동 모터(1021-3) 및 제1 ISP(1021-4)에 입력되는 제어 신호(또는 결정 데이터)는 서로 실질적으로 동일한 신호일 수 있다.
단, 이에 제한되지 않으며, 카메라 조정부(1020)에 입력되는 제어 신호(또는 결정 데이터)와 제1 이미지 센서(1021-2), 제1 렌즈 구동 모터(1021-3) 및 제1 ISP(1021-4) 각각에 입력되는 각각의 제어 신호(또는 결정 데이터)는 각각의 구성 요소에 대응되도록 변환된 신호 일 수 있다.
카메라 조정부(1020)는 제1 이미지 센서(1021-2) 또는 제1 ISP(1021-4)에게 제어 신호(또는 결정 데이터)를 전달하여 제1 이미지 센서(1021-2) 또는 제1 ISP(1021-4)를 제어할 수 있다.
카메라 조정부(1020)는 제2 이미지 센서(1022-2) 또는 제2 ISP(1022-4)에게 제어 신호(또는 결정 데이터)를 전달하여 제2 이미지 센서(1022-2) 또는 제2 ISP(1022-4)를 제어할 수 있다.
카메라 조정부(1020)는 제1 카메라(1021)의 제1 이미지 센서(1021-2)가 캡쳐링된 이미지의 해상도 및/또는 초당 프레임 속도(fps)를 조절할 수 있도록, 제1 이미지 센서(1021-2)에게 제어 신호(또는 결정 데이터)를 전달할 수 있다.
카메라 조정부(1020)는 제1 카메라(1021)의 제1 ISP(1021-4)가 캡쳐링된 이미지를 다운스케일링 또는 업스케일링할 수 있도록, 제1 ISP(1021-4)에게 제어 신호(또는 결정 데이터)를 전달할 수 있다.
카메라 조정부(1020)는 제2 카메라(1022)의 제2 이미지 센서(1022-2)가 캡쳐링된 이미지의 해상도 및/또는 초당 프레임 속도(fps)를 조절할 수 있도록, 제2 이미지 센서(1022-2)에게 제어 신호(또는 결정 데이터)를 전달할 수 있다.
카메라 조정부(1020)는 제2 카메라(1022)의 제2 ISP(1022-4)가 캡쳐링된 이미지를 다운스케일링 또는 업스케일링할 수 있도록, 제2 ISP(1022-4)에게 제어 신호(또는 결정 데이터)를 전달할 수 있다.
센싱부(1030)는 고도 센서(1031), 위치 센서(예컨대, GNSS 또는 GPS)(1032), 자이로 센서(1033), 속도 센서(1034)를 포함할 수 있다. 고도 센서(1031)는 이동가능한 기기(1000)이 지면으로부터 떠 있는 높이를 측정할 수 있다. 위치 센서(1032)는 이동가능한 기기(1000)의 위치 좌표를 측정할 수 있다. 또한, 위치 센서(1032)는 이동가능한 기기(1000)가 지면으로부터 떠 있는 높이를 측정할 수도 있다. 속도 센서(1034)는 이동가능한 기기(1000)의 속도 뿐만 아니라 가속도도 측정할 수 있다. 센싱부(1030)는 측정된 데이터를 CPU(1080)로 전달하거나, 무선 통신부(1010)를 통해 인터넷으로 전송하거나 혹은 무선 통신부(1010)를 통해 이동가능한 기기(1000)를 조정하는 사용자의 단말기로 전달할 수 있다.
시스템 버스(1060)는 무선 통신부(1010), 카메라 조정부(120), 센싱부(1030), 메모리(200), CPU(1080), 및 NPU(100)를 서로 연결하는 인터페이스를 제공할 수 있다.
메모리(200)는 인공신경망모델에 대한 정보를 포함할 수 있다. 인공신경망모델은 CNN 일종인 예컨대 Yolo일 수 있다. 메모리(200)에 저장된 인공신경망모델에 대한 정보는 인공신경망모델의 레이어 개수, 레이어 당 채널 개수, 각 레이어 내의 각 채널에 사용되는 가중치 행렬에 대한 정보를 포함할 수 있다.
구체적으로, 메모리(200)는 후술하는 바와 같이, 머신 코드 저장부, 이미지 저장부, 출력 특징맵 저장부 그리고 머신 코드 별 가중치 저장부 등을 포함할 수 있다. 이에 대해서는, 도 16을 참조하여 후술하기로 한다.
NPU(100)는 도 3 또는 도 5에 도시된 바와 같이, 복수의 프로세싱 엘리먼트(110), 내부 메모리(120), NPU 컨트롤러(130), SFU(Special Function Unit)(150) 그리고 내부 메모리(120)에 액세스하고 제어하는 DMA(direct memory access)(125)을 포함할 수 있다. 또한, 도 8에 도시되지는 않았지만, NPU(100)는 도 3 또는 도 5에 도시된 바와 같이 NPU 인터페이스(140)를 더 포함할 수 있다.
NPU(100)내의 복수의 프로세싱 엘리먼트(110) 및/또는 SFU(150)는 제1 카메라(1021)와 제2 카메라(1022)로부터 획득된 하나 이상의 이미지에 기초하여, 적어도 하나의 객체인 피사체를 감지(detect) 또는 추적(track)하기 위한 추론 결과를 출력하도록 학습된 인공신경망모델의 연산을 인공신경망모델의 각 레이어 별로 수행할 수 있다.
만약 적어도 하나의 객체가 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나 추적되는 경우, NPU(100) 및/또는 CPU(1080)는 감지 또는 추적의 정확도를 높이기 위하여, 제1 카메라(1021) 또는 제2 카메라(1022)를 기계적 또는 전기적으로 제어하기 위한 명령어를 포함하는 제어 신호(또는 결정 데이터)를 생성할 수 있다.
신뢰도 레벨은 0 내지 1의 값일 수 있으며, 신뢰도 레벨 0.0의 의미는, 감지된 객체의 클래스의 추론 정확도가 0%라는 것을 의미할 수 있다. 신뢰도 레벨 0.5의 의미는, 감지된 객체의 클래스의 추론 정확도가 50%라는 것을 의미할 수 있다. 신뢰도 레벨 1.0의 의미는, 감지된 객체의 클래스의 추론 정확도가 100%라는 것을 의미할 수 있다. 임계값은 0 내지 1의 값일 수 있다.
예를 들면, 구체적으로, 도 9a에 도시된 바와 같이, NPU(100) 내의 SFU(150)는 결정 데이터를 생성하도록 구성된 회로부를 더 포함하도록 구성될 수 있다. 이에, SFU(150)는 결정 데이터를 포함하는 제어 신호를 생성하도록 구성될 수 있다. 대안적으로, 상기 NPU(100) 내의 NPU 컨트롤러(130)가 명령어를 포함하는 제어 신호를 생성하도록 구성될 수 있다. 이를 위하여, NPU(100) 내의 NPU 컨트롤러(130)는 PE(110) 및/또는 SFU(150)를 제어하여 인공신경망모델의 추론 결과를 수신할 수 있다. SFU(150)는 추론 결과의 신뢰도 레벨에 기초하여 추론 카메라 조정부(1020)의 제어 신호(또는 결정 데이터)를 생성하도록 구성될 수 있다.
또는, 도 9b에 도시된 바와 같이, CPU(1080)가 결정 데이터를 포함하는 제어 신호를 생성하도록 구성될 수 있다. 이를 위하여, CPU(1080)는 NPU(100)로부터 추론 결과를 수신할 수 있다.
또는, 도 9c에 도시된 바와 같이, NPU(100)는 AP(Application Processor)를 더 포함할 수도 있다. AP는 SFU(150) 대신에 결정 데이터를 포함하는 제어 신호를 생성하도록 구성될 수 있다.
전술한 바와 같이, NPU(100)는 감지 또는 추적의 정확도를 높이기 위하여, 카메라 조정부(1020)로 제어 신호(또는 결정 데이터)를 전송하도록 구성될 수 있다. 구체적으로, NPU(100)는 적어도 하나의 객체가 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나 추적되는지를 판단할 수 있다. 만약, 적어도 하나의 객체가 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나 추적되는 경우, 제어 신호(또는 결정 데이터)를 생성한 후, 카메라 조정부(1020)로 전달할 수 있다. 예를 들어, NPU(100) 내의 NPU 컨트롤러(130), SFU(150), 또는 AP는 처리된 감지 또는 추적 결과를 수신한 후, 적어도 하나의 객체가 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나 추적되는지를 판단할 수 있다. 만약, 적어도 하나의 객체가 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나 추적되는 경우, NPU(100) 내의 NPU 컨트롤러(130), SFU(150), 또는 AP는 제어 신호(또는 결정 데이터)를 생성한 후, 카메라 조정부(1020)로 전달할 수 있다.
NPU(100)의 내부 메모리(120)는 적어도 하나의 객체를 감지(detect) 또는 추적(track)하기 위한 추론 결과를 출력하도록 학습된 인공신경망모델에 대한 파라미터를 DMA(125)를 이용하여 시스템 버스(1060)를 통해 메모리(200)로부터 가져와서 임시 저장할 수 있다. NPU(100)의 내부 메모리(120)는 인공신경망모델의 연산을 위하여 입력 특징맵, 출력 특징맵, 활성화맵, 가중치 커널 등의 파라미터를 임시 저장할 수 있다.
구체적으로, NPU(100)의 내부 메모리(120)의 구성은 인공신경망모델의 구조에 따라 상이해질 수 있다. 예를 들면, CNN 모델을 처리하도록 구성된 NPU(100)의 경우, NPU(100) 내의 내부 메모리(120)는 후술하는 바와 같이, 입력 특징맵 저장부, 출력 특징맵 저장부 그리고 가중치 저장부 등을 포함할 수 있다. 단, 이에 대해서는, 도 16을 참조하여 후술하기로 한다.
NPU(100) 내의 NPU 컨트롤러(130)은 도 3 또는 도 5에 도시된 바와 같은 스케줄러 외에도, 펌웨어 저장부를 더 포함할 수도 있다.
펌웨어 저장부는 예를 들어, 컴파일된 복수의 머신 코드들의 세트와 명렁어 세트를 저장할 수 있다. 대안적으로, 상기 복수의 머신 코드들의 세트는 상기 내부 메모리(120)에 저장되어 있을 수도 있다.
예를 들어, 복수의 머신 코드들의 세트는 제1 사이즈(예, 200 x 200 x 3)의 입력 특징맵을 이용하는 제1 인공신경망모델을 위한 제1 세트의 머신 코드와, 제2 사이즈(예, 320 x 320 x 3)의 입력 특징맵을 이용하는 제2 인공신경망모델을 위한 제2 세트의 머신 코드를 포함할 수 있다. 추가적으로, 복수의 머신 코드들의 세트는 제3 사이즈(예, 400 x 400 x 3)의 입력 특징맵을 이용하는 제3 인공신경망모델을 위한 제3 세트의 머신 코드를 더 포함할 수도 있다. 부연 설명하면, 제어 신호(또는 결정 데이터)에 따라서 입력 특징맵의 사이즈가 변경되도록 구성될 수 있다. 이에, 복수의 입력 특징맵의 사이즈에 대응되는 복수의 머신 코드가 각각 컴파일 되어야 한다. 그리고 NPU(100)는 입력 특징맵 사이즈 변경 시 대응되는 머신 코드로 스위칭 할 수 있다.
예를 들면, 복수의 머신 코드들의 세트는 서로 다른 인공신경망모델을 포함도록 구성될 수 있다. 여기서 제1 인공신경망모델은 작은 객체인식에 유리한 특성을 가지고 제2 인공신경망모델은 큰 객체인식에 유리한 특성을 가질 수 있다.
각 인공신경망모델의 머신 코드를 컴파일링(compiling)하기 위하여, 컴파일러가 사전에 준비될 수 있다. 컴파일러는 특정 인공신경망모델을 처리하기 위해서, 입력 특징맵의 사이즈 및 해당 인공신경망모델의 구조 데이터에 기초하여 최적의 연산을 스케줄링 할 수 있다. 즉, 컴파일러는 임의 인공신경망모델 내의 레이어 각각에 대응되는 데이터의 사이즈를 분석하고, 그에 따라 NPU(100) 내의 내부 메모리(120)를 효율적으로 사용하여, 메모리(200)의 액세스 명령 생성 빈도를 최소화하는 머신 코드를 생성할 수 있다.
또한, 컴파일러는 임의 인공신경망모델 내의 각 레이어의 가중치와 특징맵의 데이터 사이즈 그리고 NPU(100)의 내부 메모리(120)의 메모리 사이즈를 기초로, 각 레이어 별로 특징맵 및/또는 커널의 최적의 타일(tile)의 개수를 산출할 수 있다. 입력 특징맵의 사이즈가 크고, 내부 메모리(120)의 메모리 사이즈가 작을수록 타일의 개수가 증가할 수 있다. 입력 특징맵의 사이즈가 작고, 내부 메모리(120)의 메모리 사이즈가 클수록 타일의 개수가 감소할 수 있다. 따라서, 컴파일러는 최적의 타일의 개수에 대응되는 인공신경망모델을 위한 복수의 머신 코드들의 세트를 생성할 수 있다. 즉, 입력 특징맵의 사이즈에 따라서 타일의 개수가 다르게 컴파일 되어야 한다.
즉, 제공될 수 있는 세트에 포함된 복수의 머신 코드들의 개수는 NPU(100)에 입력되는 스위칭 가능한 입력 특징맵의 사이즈들의 개수와 대응될 수 있다. 예를 들면, 스위칭 가능한 입력 특징맵의 사이즈가 200 x 200 x 3 및 400 x 400 x3 일 경우, 세트에 포함된 복수의 머신 코드들의 개수는 2일 수 있다.
복수의 머신 코드들의 세트에 대한 인덱스 정보는 NPU 컨트롤러(130) 내의 펌웨어 저장부에 저장되어 있을 수 있다. 이동가능한 기기(1000)의 구동 초기에, CPU(1080)는 NPU 컨트롤러(130) 내의 펌웨어 저장부로부터 복수의 머신 코드들의 세트에 대한 인덱스 정보를 로딩한 후, CPU(1080) 내의 캐시 메모리에 저장해둘 수 있다.
CPU(1080)는 이동가능한 기기(1000)의 이동 경로 또는 이동 방향을 결정한 후, 결정된 이동 경로 또는 이동 방향으로 이동가능한 기기(1000)가 움직이도록 제어할 수 있다. 이를 위해, CPU(1080)는 센싱부(1030)로부터 측정 데이터(즉, 환경적 조건 데이터)를 수신할 수 있다.
구체적으로, CPU(1080)는 이동가능한 기기(1000)의 비행을 제어할 수 있다. 단 본 개시의 이동가능한 기기는 비행 물체에 제한되지 않으며, 지상, 수상 및 수중에서 이동가능한 기기로 확장 실시될 수 있다.
예를 들어, CPU(1080)는 위치 센서(1032)를 통해 측정된 위치 정보와 도착지 위치 정보를 비교하면서, 이동가능한 기기(1000)의 비행 경로와 비행 속도, 비행 고도 등을 결정할 수 있다. 또한, CPU(1000)는 결정된 비행 속도와 결정된 비행 고도와 고도 센서(1031), 자이로 센서(1033) 그리고 속도 센서(1034)로부터 획득된 측정치들과 비교하여 이동가능한 기기(1000)의 정상 비행 여부를 판단할 수 있다. 따라서 이동가능한 기기(1000)는 이동가능한 기기(1000)의 비행을 지속적으로 제어할 수 있다.
CPU(1080) 및/또는 NPU(100)는 센싱부(1030)로부터 측정 데이터(즉, 환경적 조건 데이터)를 수신할 수 있다. 또한, CPU(1080)는 NPU(100)로부터 추론 결과를 수신할 수 있다. 또한, NPU(1080)는 제1 카메라(1021) 및 제2 카메라(1022)로부터 촬영된 영상을 수신할 수 있다. NPU(1080)는 카메라 조정부(1020)로 제어 신호(또는 결정 데이터)를 전달할 수 있다. 제어 신호(또는 결정 데이터)는 제1 카메라(1021) 및 제2 카메라(1022)를 X 방향, Y 방향, Z 방향으로 이동시키기 위한 제어 신호(또는 결정 데이터)를 포함할 수 있다. 또한, 제어 신호(또는 결정 데이터)는 카메라 조정부(1020)는 제1 카메라(1021) 및 제2 카메라(1022)를 요(Yaw) 회전 또는 피치(pitch) 회전시키기 위한 제어 신호(또는 결정 데이터)를 포함할 수 있다. 또한, CPU(1080)는 이동가능한 기기(1000)의 이동 경로 또는 이동 방향을 결정할 수 있다. CPU(1080)는 결정된 이동 경로 또는 이동 방향으로 이동가능한 기기(1000)가 움직이도록 제어할 수 있다.
CPU(1080)는 제1 카메라(1021) 및 제2 카메라(1022)로부터 촬영된 영상을 수신할 수 있다. 또한, CPU(1080)는 NPU(100)로부터 추론 결과(즉, 객체 감지 또는 추적 결과)를 수신할 수 있다.
CPU(1080)는 NPU(100) 내의 NPU 컨트롤러(130), SFU(150) 또는 AP 대신에, 감지 또는 추적의 정확도를 높이기 위하여, 제1 카메라(1021) 또는 제2 카메라(1022)를 기계적 또는 전기적으로 제어하기 위한 명령어를 포함하는 제어 신호(또는 결정 데이터)를 생성하여, 카메라 조정부(1020)로 전달할 수 있다.
구체적으로, CPU(1080)는 NPU(100)로부터 적어도 하나의 객체가 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나 추적됨을 나타내는 정보를 수신하는 경우, CPU(1080)는 제어 신호(또는 결정 데이터)를 생성하여, 카메라 조정부(1020)로 전달할 수 있다. 또한, CPU(1080)는 NPU(100)로부터 적어도 하나의 객체가 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나 추적됨을 나타내는 정보를 수신하는 경우, CPU(1080)는 비행의 속도를 늦출 수 있다.
NPU(100) 내의 NPU 컨트롤러(130), SFU(150) 또는 AP에 의해서 생성되는 신호 또는 CPU(1080)에 의해서 생성되는 신호는 적어도 하나의 명령어를 포함할 수 있다.
적어도 하나의 명령어는 적어도 하나의 카메라의 바디, 렌즈 또는 이미지 센서 중 적어도 하나를 X, Y 또는 Z 축 방향으로 이동 또는 회전시키기 위해서 사용될 수 있다. 또는, 적어도 하나의 명령어는 적어도 하나의 카메라의 초점 거리(focal distance)를 증가시키거나 감소시키기 위해서 사용될 수 있다. 또는, 적어도 하나의 명령어는 적어도 하나의 카메라의 바디, 렌즈 또는 이미지 센서 중 적어도 하나를 요(Yaw) 회전 또는 피치(pitch) 회전시키기 위하여 사용될 수 있다.
또는, 적어도 하나의 명령어는 적어도 하나의 카메라의 화각(angle of view)을 증가시키거나 감소시키기 위해서 사용될 수 있다. 또는, 적어도 하나의 명령어는 적어도 하나의 카메라의 관측 시야(field of view, FoV)를 X, Y 또는 Z 축 방향으로 이동 또는 회전시키기 위해서 사용될 수 있다. 또는, 적어도 하나의 명령어는 적어도 하나의 카메라의 FPS(frame per second)를 증가시키거나 감소시키기 위해서 사용될 수 있다. 적어도 하나의 명령어는 적어도 하나의 카메라가 줌-인(Zoom-in)하거나 또는 줌-아웃(zoom-out)하도록 하기 위해서 사용될 수 있다.
한편, 적어도 하나의 명령어는 적어도 하나의 객체가 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나 추적되는 경우, 적어도 하나의 객체의 좌표(coordinate)를 포함할 수 있다.
적어도 하나의 객체의 좌표를 포함하는 적어도 하나의 명령어는 적어도 하나의 카메라가 적어도 하나의 객체를 포함하는 이미지 부분을 보다 큰 사이즈로 캡쳐할 수 있도록 하는데 사용될 수 있다. 적어도 하나의 객체의 좌표에 기초하여, 적어도 하나의 객체를 포함하는 이미지 부분이 광학적으로 줌인되거나 디지털적으로 줌인되어, 보다 큰 이미지 해상도로 캡쳐될 수 있다.
제1 카메라(1021)가 광각 카메라이고, 제2 카메라(1022)가 망원 카메라일 경우, 적어도 하나의 객체의 좌표를 포함하는 적어도 하나의 명령어에 기초하여 제2 카메라(1022)의 관측 시야(FoV)만이 X, Y 또는 Z 축 방향으로 이동 또는 회전될 수 있다. 즉, 제1 카메라(1021)는 제어되지 않고, 제2 카메라(1022)만이 제어될 수 있다.
한편, 제1 카메라(1021)가 광각 카메라이고, 제2 카메라(1022)가 망원 카메라일 경우, 제1 카메라(1021)는 NPU(100)가 적어도 하나의 객체를 감지할 수 있도록 하도록 하는데 사용되고, 제2 카메라(1022)는 NPU(100)가 감지된 적어도 하나의 객체를 추적할 수 있도록 하는데 사용될 수 있다.
적어도 하나의 명령어를 포함하는 제어 신호(또는 결정 데이터)는 제1 카메라(1021) 또는 제2 카메라(1022)가 더 높은 해상도, 즉 더 큰 사이즈의 이미지를 캡쳐할 수 있도록 하기 위해서 사용될 수 있다.
다른 한편, 적어도 하나의 명령어를 포함하는 제어 신호(또는 결정 데이터)는 환경적 조건 데이터(environmental condition data), 즉 이동가능한 기기(1000)의 비행 고도 또는 높이 또는 비행 속도에 기초하여 생성될 수 있다.
예를 들면, 적어도 일부의 환경적 조건 데이터는 센싱부(1030)를 통해서 획득되는 것이 가능하다.
적어도 하나의 명령어를 포함하는 제어 신호(또는 결정 데이터)에 기초하여, 제1 ISP(1021-4) 또는 제2 ISP(1022-4)는 영상 또는 일련의 이미지들을 영상처리할 수 있다. 영상 또는 일련의 이미지들은 NPU(100)로 입력되기 때문에, 입력 특징맵(input feature map)이라고 불릴 수 있으며, 이러한 입력 특징맵은 조절가능한 차원(dimension)을 갖는, 조절가능한 입력 특징맵에 해당되게 된다.
다시 말해서, 적어도 하나의 명령어를 포함하는 제어 신호(또는 결정 데이터)에 기초하여 입력 특징맵의 차원은 조절 가능할 수 있다. 입력 특징맵의 차원은 특징맵의 가로 사이즈와 세로 사이즈 그리고 채널의 개수를 포함할 수 있다. 입력 특징맵의 해상도 또는 사이즈는 결정 데이터에 기초하여 조절 가능할 수 있다.
다르게 표현하면, 적어도 하나의 명령어를 포함하는 제어 신호(또는 결정 데이터)는 적어도 하나의 입력 특징맵의 생성을 제어하거나 또는 적어도 하나의 입력 특징맵의 적어도 하나의 속성을 제어할 수 있다.
다른 한편, CPU(1080)는 추적의 정확도를 높이기 위하여, 캐시 메모리에 저장된 복수의 머신 코드들의 세트 중 하나를 선택한 후, NPU(100)의 NPU 컨트롤러(130)로 전달할 수 있다.
보다 구체적으로, CPU(1080)는 센싱부(1030)의 고도 센서(1031), 또는 위치 센서(1032)로부터 비행 고도 정보, 해수면 또는 지면으로부터의 높이에 대한 정보를 수신할 수 있다. 만약, 비행 고도가 상승되는 경우(즉, 해수면 또는 지면으로부터 이동가능한 기기의 높이가 높아지는 경우), 이미지 내에서 객체의 사이즈는 보다 작아지기 때문에, 객체는 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나, 감지가 실패될 수 있다. 따라서, CPU(1080)는 감지 또는 추적의 정확도를 높이기 위하여, CPU(1080)는 복수의 머신 코드들의 세트 중에서 해당 고도에 적합한 복수의 머신 코드들의 세트를 선택할 수 있다. 선택된 세트는 해당 비행 고도에 적합한 인공신경망모델을 위한 복수의 머신 코드들의 세트일 수 있다. CPU(1080)는 복수의 머신 코드들의 세트에 대한 인덱스 정보를 NPU(100)의 NPU 컨트롤러(130)로 전달할 수 있다.
I. 제1 개시
도 9a 내지 도 9c는 도 8에 도시된 구성을 제1 개시에 따른 동작 관점에서 나타낸 블록도이다.
도 9a에 도시된 바와 같이, NPU(100)내의 복수의 프로세싱 엘리먼트(110) 및/또는 SFU(150)가 인공신경망모델의 연산을 수행한다. SFU(150)는 결정 데이터를 생성하도록 구성된 회로부를 더 포함하도록 구성될 수 있다. 이에, SFU(150)는 결정 데이터를 포함하는 제어 신호를 생성하도록 구성될 수 있다. NPU(100)는 추론 결과, 즉 감지 또는 추적 결과를 생성한다. NPU(100)는 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작은지 여부를 판단 또는 출력한다. 만약, 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작다고 판단되는 경우, NPU(100)는 감지 또는 추적의 정확도를 높이기 위하여, 제1 카메라(1021) 또는 제2 카메라(1022)를 기계적 또는 전기적으로 제어하기 위한 명령어를 포함하는 제어 신호(또는 결정 데이터)를 생성할 수 있다. 이어서 NPU(100)는 제어 신호(또는 결정 데이터)를 카메라 조정부(1020)로 전달할 수 있다.
대안적으로, 도 9b에 도시된 바와 같이, NPU(100)내의 복수의 프로세싱 엘리먼트(110)가 인공신경망모델의 연산을 수행하여 추론 결과, 즉 감지 또는 추적 결과를 생성할 수 있다. CPU(1080)는 NPU(100)로부터 추론 결과를 제공받고, 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작은지 판단할 수 있다. 이때, CPU(1080)는 SFU(150)의 연산을 대신 처리할 수 있다. 부연 설명하면, SFU(150)는 전용 가속기 회로로 구성될 수 있기 때문에, CPU(1080)보다 상대적으로 빠른 처리 속도 및 낮은 소비 전력을 제공할 수 있다. CPU(1080)는 다양한 소프트웨어로 신규 기능을 구현할 수 있다. 한편 SFU(150)는 하드웨어가 고정된 회로이기 때문에 소프트웨어로 신규 기능을 구현하는데 제한적일 수 있다.
만약, 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작다고 판단되는 경우, CPU(1080)는 감지 또는 추적의 정확도를 높이기 위하여, 제1 카메라(1021) 또는 제2 카메라(1022)를 기계적 또는 전기적으로 제어하기 위한 명령어를 포함하는 제어 신호(또는 결정 데이터)를 생성할 수 있다. 이어서 CPU(1080)는 카메라 조정부(1020)로 제어 신호(또는 결정 데이터)를 전달할 수 있다.
대안적으로, 도 9c에 도시된 바와 같이, NPU(100)내의 복수의 프로세싱 엘리먼트(110) 및/또는 SFU(150)가 인공신경망모델의 연산을 수행하여 추론 결과, 즉 감지 또는 추적 결과를 출력하면, AP는 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작은지 판단할 수 있다. 이때, AP는 SFU(150)의 연산을 대신 처리할 수 있다. 부연 설명하면, SFU(150)는 전용 가속기 회로로 구성될 수 있기 때문에, AP보다 상대적으로 빠른 처리 속도 및 낮은 소비 전력을 제공할 수 있다. AP는 다양한 소프트웨어로 신규 기능을 구현할 수 있다. 한편 SFU(150)는 하드웨어가 고정된(hard-wired) 회로이기 때문에 소프트웨어로 신규 기능을 구현하는데 제한적일 수 있다.
만약 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작다고 판단되는 경우, AP는 추론 신뢰도에 대한 정보 혹은 카메라 제어 요청 신호를 CPU(1080)으로 전달할 수 있다. 그러면, CPU(1080)는 감지 또는 추적의 정확도를 높이기 위하여, 제1 카메라(1021) 또는 제2 카메라(1022)를 기계적 또는 전기적으로 제어하기 위한 명령어를 포함하는 제어 신호(또는 결정 데이터)를 생성한 후, 카메라 조정부(1020)로 전달할 수 있다.
도시되지는 않았으나, NPU(100)가 인공신경망모델의 연산을 수행하여 추론 결과, 즉 감지 또는 추적 결과를 출력하면, NPU 컨트롤러(1030)는 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작은지 판단할 수 있다. 만약 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작다고 판단되는 경우, NPU 컨트롤러(1030)는 감지 또는 추적의 정확도를 높이기 위하여, 제1 카메라(1021) 또는 제2 카메라(1022)를 기계적 또는 전기적으로 제어하기 위한 명령어를 포함하는 제어 신호(또는 결정 데이터)를 생성한 후, 카메라 조정부(1020)로 전달할 수 있다.
도 10은 도 8에 도시된 이동가능한 기기의 구성을 이용하는 제1 개시에 따라 제1 카메라와 제2 카메라가 기계적으로 제어되는 예를 나타낸다.
도 10에 도시된 바와 같이, 제1 카메라(1021) 또는 제2 카메라(1022)는 제1 피사체(1001)와 제2 피사체(1002)를 포함하는 이미지를 촬영하는데 사용될 수 있다. 촬영된 이미지는 NPU(100)로 전달되고, NPU(100)는 이미지 내에서 제1 피사체(1001)와 제2 피사체(1002)를 감지하고, 추적할 수 있다.
구체적으로, 제1 카메라(1021)가 광각 카메라이고, 제2 카메라(1021)가 망원 카메라일 수 있다. 이러한 경우, NPU(100)는 제1 카메라(1021)로 촬영된 이미지를 통해서 제1 피사체(1001)와 제2 피사체(1002)를 감지할 수 있다. 그리고 NPU(100)는 제2 카메라(1021)로 촬영된 이미지를 통해서 제1 피사체(1001)와 제2 피사체(1002)의 이동을 추적할 수 있다.
또한, 제1 카메라(1021)가 열화상 카메라 또는 자외선 카메라이고, 제2 카메라(1021)가 가시광선 카메라일 수 있다. 이러한 경우 NPU(100)는 제1 카메라(1021)로 촬영된 이미지를 통해서 제1 피사체(1001)와 제2 피사체(1002)를 감지할 수 있고, NPU(100)는 제2 카메라(1022)로 촬영된 이미지를 통해서 제1 피사체(1001)와 제2 피사체(1002)를 객체 인식(object detection)하고, 추적할 수 있다. 여기서 객체 인식이라 함은, 제1 피사체(1001)와 제2 피사체(1002)의 객체를 인식하고, 각 객체의 클래스(차량, 비행기, 사람 등)을 분류한다는 것을 의미한다. 나아가, 객체 인식은, 상기 제1 피사체(1001)와 제2 피사체(1002)의 신원을 데이터베이스를 통해서 조회할 수 있도록 구체적인 신체 특징을 더 추출한다는 것을 의미할 수 있다.
한편, 도 10에 도시된 바와 같이 제1 카메라(1021)과 제2 카메라(1022) 각각은 명령어를 포함하는 제어 신호(또는 결정 데이터)에 기초하여 X, Y 또는 Z 축 방향으로 이동될 수 있다. 또는, 제1 카메라(1021)과 제2 카메라(1022) 각각은 명령어를 포함하는 제어 신호(또는 결정 데이터)에 기초하여 요(Yaw) 회전되거나, 피치(pitch) 회전될 수 있다.
도 11a 및 도 11b는 피사체를 포함하는 이미지의 예를 나타낸 예시도들이다.
도 11a에 도시된 바와 같이, 제1 카메라(1021) 또는 제2 카메라(1022)에 의해서 촬영된 이미지(1100a) 내의 제1 피사체(1101)와 제2 피사체(1102)의 사이즈가 상대적으로 너무 작을 수 있다. 이러한 경우, NPU(100)가 이미지(1100a) 내에서 제1 피사체(1101)와 제2 피사체(1102)를 감지 혹은 추적한 결과에 대한 신뢰도 레벨이 제1 임계값 보다 낮을 수 있다. 이 경우, 감지 또는 추적의 정확도를 높이기 위하여, NPU(100)는 제1 카메라(1021) 또는 제2 카메라(1022)를 기계적 또는 전기적으로 제어하기 위한 명령어를 포함하는 제어 신호(또는 결정 데이터)를 카메라 조정부(1020)로 전달할 수 있다. 이때, 명령어는 제1 피사체(1101)와 제2 피사체(1102)에 대한 좌표값이 포함될 수 있다. 이때, 각 피사체는 좌표값 쌍 2개로 표현될 수 있다. 예를 들어, 제1 피사체(1101)는 좌표값 쌍 (a1,b1)과 좌표값 쌍(a2,b2)으로 표현될 수 있다.
좌표값이 포함된 명령어에 기초하여, 제1 카메라(1021) 또는 제2 카메라(1022)가 제1 피사체(1101)와 제2 피사체(1102)를 보다 크게 촬영할 수 있도록, 카메라 조정부(1020)는 제1 카메라(1021) 또는 제2 카메라(1022)의 바디, 렌즈 또는 이미지 센서 중 적어도 하나를 X, Y, 또는 Z 방향으로 이동시키거나, 요(Yaw) 회전시키나, 피치(pitch) 회전 시킬 수 있다.
도 11a에 비교하여, 도 11b를 참조하면, 제1 피사체(1101)와 제2 피사체(1102)가 보다 큰 사이즈로 촬영됨을 이해할 수 있다.
도 12은 제1 개시에 따른 일 방안을 나타낸 흐름도이다.
도 12를 참조하면, 하나 또는 복수의 카메라로부터 획득된 하나 이상의 이미지에 기초하여, 적어도 하나의 객체가 감지(detect) 또는 추적(track)될 수 있다(S1210). 즉, 제1 개시는 복수의 카메라에 제한되지 않으며, 하나의 카메라만으로도 실시되는 것도 가능하다.
감지 또는 추적의 정확도를 높이기 위하여, 적어도 하나의 카메라를 기계적 또는 전기적으로 제어하기 위한 적어도 하나의 명령어를 포함하는 신호가 생성될 수 있다(S1220).
이어서, 생성된 신호에 기초하여, 적어도 하나의 카메라를 기계적 또는 전기적으로 제어될 수 있다(S1230).
그러면, 생성된 신호에 기초하여 기계적 또는 전기적으로 제어된 적어도 하나의 카메라로부터 획득되는 후속 이미지에 기초하여, 적어도 하나의 객체에 대한 감지 또는 추적이 지속될 수 있다.
II. 제2 개시
도 13a 내지 도 13c는 도 8에 도시된 구성을 제2 개시에 따른 동작 관점에서 나타낸 블록도이다.
도 13a에 도시된 바와 같이, NPU(100)내의 복수의 프로세싱 엘리먼트(110) 및/또는 SFU(150)가 인공신경망모델의 연산을 수행한다. SFU(150)는 결정 데이터를 생성하도록 구성된 회로부를 더 포함하도록 구성될 수 있다. 이에, SFU(150)는 결정 데이터를 포함하는 제어 신호를 생성하도록 구성될 수 있다. NPU(100)는 추론 결과, 즉 감지 또는 추적 결과를 생성한다. NPU(100)는 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작은지 판단 또는 출력한다. SFU(150)는 감지 또는 추적의 정확도를 높이기 위하여, 환경적 조건 데이터(environmental condition data)를 입력받도록 구성될 수 있다. 만약, 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작다고 판단되는 경우, SFU(150)는 감지 또는 추적의 정확도를 높이기 위하여, 환경적 조건 데이터(environmental condition data)에 기초하여 제1 카메라(1021) 또는 제2 카메라(1022)를 제어하기 위한 명령어를 포함하는 제어 신호(또는 결정 데이터)를 생성하도록 구성될 수 있다. NPU(100)는 제어 신호(또는 결정 데이터)를 카메라 조정부(1020)로 전달할 수 있다. 예를 들면, 적어도 일부의 환경적 조건 데이터는 센싱부(1030)를 통해서 획득되는 것이 가능하다.
대안적으로, 도 13b에 도시된 바와 같이, NPU(100)내의 복수의 프로세싱 엘리먼트(110) 및/또는 SFU(150)가 인공신경망모델의 연산을 수행하여 추론 결과, 즉 감지 또는 추적 결과를 생성할 수 있다. CPU(1080)는 NPU(100)로부터 추론 결과를 제공받고, 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작은지 판단할 수 있다. 이때, CPU(1080)는 SFU(150)의 연산을 대신 처리할 수 있다. 부연 설명하면, SFU(150)는 전용 가속기 회로로 구성될 수 있기 때문에, CPU(1080)보다 상대적으로 빠른 처리 속도 및 낮은 소비 전력을 제공할 수 있다. CPU(1080)는 다양한 소프트웨어로 신규 기능을 구현할 수 있다. 한편 SFU(150)는 하드웨어가 고정된 회로이기 때문에 소프트웨어로 신규 기능을 구현하는데 제한적일 수 있다.
만약, 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작다고 판단되는 경우, CPU(1080)는 감지 또는 추적의 정확도를 높이기 위하여, 환경적 조건 데이터(environmental condition data)에 기초하여 제1 카메라(1021) 또는 제2 카메라(1022)를 제어하기 위한 명령어를 포함하는 제어 신호(또는 결정 데이터)를 생성할 수 있다. CPU(1080)는 제어 신호(또는 결정 데이터)를 카메라 조정부(1020)로 전달할 수 있다. 예를 들면, 적어도 일부의 환경적 조건 데이터는 센싱부(1030)를 통해서 획득되는 것이 가능하다.
대안적으로, 도 13c에 도시된 바와 같이, NPU(100)내의 복수의 프로세싱 엘리먼트(110) 및/또는 SFU(150)가 인공신경망모델의 연산을 수행하여 추론 결과, 즉 감지 또는 추적 결과를 출력하면, AP는 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작은지 판단할 수 있다. 이때, AP는 SFU(150)의 연산을 대신 처리할 수 있다. 부연 설명하면, SFU(150)는 전용 가속기 회로로 구성될 수 있기 때문에, AP보다 상대적으로 빠른 처리 속도 및 낮은 소비 전력을 제공할 수 있다. AP는 다양한 소프트웨어로 신규 기능을 구현할 수 있다. 한편 SFU(150)는 하드웨어가 고정된(hard-wired) 회로이기 때문에 소프트웨어로 신규 기능을 구현하는데 제한적일 수 있다.
만약 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작다고 판단되는 경우, AP는 추론 신뢰도에 대한 정보 혹은 카메라 제어 요청 신호를 CPU(1080)으로 전달한다. 그러면, CPU(1080)는 감지 또는 추적의 정확도를 높이기 위하여, 환경적 조건 데이터(environmental condition data)에 기초하여 제1 카메라(1021) 또는 제2 카메라(1022)를 제어하기 위한 명령어를 포함하는 제어 신호(또는 결정 데이터)를 생성한 후, 카메라 조정부(1020)로 전달할 수 있다. 예를 들면, 적어도 일부의 환경적 조건 데이터는 센싱부(1030)를 통해서 획득되는 것이 가능하다.
환경적 조건 데이터(environmental condition data)는 이동가능한 기기(1000)의 비행 고도 또는 높이 또는 비행 속도에 대한 정보 또는 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작은 상황에 대한 정보를 포함할 수 있다.
도 14a 및 도 14b는 피사체를 포함하는 이미지의 예를 나타낸 예시도들이다.
도 14a에 도시된 바와 같이, 제1 카메라(1021) 또는 제2 카메라(1022)에 의해서 촬영된 이미지(1400a) 내의 제1 피사체(1401)와 제2 피사체(1402)의 사이즈가 상대적으로 너무 작을 수 있다. 따라서, NPU(100)가 이미지(1400a) 내에서 제1 피사체(1401)와 제2 피사체(1402)를 감지 또는 추적한 결과에 대한 신뢰도 레벨이 제1 임계값 보다 낮을 수 있다. 이 경우, 감지 또는 추적의 정확도를 높이기 위하여, 제1 카메라(1021) 또는 제2 카메라(1022)를 제어하기 위한 명령어를 포함하는 제어 신호(또는 결정 데이터)가 카메라 조정부(1020)로 전달할 수 있다.
이때, 명령어는 제1 피사체(1401)와 제2 피사체(1402)에 대한 좌표값이 포함될 수 있다. 이때, 각 피사체는 좌표값 쌍 2개로 표현될 수 있다. 예를 들어, 제1 피사체(1401)는 좌표값 쌍 (a1,b1)과 좌표값 쌍(a2,b2)으로 표현될 수 있다.
좌표값이 포함된 명령어에 기초하여, 제1 카메라(1021) 또는 제2 카메라(1022)가 제1 피사체(1401)와 제2 피사체(1402)를 보다 크게 촬영할 수 있도록, 카메라 조정부(1020)는 제1 이미지 센서(1021-2), 제1 렌즈 구동 모터(1021-3), 제1 ISP(1021-4), 제2 이미지 센서(1022-2), 제2 렌즈 구동 모터(1022-3), 및 제2 ISP(1022-4) 중 적어도 하나를 제어할 수 있다.
도 14a에 비교하여, 도 14b를 참조하면, 제1 피사체(1401)와 제2 피사체(1402)가 보다 큰 사이즈로 촬영됨을 이해할 수 있다.
예를 들면, 촬영된 이미지 내에서 피사체의 사이즈를 상대적으로 크게 증가시키기 위해서 이미지 센서에서 출력되는 이미지의 해상도를 증가시킬 수 있다.
예를 들면, 촬영된 이미지 내에서 피사체의 사이즈를 상대적으로 크게 증가시키기 위해서 카메라의 렌즈의 광학줌 배율을 조절할 수 있다.
도 15는 제2 개시에 따른 일 방안을 나타낸 흐름도이다.
도 15를 참조하면, 입력 특징맵이 생성될 수 있다(S1510).
예를 들면, 제1 이미지 센서(1021-2) 또는 제2 이미지 센서(1022-2)의 레지스터 값을 제어하여 각 이미지 센서가 출력하는 이미지의 초당 프레임 속도(fps) 및 해상도를 조절할 수 있다.
예를 들면, 제1 ISP(1021-4) 또는 제2 ISP(1022-4)는 각 이미지 센서로부터 획득된 이미지를 신호처리하여 출력할 수 있다. 이미지는 하나 또는 복수의 입력 특징맵(input feature map)으로 변환될 수 있다.
입력 특징맵은 이미지 센서에서 출력된 이미지 또는 ISP에서 처리된 이미지일 수 있다.
이어서, 입력 특징맵에 기초하여 객체가 감지 또는 추적될 수 있다(S1520). 구체적으로, NPU(100)는 이미지에 기반하여 생성된 하나 또는 복수의 입력 특징맵을 기초로, 인공신경망모델의 연산을 처리하여, 객체를 감지 또는 추적할 수 있다.
이어서, 환경적 조건 데이터에 기초하여, 결정 데이터(예컨대, 제어 신호)가 생성될 수 있다(S1530). 환경적 조건 데이터(environmental condition data)는 이동가능한 기기(1000)의 비행 고도 또는 높이 또는 비행 속도에 대한 정보 또는 감지 또는 추적의 신뢰도 레벨이 제1 임계값 보다 작은 상황에 대한 정보를 포함할 수 있다.
결정 데이터는 제1 이미지 센서(1021-2), 제2 이미지 센서(1022-2), 제1 ISP(1021-4), 및 제2 ISP(1022-4) 중 적어도 하나를 제어하기 위한 제어 신호를 포함할 수 있다.
결정 데이터(예컨대, 제어 신호)는 NPU(100) 내의 SFU(150) 또는 AP에 의해서 생성되거나 또는 CPU(1080)에 의해서 생성될 수 있다. 결정 데이터(예컨대, 제어 신호)는 명령어를 포함할 수 있다.
보다 구체적으로, 결정 데이터(예컨대, 제어 신호)는 하나 또는 복수의 입력 특징맵의 생성을 제어하거나 또는 하나 또는 복수의 입력 특징맵의 적어도 하나의 속성을 제어할 수 있다.
하나 또는 복수의 입력 특징맵은 인공신경망모델의 다수의 레이어들 중에서 임의 레이어로 전달될 수 있다.
적어도 하나의 속성은 적어도 하나의 입력 특징맵의 사이즈, 또는 적어도 하나의 입력 특징맵의 해상도를 포함할 수 있다. 사이즈 또는 해상도는 환경적 조건 데이터(environmental condition data), 즉 이동가능한 기기의 비행 고도, 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 이동가능한 기기의 비행 속도에 기초하여 동적으로 조정될 수 있다.
결정 데이터(예컨대, 제어 신호)는 이동가능한 기기의 비행 고도, 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 이동가능한 기기의 비행 속도에 기초하여 생성될 수 있다.
결정 데이터(예컨대, 제어 신호)는 적어도 하나의 입력 특징맵이 초(second) 당 더 많이 생성되도록, 제1 이미지 센서(1021-2), 제2 이미지 센서(1022-2), 제1 ISP(1021-4), 및 제2 ISP(1022-4) 중 적어도 하나를 제어할 수 있다(S1540).
적어도 하나의 속성이 적어도 하나의 입력 특징맵의 사이즈이고, 적어도 하나의 입력 특징맵의 사이즈가 생성된 신호에 기초하여 축소되는 경우, 적어도 하나의 입력 특징맵은 초(second) 당 더 많이 생성될 수 있다.
환경적 조건 데이터(environmental condition data), 즉 이동가능한 기기의 비행 고도, 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 이동가능한 기기의 비행 속도가 증가되는 경우, 적어도 하나의 속성에 해당하는 해상도는 결정 데이터(예컨대, 제어 신호)에 기초하여 증가될 수 있다.
환경적 조건 데이터(environmental condition data), 즉 이동가능한 기기의 비행 고도, 이동가능한 기기의 해수면 또는 지면으로부터의 높이가 증가되는 경우, NPU는 적외선 카메라 또는 열화상 카메라로부터 캡쳐된 이미지 내에서 객체를 감지할 수 있다. 이 경우, 결정 데이터(예컨대, 제어 신호)는 제1 이미지 센서(1021-2), 제2 이미지 센서(1022-2), 제1 ISP(1021-4), 및 제2 ISP(1022-4) 중 적어도 하나가 적어도 하나의 속성에 대응하는 해상도를 증가시키도록 할 수 있다.
이동가능한 기기의 비행 고도가 증가할수록, 카메라가 촬영하는 지상에 위치한 피사체의 크기는 고도에 비례하여 작아진다. 따라서, 고도에 비례하여 카메라가 출력하는 이미지의 해상도가 증가되는 것이 바람직할 수 있다. 또한 이때, 카메라가 출력하는 이미지의 해상도가 증가될수록 카메라가 출력하는 영상의 초당 프레임 속도(fps)는 상대적으로 저하될 수 있다. 하지만, 이미지의 해상도 증가에 따라서 촬영된 피사체의 정보 손실을 최소화할 수 있다. 한편, 피사체가 특정 속도로 이동하더라도, 높은 고도에서 촬영된 영상에서는 상대적인 속도가 느리게 촬영될 수 있다. 즉, 동일한 속도로 이동하는 피사체라 하더라도, 촬영 거리에 따라서 촬영된 이미지들의 프레임간 픽셀간 이동 거리는 저감되게 된다. 따라서, 높은 고도에서는 카메라의 초당 프레임 속도(fps)가 저하되더라도, 상대적으로 더 높은 해상도로 촬영하는 것이 객체 인식의 성능에 더 유리할 수 있다.
III. 제3 개시: 타일링
도 16은 도 8에 도시된 구성을 제3 개시에 따른 동작 관점에서 나타낸 블록도이다.
도 16에 도시된 NPU(100), 메모리(200), 카메라 조정부(1020), 센싱부(1030) 그리고 CPU(1080) 사이에는 도 8에 도시된 바와 같은 시스템 버스(1060)가 위치될 수 있다. 따라서, NPU(100), 메모리(200), 카메라 조정부(1020), 센싱부(1030) 그리고 CPU(1080)는 도 8에 도시된 바와 같은 시스템 버스(1060)를 통하여, 서로 통신할 수 있다.
도 16에 도시된 NPU(100)는 도 8에 도시된 바와 같이 복수의 프로세싱 엘리먼트(110), SFU(150)와, 내부 메모리(120)와 DMA(125)와 그리고 NPU 컨트롤러(130)를 포함할 수 있다.
내부 메모리(120)는 입력 특징맵 저장부와, 출력 특징맵 저장부와, 그리고 가중치 저장부를 포함할 수 있다. 각각의 저장부는 저장되는 데이터를 구분하기 위한 개념적인 것으로 이해되어야 하며, DMA(125)에 의해서 제어될 수 있다.
도 16에 도시된 메모리(200)는 머신 코드 저장부, 이미지 저장부, 출력 특징맵 저장부, 그리고 머신 코드 별 가중치 저장부를 저장할 수 있다.
전술한 바와 같이, 복수의 인공신경망모델이 사용될 수 있다. 각 인공신경망모델은 전술한 바와 같이 사전에 준비된 컴파일러에 의하여 머신 코드로 변환될 수 있다. 예를 들어, 컴파일러는 임의 인공신경망모델 내의 레이어 각각에 대응되는 데이터의 사이즈를 분석한다. 컴파일러는 분석 결과에 따라 NPU(100) 내의 내부 메모리(120)를 효율적으로 사용하고, 메모리(200)의 액세스를 최소화하는 머신 코드를 생성할 수 있다.
따라서, 각 인공신경망모델을 위한 머신 코드가 생성될 수 있다. 복수의 인공신경망모델이 존재하는 경우, 머신 코드가 복수 세트로 생성될 수 있다. 예를 들어, 복수의 머신 코드들의 세트는 제1 사이즈(예, 200 x 200 x 3)의 입력 특징맵을 이용하는 제1 인공신경망모델을 위한 제1 세트의 머신 코드와, 제2 사이즈(예, 320 x 320 x 3)의 입력 특징맵을 이용하는 제2 인공신경망모델을 위한 제2 세트의 머신 코드를 포함할 수 있다. 추가적으로, 복수의 머신 코드들의 세트는 제3 사이즈의 입력 특징맵을 이용하는 제3 인공신경망모델을 위한 제3 세트의 머신 코드를 더 포함할 수도 있다.
예를 들면, 메모리(200) 내의 머신 코드 저장부는 컴파일된 복수의 머신 코드들의 세트를 저장할 수 있다. 이 경우, NPU 컨트롤러(130) 내의 펌웨어 저장부는 복수의 머신 코드들의 세트에 대한 인덱스 정보 만을 저장하고 있을 수 있다.
예를 들면, NPU 컨트롤러(130)의 펌웨어 저장부는 컴파일된 복수의 머신 코드들의 세트를 저장할 수 있다.
예를 들면, NPU 컨트롤러(130)의 펌웨어 저장부는 메모리(200)에서 복수의 머신 코드들의 세트에서 현재 처리중인 특정 머신 코드만 임시 저장하고 있을 수 있다.
이동가능한 기기(1000)의 구동 초기에, CPU(1080)는 NPU 컨트롤러(130) 내의 펌웨어 저장부로부터 복수의 머신 코드들의 세트에 대한 인덱스 정보를 로딩한 후, CPU(1080) 내의 캐시 메모리에 저장해둘 수 있다.
메모리(200) 내의 머신 코드 별 가중치 저장부는 각 인공신경망모델에 대응하는 머신 코드를 위한 가중치들을 저장할 수 있다. 예를 들어, 메모리(200) 내의 머신 코드 별 가중치 저장부는 제1 인공신경망모델에 대응하는 제1 세트의 머신 코드를 위한 가중치들의 제1 세트와, 제2 인공신경망모델에 대응하는 제2 세트의 머신 코드를 위한 가중치들의 제2 세트를 저장할 수 있다. 추가적으로, 메모리(200) 내의 머신 코드 별 가중치 저장부는 제3 인공신경망모델에 대응하는 제3 세트의 머신 코드를 위한 가중치들의 제3 세트를 저장할 수 있다.
CPU(1080)는 제1 카메라의 제1 이미지 센서(1021-2) 또는 제1 ISP(1021-4) 또는 제2 카메라의 제2 이미지 센서(1022-2) 또는 제2 ISP(1022-4)를 제어하여, 촬영된 영상 또는 복수의 이미지를 시스템 버스(1060)을 통하여 메모리(200)의 이미지 저장부에 저장되도록 한다.
그러면, NPU(100)는 NPU 컨트롤러(130)의 제어에 따라 DMA(125)를 이용하여, 메모리(200)의 이미지 저장부로부터 영상 또는 복수의 이미지를 가져와서 내부 메모리(120)의 입력 특징맵 저장부에 저장시킬 수 있다.
CPU(1080)는 센싱부(1030)으로부터 고도 정보(예컨대, 해수면 또는 지면으로부터의 높이에 대한 정보)를 수신할 수 있다.
만약, 비행 고도가 상승되는 경우(즉, 해수면 또는 지면으로부터 이동가능한 기기의 높이가 높아지는 경우), 이미지 내에서 객체의 사이즈는 보다 작아지기 때문에, 객체는 NPU(100)에 의해서 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나, 감지가 실패될 수 있다. 따라서, CPU(1080)는 감지 또는 추적의 정확도를 높이기 위하여, CPU(1080)는 복수의 머신 코드들의 세트 중에서 해당 고도에 적합한 복수의 머신 코드들의 세트를 선택할 수 있다. 그리고, CPU(1080)는 선택한 복수의 머신 코드들의 세트에 대한 인덱스 정보를 NPU(100)로 전달할 수 있다.
그러면, NPU(100)는 전달받은 인덱스 정보에 기초하여, 펌웨어 저장부로부터 선택된 복수의 머신 코드들의 세트를 가져올 수 있다. 대안적으로, NPU(100)는 전달받은 인덱스 정보에 기초하여, DMA(125)를 이용하여 메모리(200) 내의 머신 코드 저장부로부터 선택된 복수의 머신 코드들의 세트를 가져올 수 있다.
또한, NPU(100)는 전달받은 인덱스 정보에 기초하여, DMA(125)를 이용하여 메모리(200) 내의 머신 코드 별 가중치 저장부로부터 선택된 복수의 머신 코드들의 세트를 위한 가중치들을 가져올 수 있다.
한편, 비행 고도가 상승되는 경우 감지 또는 추적의 정확도를 높이기 위하여, CPU(1080)는 제어 신호(예, 결정 데이터)를 생성한 후, 카메라 조정부(1020)의 제1 카메라의 제1 이미지 센서(1021-2) 또는 제1 ISP(1021-4) 또는 제2 카메라의 제2 이미지 센서(1022-2) 또는 제2 ISP(1022-4)에게 전달할 수 있다.
제어 신호(예, 결정 데이터)는 제1 카메라(1021)의 제1 이미지 센서(1021-2) 또는 제2 카메라의 제2 이미지 센서(1022-2)가 캡쳐링된 이미지의 해상도를 조절하기 위한 것일 수 있다.
제어 신호(예, 결정 데이터)는 제1 카메라(1021)의 제1 ISP(1021-4) 또는 제2 카메라의 제2 ISP(1022-4)가 캡쳐링된 이미지를 다운스케일링 또는 업스케일링할 수 있도록 하기 위한 것일 수 있다.
구체적으로, 비행 고도가 낮은 경우에는, 제어 신호(예, 결정 데이터)는 다운스케일링의 수준을 높일 수 있다. 예를 들어, 촬영된 원본 이미지의 사이즈가 2048 x 2048 x 3인 경우, 비행 고도가 낮아지면 제어 신호(예, 결정 데이터)는 다운스케일링의 수준을 높임으로써, 320 x 320 x 3 사이즈의 이미지로 변환되도록 할 수 있다. 반대로, 비행 고도가 높아지면 제어 신호(예, 결정 데이터)는 다운스케일링의 수준을 낮춤으로써, 2048 x 2048 x 3 사이즈의 촬영 원본 이미지를 1920 x 1920 x 3 사이즈의 이미지로 변환되도록 할 수 있다. 대안적으로, 비행 고도가 더 높아지면 제어 신호(예, 결정 데이터)는 업스케이링을 지시할 수 있고, 그에 따라 2048 x 2048 x 3 사이즈의 촬영 원본 이미지는 4096 x 4096 x 3 사이즈의 이미지로 변환될 수 있다. 변환된 이미지는 메모리(200)의 이미지 저장부에 저장되게 된다. 따라서 NPU(100)에서 처리해야할 데이터 사이즈가 저감될 수 있다. 이에, 이동가능한 기기(1000)의 소비 전력이 저감되고, 비행 시간이 증가될 수 있다.
다른 한편, NPU(100)가 CPU(1080)으로부터 전달받은 인덱스 정보에 기초하여, 펌웨어 저장부로부터 선택된 복수의 머신 코드들의 세트를 가져온 다음, NPU(100)는 머신 코드에 따라 미리 정해진 타일링 개수를 확인한다.
그 다음, NPU(100)는 메모리(200)의 이미지 저장부에 저장되어 있는 변환 이미지를 타일링 개수에 따라 블록 단위로 분할하여, DMA(125)를 이용하여 NPU(100)의 내부 메모리(120) 내의 입력 특징맵 저장부에 저장시킨다.
예를 들어, 비행 고도가 낮아서 해상도 저감 또는 다운스케일링이 높은 수준으로 수행된 경우, 메모리(200)의 이미지 저장부에 저장되어 있는 변환 이미지의 사이즈는 640 x 640 x 3일 수 있다. 이 경우, 640 x 640 x 3 사이즈의 변환 이미지는 320 x 320 x 3 사이즈의 4개의 블록들로 타일링될 수 있다. 따라서, NPU(100)는 메모리(200)의 이미지 저장부에 저장되어 있는 640 x 640 x 3 사이즈의 변환 이미지를 4개의 블록들(예, 제1 블록, 제2 블록, 제3 블록 그리고 제4 블록)로 분할한 뒤, 320 x 320 x 3 사이즈의 제1 블록을 DMA(125)를 이용하여 NPU(100)의 내부 메모리(120) 내의 입력 특징맵 저장부에 저장시킨다.
그러면, NPU(100)의 PE들(110)은 내부 메모리(120)의 입력 특징맵 저장부로부터 제1 블록을 읽어오고, 내부 메모리(120)의 가중치 저장부로부터 가중치를 읽어와서, 합성곱 연산을 수행한다. 이어서, NPU(100)의 PE들(110)은 내부 메모리(120)의 입력 특징맵 저장부로부터 제2 블록을 읽어오고, 내부 메모리(120)의 가중치 저장부로부터 가중치를 읽어와서, 합성곱 연산을 수행한다
NPU(100)의 PE들(110)은 합성곱 연산의 수행에 따라 생성된 출력 특징맵을 내부 메모리(120)의 출력 특징맵 저장부에 저장시킨다.
도 17a 및 도 17b는 피사체를 포함하는 이미지의 예를 나타낸 예시도들이다.
도 17a에 도시된 이미지(1700a)는 예를 들어 이동가능한 기기의 비행 고도가 낮을 때 제1 카메라(1021) 또는 제2 카메라(1022)에 의해서 촬영된 이미지일 수 있다. 비행 고도가 낮기 때문에, 촬영된 이미지(1700a) 내에서 제1 피사체(1701)과 제2 피사체(1702)는 사이즈가 상대적으로 크게 나타날 수 있다.
이처럼, 제1 피사체(1701)과 제2 피사체(1702)는 사이즈가 상대적으로 크게 보이기 때문에, 해상도 저감 또는 다운스케일링을 통하여 이미지 사이즈를 줄여도 NPU는 NPU(100)는 제1 피사체(1701)과 제2 피사체(1702)를 잘 감지해낼 수 있다.
따라서, CPU(1080)는 센싱부(1030)로부터 획득된 고도 정보에 기초하여, 제어 신호(결정 데이터)를 생성하여 제1 카메라의 제1 이미지 센서(1021-2) 또는 제1 ISP(1021-4) 또는 제2 카메라의 제2 이미지 센서(1022-2) 또는 제2 ISP(1022-4)에게 전송할 수 있다. 생성된 제어 신호(결정 데이터)는 해상도 또는 다운스케일링의 수준을 높이는 명령어를 포함할 수 있다. 예를 들어, 제1 카메라 또는 제2 카메라에 의하여 촬영된 원본 이미지가 제1 사이즈(예컨대, 1920 x 1920 x 3 사이즈)인 경우, 생성된 제어 신호(결정 데이터)는 특정 사이즈(예컨대, 640 x 320 x 3 사이즈)로 해상도 조절 또는 다운스케일링하라는 명령어를 포함할 수 있다. 그러면, 제1 카메라의 제1 이미지 센서(1021-2) 또는 제1 ISP(1021-4) 또는 제2 카메라의 제2 이미지 센서(1022-2) 또는 제2 ISP(1022-4)는 촬영된 원본 이미지를 특정 사이즈(예컨대, 640 x 320 x 3 사이즈)로 해상도 조절 또는 다운스케일링할 수 있다.
한편, CPU(1080)는 복수의 인공신경망모델 중에서 센싱부(1030)로부터 획득된 고도 정보에 대응하는 인공신경망모델을 선택할 수 있다. 그리고, CPU(1080)는 선택된 인공신경망모델에 대응하는 복수의 머신 코드들의 세트에 대한 인덱스 정보를 NPU(100)로 전달할 수 있다.
그러면, NPU(100)는 인덱스 정보에 기초하여, 펌웨어 저장부 혹은 메모리(200) 내의 머신 코드 저장부로부터 선택된 복수의 머신 코드들의 세트를 가져올 수 있다. 또한, NPU(100)는 전달받은 인덱스 정보에 기초하여, DMA(125)를 이용하여 메모리(200) 내의 머신 코드 별 가중치 저장부로부터 선택된 복수의 머신 코드들의 세트를 위한 가중치들을 가져올 수 있다.
예를 들어, 선택된 인공신경망모델은 320 x 320 x 3 사이즈의 입력 특징맵을 이용하는 인공신경망모델일 수 있다. 따라서, 복수의 머신 코드들의 세트는 320 x 320 x 3 사이즈의 입력 특징맵을 위한 머신 코드일 수 있다. 그리고, 복수의 머신 코드들의 세트를 위한 가중치도 마찬가지로 320 x 320 x 3 사이즈의 입력 특징맵을 위한 가중치들일 수 있다.
NPU(100)는 인덱스 정보에 기초하여, 머신 코드에 따라 미리 정해진 타일링 개수를 확인한다.
도 17a에 도시된 이미지(1700a)가 예를 들어 640 x 320 x 3 사이즈 인 경우, 이미지(1700a)는 320 x 320 x 3 사이즈의 제1 블록(900a-1)과 제2 블록(900a-2)로 타일링(즉, 분할)될 수 있다.
한편, 도 17b에 도시된 이미지(1700b)는 예를 들어 이동가능한 기기의 비행 고도가 높을 때, 제1 카메라(1021) 또는 제2 카메라(1022)에 의해서 촬영된 이미지일 수 있다. 비행 고도가 높기 때문에, 촬영된 이미지(1700b) 내에서 제1 피사체(1701)과 제2 피사체(1702)는 사이즈가 상대적으로 작게 나타날 수 있다.
이처럼, 제1 피사체(1701)과 제2 피사체(1702)는 사이즈가 상대적으로 작게 보이기 때문에, NPU(100)가 이미지(1700b) 내에서 제1 피사체(1701)과 제2 피사체(1702)를 감지 혹은 추적한 결과에 대한 신뢰도 레벨이 제1 임계값 보다 낮을 수 있다.
이 경우, 감지 또는 추적의 정확도를 높이기 위하여, CPU(1080)는 센싱부(1030)로부터 획득된 고도 정보에 기초하여, 제어 신호(결정 데이터)를 생성하여 제1 카메라의 제1 이미지 센서(1021-2) 또는 제1 ISP(1021-4) 또는 제2 카메라의 제2 이미지 센서(1022-2) 또는 제2 ISP(1022-4)에게 전송할 수 있다. 생성된 제어 신호(결정 데이터)는 다운스케일링의 수준을 낮게 하라는 명령어를 포함할 수 있다. 예를 들어, 제1 카메라 또는 제2 카메라에 의하여 촬영된 원본 이미지가 특정 사이즈(예컨대, 1920 x 1280 x 3 사이즈)인 경우, 생성된 제어 신호(결정 데이터)는 특정 사이즈(예컨대, 1600 x 800 x 3 사이즈)로 다운스케일링하라는 명령어를 포함할 수 있다. 그러면, 제1 카메라의 제1 이미지 센서(1021-2) 또는 제1 ISP(1021-4) 또는 제2 카메라의 제2 이미지 센서(1022-2) 또는 제2 ISP(1022-4)는 촬영된 원본 이미지(예컨대, 1920 x 1280 x 3사이즈)를 특정 사이즈(예컨대, 1600 x 800 x 3 사이즈)로 다운스케일링할 수 있다.
한편, CPU(1080)는 복수의 인공신경망모델 중에서 센싱부(1030)로부터 획득된 고도 정보에 대응하는 인공신경망모델을 선택할 수 있다. 그리고, CPU(1080)는 선택된 인공신경망모델에 대응하는 복수의 머신 코드들의 세트에 대한 인덱스 정보를 NPU(100)로 전달할 수 있다.
그러면, NPU(100)는 인덱스 정보에 기초하여, 펌웨어 저장부 혹은 메모리(200) 내의 머신 코드 저장부로부터 선택된 복수의 머신 코드들의 세트를 가져올 수 있다. 또한, NPU(100)는 전달받은 인덱스 정보에 기초하여, DMA(125)를 이용하여 메모리(200) 내의 머신 코드 별 가중치 저장부로부터 선택된 복수의 머신 코드들의 세트를 위한 가중치들을 가져올 수 있다.
예를 들어, 선택된 인공신경망모델은 400 x 400 x 3 사이즈의 입력 특징맵을 이용하는 인공신경망모델일 수 있다. 따라서, 복수의 머신 코드들의 세트는 400 x 400 x 3 사이즈의 입력 특징맵을 위한 머신 코드일 수 있다. 그리고, 복수의 머신 코드들의 세트를 위한 가중치도 마찬가지로 400 x 400 x 3 사이즈의 입력 특징맵을 위한 가중치들일 수 있다.
NPU(100)는 인덱스 정보에 기초하여, 머신 코드에 따라 미리 정해진 타일링 개수를 확인한다.
도 17b에 도시된 이미지(1700b)가 예를 들어 1600 x 800 x 3 사이즈 인 경우, 이미지(1700b)는 400 x 400 x 3 사이즈로 8개의 블록들(1700b-1, 1700b-2, 1700b-3, 1700b-4, 1700b-5, 1700b-6, 1700b-7, 700b-8)로 타일링(분할)될 수 있다.
한편, 입력 특징맵 사이즈 별 인공신경망모델과 가중치를 정리하여 나타내면 아래의 표와 같다.
구분 입력 특징맵 사이즈 복수의 머신 코드들의 세트 머신 코드 세트의 인덱스 가중치
제1 인공신경망모델 200 x 200 x 3 제1 세트의 머신 코드 01 제1 세트의 가중치
제2 인공신경망모델 320 x 320 x 3 제2 세트의 머신 코드 02 제2 세트의 가중치
제3 인공신경망모델 400 x 400 x 3 제3 세트의 머신 코드 03 제3 세트의 가중치
도 18은 제3 개시에 따른 일 방안을 나타낸 흐름도이다.
도 18을 참조하면, 환경적 조건 데이터(예컨대, 비행 고도 정보)가 획득될 수 있다(S1810).
이어서, 환경적 조건 데이터(예컨대, 비행 고도 정보)에 기초하여, 촬영 이미지의 다운스케일링 수준 혹은 업스케일링 수준이 결정될 수 있다(S1820).
이어서, 환경적 조건 데이터(예컨대, 비행 고도 정보)에 기초하여, 입력 특징맵 사이즈가 결정될 수 있다(S1830). 입력 특징맵의 사이즈를 결정한다 함은, 복수의 인공신경망모델 중에서 어느 하나를 결정하는 것을 의미할 수 있다.
이어서, 환경적 조건 데이터에 기초하여, 이미지를 분할한 블록의 개수가 결정될 수 있다(S1840).
만약, 블록들의 개수가 제1 임계값 보다 큰 경우, 다수의 이미지 블록들은 업스케일링(upscaling)될 수 있다.
이상에서 설명한 바와 같이, 본 명세서의 개시에 따르면 고정된 기기 또는 이동가능한 기기에 장착되는 전자 장치가 제공된다. 상기 전자 장치는 다수의 PE들(processing elements)와; 그리고 하나 또는 복수의 카메라로부터 획득된 하나 이상의 이미지에 기초하여, 적어도 하나의 객체를 감지(detect) 또는 추적(track)하기 위한 추론 결과를 출력하도록 학습된 인공신경망모델의 연산을 처리하는 NPU(neural processing unit)와; 그리고 적어도 하나의 카메라에 적용가능한 신호를 생성하는 신호 생성기를 포함할 수 있다.
또한, 본 명세서의 개시에 따르면, 하나 또는 복수의 카메라로부터 획득된 하나 이상의 이미지에 기초하여, 적어도 하나의 객체를 감지(detect) 또는 추적(track)하는 단계와; 상기 감지 또는 상기 추적의 정확도를 높이기 위하여, 상기 적어도 하나의 카메라를 기계적 또는 전기적으로 제어하기 위한 적어도 하나의 명령어를 포함하는 신호를 생성하는 단계와; 상기 생성된 신호에 기초하여, 상기 적어도 하나의 카메라를 기계적 또는 전기적으로 제어하는 단계와; 그리고 상기 생성된 신호에 기초하여 기계적 또는 전기적으로 제어된 적어도 하나의 카메라로부터 획득되는 후속 이미지에 기초하여, 상기 적어도 하나의 객체에 대한 감지 또는 추적을 지속하는 단계를 포함하는 방법이 제시된다.
본 명세서와 도면에 나타난 본 개시의 예시들은 본 개시의 기술 내용을 쉽게 설명하고 본 개시의 이해를 돕기 위해 특정 예를 제시한 것뿐이며, 본 명의 범위를 한정하고자 하는 것은 아니다. 지금까지 설명한 예시들 이외에도 다른 변형 예들이 실시 가능하다는 것은 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다.

Claims (40)

  1. 고정된 기기 또는 이동가능한 기기에 장착되는 전자 장치로서,
    다수의 PE들(processing elements)를 포함하고, 하나 또는 복수의 카메라로부터 획득된 하나 이상의 이미지에 기초하여, 적어도 하나의 객체를 감지(detect) 또는 추적(track)하기 위한 추론 결과를 출력하도록 학습된 인공신경망모델의 연산을 처리하는 NPU(neural processing unit)와; 그리고
    적어도 하나의 카메라에 적용가능한 신호를 생성하는 신호 생성기를 포함하고,
    상기 적어도 하나의 객체가 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나 추적되는 경우, 상기 신호는 상기 적어도 하나의 객체의 좌표(coordinate)를 포함하도록 생성되는, 전자 장치.
  2. 제1항에 있어서, 상기 하나 또는 복수의 카메라는 렌즈, 이미지 센서 그리고 상기 렌즈를 이동시켜 상기 렌즈와 상기 이미지 센서 간의 거리를 증가시키거나 감소시키기 위한 모터를 포함하는, 전자 장치.
  3. 제1항에 있어서,
    상기 하나 또는 복수의 카메라는: 제1 카메라와 상기 제1 카메라의 화각(angle of view) 보다 작은 화각을 갖는 제2 카메라를 포함하거나, 또는
    상기 하나 또는 복수의 카메라는: 광각 카메라(wide-angle camera)와 망원 카메라(telephoto camera)를 포함하는, 전자 장치.
  4. 제1항에 있어서,
    상기 하나 또는 복수의 카메라는: 가시 광선 카메라, 자외선 카메라(ultra violet camera), 적외선 카메라(infrared camera), 열화상 카메라(thermal imaging camera) 또는 나이트 비전 카메라(night vision camera)를 포함하는, 전자 장치.
  5. 제1항에 있어서,
    상기 생성된 신호는 상기 적어도 하나의 카메라를 기계적 또는 전기적으로 제어하여, 상기 감지 또는 상기 추적의 정확도를 높이기 위한 적어도 하나의 명령을 포함하는, 전자 장치.
  6. 제5항에 있어서, 상기 적어도 하나의 명령어는:
    상기 적어도 하나의 카메라의 바디, 렌즈 또는 이미지 센서 중 적어도 하나를 X, Y 또는 Z 축 방향으로 이동 또는 회전시키거나, 또는
    상기 적어도 하나의 카메라의 초점 거리(focal distance)를 증가시키거나 감소시키기 위해서 사용되는, 전자 장치.
  7. 제5항에 있어서, 상기 적어도 하나의 명령어는:
    상기 적어도 하나의 카메라의 화각(angle of view)을 증가시키거나 감소시키거나,
    상기 적어도 하나의 카메라의 관측 시야(field of view, FoV)를 X, Y 또는 Z 축 방향으로 이동 또는 회전시키거나,
    상기 적어도 하나의 카메라의 FPS(frame per second)를 증가시키거나 감소시키거나, 또는
    상기 적어도 하나의 카메라가 줌-인(Zoom-in)하거나 또는 줌-아웃(zoom-out)하도록 하는데 사용되는, 전자 장치.
  8. 삭제
  9. 제1항에 있어서, 상기 적어도 하나의 객체의 좌표를 포함하는 신호는 상기 적어도 하나의 카메라가 상기 적어도 하나의 객체를 포함하는 이미지 부분을 보다 큰 사이즈로 캡쳐할 수 있도록 하는데 사용되는, 전자 장치.
  10. 제9항에 있어서,
    상기 하나 또는 복수의 카메라가 제1 카메라와 상기 제1 카메라의 화각 보다 작은 화각을 갖는 제2 카메라를 포함하는 경우,
    상기 제2 카메라의 관측 시야(FoV)는 상기 좌표에 기초하여 X, Y 또는 Z 축 방향으로 이동 또는 회전되는, 전자 장치.
  11. 제1항에 있어서,
    상기 하나 또는 복수의 카메라가 제1 카메라와 상기 제1 카메라의 화각 보다 작은 화각을 갖는 제2 카메라를 포함하는 경우,
    상기 제1 카메라는 상기 NPU가 상기 적어도 하나의 객체를 감지할 수 있도록 하도록 하는데 사용되고, 상기 제2 카메라는 상기 NPU가 상기 감지된 적어도 하나의 객체를 추적할 수 있도록 하는데 사용되는, 전자 장치.
  12. 제1항에 있어서, 상기 신호는:
    상기 이동가능한 기기의 비행 고도, 상기 고정된 기기 또는 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 상기 이동가능한 기기의 비행 속도에 기초하여 생성되는, 전자 장치.
  13. 제1항에 있어서,
    상기 하나 또는 복수의 카메라로부터 획득된 하나 이상의 이미지를 처리함으로써 조절가능한 차원(dimension)을 갖는, 조절가능한 입력 특징맵(input feature map)을 결정 데이터에 기초하여 생성하는 ISP(image signal processor)와; 그리고
    적어도 하나의 환경적 조건 데이터(environmental condition data)에 기초하여, 상기 결정 데이터를 생성하는 제어기를 더 포함하고,
    상기 NPU는 상기 조절가능한 입력 특징맵을 상기 다수의 PE들에 입력함으로써, 상기 인공신경망모델의 연산을 처리하는, 전자 장치.
  14. 제13항에 있어서,
    상기 입력 특징맵의 해상도 또는 사이즈는 상기 결정 데이터에 기초하여 조절가능한, 전자 장치.
  15. 제13항에 있어서,
    상기 입력 특징맵의 차원은 상기 결정 데이터에 기초하여 조절가능한, 전자 장치.
  16. 제13항에 있어서, 상기 입력 특징맵의 차원은 특징맵의 가로 사이즈와 세로 사이즈 그리고 채널의 개수를 포함하는, 전자 장치.
  17. 제13항에 있어서, 상기 환경적 조건 데이터는
    상기 이동가능한 기기의 비행 고도, 상기 고정된 기기 또는 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 상기 이동가능한 기기의 비행 속도를 포함하는, 전자 장치.
  18. 제1항에 있어서,
    상기 NPU는 상기 하나 또는 복수의 카메라로부터 획득된 이미지에 기반하여 생성된 하나 또는 복수의 입력 특징맵(input feature map)에 기초하여, 상기 인공신경망모델의 연산을 처리하고,
    상기 신호 생성기는 적어도 하나의 입력 특징맵을 위한 신호를 생성하고, 그리고
    상기 생성된 신호는 상기 적어도 하나의 입력 특징맵의 생성을 제어하거나 또는 상기 적어도 하나의 입력 특징맵의 적어도 하나의 속성을 제어하기 위한 적어도 하나의 명령어를 포함하는, 전자 장치.
  19. 제18항에 있어서, 상기 하나 또는 복수의 입력 특징맵은 상기 인공신경망모델의 다수의 레이어들 중에서 임의 레이어로 전달되는, 전자 장치.
  20. 제18항에 있어서, 상기 적어도 하나의 속성은
    상기 적어도 하나의 입력 특징맵의 사이즈, 또는
    상기 적어도 하나의 입력 특징맵의 해상도를 포함하는, 전자 장치.
  21. 제20항에 있어서, 상기 사이즈 또는 해상도는:
    상기 이동가능한 기기의 비행 고도, 상기 고정된 기기 또는 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 상기 이동가능한 기기의 비행 속도에 기초하여 동적으로 조정되는, 전자 장치.
  22. 제18항에 있어서,
    상기 적어도 하나의 입력 특징맵의 상기 적어도 하나의 속성을 변경하기 위한 회로를 더 포함하고,
    상기 적어도 하나의 속성은 사이즈 또는 해상도를 포함하는, 전자 장치.
  23. 제18항에 있어서, 상기 적어도 하나의 명령어는 상기 적어도 하나의 입력 특징맵의 FPS(Frame per second)를 증가시키는, 전자 장치.
  24. 제18항에 있어서,
    상기 적어도 하나의 속성이 상기 적어도 하나의 입력 특징맵의 사이즈이고, 상기 적어도 하나의 입력 특징맵의 사이즈가 상기 생성된 신호에 기초하여 축소되는 경우,
    상기 적어도 하나의 입력 특징맵의 FPS(Frame per second)가 증가되는, 전자 장치.
  25. 제18항에 있어서,
    상기 이동가능한 기기의 비행 고도, 상기 고정된 기기 또는 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 상기 이동가능한 기기의 비행 속도가 증가되는 경우, 상기 적어도 하나의 속성에 해당하는 해상도는 상기 생성된 신호에 기초하여 증가되는, 전자 장치.
  26. 제25항에 있어서,
    상기 이동가능한 기기의 비행 고도, 상기 고정된 기기 또는 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 상기 이동가능한 기기의 비행 속도가 증가되는 경우,
    상기 NPU는 적외선 카메라 또는 열화상 카메라로부터 캡쳐된 이미지 내에서 객체를 감지하고,
    상기 생성된 신호는 상기 적어도 하나의 속성에 대응하는 해상도를 증가시키기 위해서 사용되는, 전자 장치.
  27. 제1항에 있어서,
    하나 또는 복수의 카메라로부터 획득된 하나 이상의 이미지를 결정 데이터에 기초하여 다수의 이미지 블록들(blocks)로 분할(partitioning)하는 프로세서를 더 포함하고,
    상기 NPU는 상기 다수의 블록들에 기초하여, 상기 인공신경망모델의 연산을 처리하고, 그리고
    상기 결정 데이터는 상기 다수의 이미지 블록들의 개수를 결정하도록 설정되는, 전자 장치.
  28. 제27항에 있어서, 상기 결정 데이터는:
    상기 이동가능한 기기의 비행 고도, 상기 고정된 기기 또는 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이 또는 상기 이동가능한 기기의 비행 속도에 따라 정해지는, 전자 장치.
  29. 제27항에 있어서,
    상기 이동가능한 기기의 비행 고도, 상기 고정된 기기 또는 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이가 상승되는 경우, 상기 다수의 이미지 블록들의 개수는 증가되는, 전자 장치.
  30. 제27항에 있어서, 상기 다수의 이미지 블록들의 개수가 제1 임계값 보다 큰 경우, 상기 다수의 이미지 블록들은 상기 NPU에 입력되기 전에 사이즈가 업스케일링(upscaling)되는, 전자 장치.
  31. 제1항에 있어서,
    하나 또는 복수의 카메라로부터 획득된 하나 또는 복수의 이미지들을 다수의 블록들로 분할하는 이미지 전처리기를 더 포함하고,
    상기 NPU는, 상기 다수의 이미지 블록들 각각에 기반하여 생성된 하나 또는 복수의 입력 특징맵(input feature maps)에 기초하여, 상기 인공신경망모델의 연산을 처리하고, 그리고
    상기 다수의 이미지 블록들의 개수는 상기 이동가능한 기기의 움직임에 기초하여 동적으로 결정되는, 전자 장치.
  32. 제31항에 있어서, 상기 다수의 이미지 블록들은 상기 인공신경망모델의 연산을 처리하는데 입력으로 사용되는, 전자 장치.
  33. 제31항에 있어서,
    상기 이동가능한 기기의 비행 고도, 상기 고정된 기기 또는 상기 이동가능한 기기의 해수면 또는 지면으로부터의 높이가 상승되는 경우,
    열화상 카메라로부터 획득된 이미지 내의 객체(object)가 상기 NPU에 의해서 수행되는 인공신경망모델에 의하여 감지되고, 그리고
    가시 광선 카메라로부터 획득된 이미지 내의 객체(object)가 상기 NPU에 의해서 수행되는 인공신경망모델에 의하여 분류(object classification)되는, 전자 장치.
  34. 하나 또는 복수의 카메라로부터 획득된 하나 이상의 이미지에 기초하여, 적어도 하나의 객체를 감지(detect) 또는 추적(track)하는 단계와;
    상기 감지 또는 상기 추적의 정확도를 높이기 위하여, 상기 적어도 하나의 카메라를 기계적 또는 전기적으로 제어하기 위한 적어도 하나의 명령어를 포함하는 신호를 생성하는 단계와;
    상기 생성된 신호에 기초하여, 상기 적어도 하나의 카메라를 기계적 또는 전기적으로 제어하는 단계와; 그리고
    상기 생성된 신호에 기초하여 기계적 또는 전기적으로 제어된 적어도 하나의 카메라로부터 획득되는 후속 이미지에 기초하여, 상기 적어도 하나의 객체에 대한 감지 또는 추적을 지속하는 단계를 포함하고,
    상기 적어도 하나의 객체가 제1 임계값 보다 작은 신뢰도 레벨로 감지되거나 추적되는 경우, 상기 신호는 상기 적어도 하나의 객체의 좌표(coordinate)를 포함하도록 생성되는 방법.
  35. 제34항에 있어서, 상기 적어도 하나의 명령어는:
    상기 적어도 하나의 카메라의 바디, 렌즈 또는 이미지 센서 중 적어도 하나를 X, Y 또는 Z 축 방향으로 이동 또는 회전시키거나, 또는
    상기 적어도 하나의 카메라의 초점 거리(focal distance)를 증가시키거나 감소시키기 위해서 사용되는, 방법.
  36. 제34항에 있어서, 상기 적어도 하나의 명령어는:
    상기 적어도 하나의 카메라의 화각(angle of view)을 증가시키거나 감소시키거나,
    상기 적어도 하나의 카메라의 관측 시야(field of view, FoV)를 X, Y 또는 Z 축 방향으로 이동 또는 회전시키거나,
    상기 적어도 하나의 카메라의 FPS(frame per second)를 증가시키거나 감소시키거나, 또는
    상기 적어도 하나의 카메라가 줌-인(Zoom-in)하거나 또는 줌-아웃(zoom-out)하도록 하는데 사용되는, 방법.
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
KR1020220178092A 2022-12-19 2022-12-19 고정된 기기 또는 이동가능한 기기에 장착되고, 인공지능 반도체를 탑재한 전자 장치 KR102646894B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020220178092A KR102646894B1 (ko) 2022-12-19 2022-12-19 고정된 기기 또는 이동가능한 기기에 장착되고, 인공지능 반도체를 탑재한 전자 장치
US18/317,595 US11928836B2 (en) 2022-12-19 2023-05-15 Electronic device having NPU and mounted in moving or fixed apparatus
US18/317,642 US11948326B2 (en) 2022-12-19 2023-05-15 Fixed or movable electronic device with NPU and ISP

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220178092A KR102646894B1 (ko) 2022-12-19 2022-12-19 고정된 기기 또는 이동가능한 기기에 장착되고, 인공지능 반도체를 탑재한 전자 장치

Publications (1)

Publication Number Publication Date
KR102646894B1 true KR102646894B1 (ko) 2024-03-14

Family

ID=87932032

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220178092A KR102646894B1 (ko) 2022-12-19 2022-12-19 고정된 기기 또는 이동가능한 기기에 장착되고, 인공지능 반도체를 탑재한 전자 장치

Country Status (2)

Country Link
US (2) US11928836B2 (ko)
KR (1) KR102646894B1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102140805B1 (ko) * 2020-05-06 2020-08-03 국방과학연구소 위성 영상의 물체 식별을 위한 뉴럴 네트워크 학습 방법 및 장치
KR20210086840A (ko) * 2019-12-30 2021-07-09 주식회사 써로마인드 자동차의 주변 상황이 위험상황인지를 판단하고 주행가이드를 생성하여 경보하여 주는 방법 및 이를 이용한 장치
KR102382448B1 (ko) * 2021-09-06 2022-04-04 주식회사 라이드플럭스 라이다 기반 객체 탐지를 위한 인공지능 모델의 입력 특징맵 생성방법, 장치 및 컴퓨터프로그램
KR102392822B1 (ko) * 2021-06-10 2022-05-02 주식회사 에이투마인드 주간 타입 카메라 및 야간 타입 카메라를 이용하여 객체를 탐지 및 추적하는 장치 및 방법
KR20220108146A (ko) * 2020-06-30 2022-08-02 소니그룹주식회사 멀티-드론 카메라 제어 방법
KR20220128187A (ko) * 2021-03-12 2022-09-20 삼성전자주식회사 전자 장치, 그 제어 방법, 및 프로그램이 기록된 기록매체

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4188394B2 (ja) * 2005-09-20 2008-11-26 フジノン株式会社 監視カメラ装置及び監視カメラシステム
US8717451B2 (en) * 2008-05-16 2014-05-06 Panasonic Corporation Camera system, camera body and interchangeable lens
WO2019084919A1 (en) 2017-11-03 2019-05-09 SZ DJI Technology Co., Ltd. Methods and system for infrared tracking
US10769466B2 (en) * 2018-02-20 2020-09-08 International Business Machines Corporation Precision aware drone-based object mapping based on spatial pattern recognition
CA3158552A1 (en) * 2018-07-12 2020-01-16 TerraClear Inc. Object identification and collection system and method
EP3834134A4 (en) 2018-09-19 2022-10-26 Avigilon Corporation METHOD AND SYSTEM FOR OBJECT DETECTION USING A CONVOLUTIONAL NEURAL NETWORK
CN113168541A (zh) * 2018-10-15 2021-07-23 菲力尔商业系统公司 用于成像系统的深度学习推理系统和方法
US10982873B1 (en) * 2019-02-08 2021-04-20 Alarm.Com Incorporated Integrated air quality control system
CN112399033B (zh) * 2019-08-14 2022-04-15 杭州海康威视数字技术股份有限公司 摄像机组件和监控摄像机
US11483484B2 (en) 2019-11-06 2022-10-25 Nec Corporation Of America Systems and methods for imaging of moving objects using multiple cameras
KR102316960B1 (ko) 2019-11-28 2021-10-22 광운대학교 산학협력단 무인 항공기 영상 내 실시간 객체 검출 방법 및 장치
US20220309767A1 (en) 2021-03-26 2022-09-29 Teledyne Flir Detection, Inc. Object tracking in local and global maps systems and methods
CN113724299B (zh) * 2021-08-30 2023-09-19 上海大学 一种基于电液可调焦镜头的移动机器人追踪目标三维轨迹方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210086840A (ko) * 2019-12-30 2021-07-09 주식회사 써로마인드 자동차의 주변 상황이 위험상황인지를 판단하고 주행가이드를 생성하여 경보하여 주는 방법 및 이를 이용한 장치
KR102140805B1 (ko) * 2020-05-06 2020-08-03 국방과학연구소 위성 영상의 물체 식별을 위한 뉴럴 네트워크 학습 방법 및 장치
KR20220108146A (ko) * 2020-06-30 2022-08-02 소니그룹주식회사 멀티-드론 카메라 제어 방법
KR20220128187A (ko) * 2021-03-12 2022-09-20 삼성전자주식회사 전자 장치, 그 제어 방법, 및 프로그램이 기록된 기록매체
KR102392822B1 (ko) * 2021-06-10 2022-05-02 주식회사 에이투마인드 주간 타입 카메라 및 야간 타입 카메라를 이용하여 객체를 탐지 및 추적하는 장치 및 방법
KR102382448B1 (ko) * 2021-09-06 2022-04-04 주식회사 라이드플럭스 라이다 기반 객체 탐지를 위한 인공지능 모델의 입력 특징맵 생성방법, 장치 및 컴퓨터프로그램

Also Published As

Publication number Publication date
US11928836B2 (en) 2024-03-12
US20230289997A1 (en) 2023-09-14
US20230289996A1 (en) 2023-09-14
US11948326B2 (en) 2024-04-02

Similar Documents

Publication Publication Date Title
US11334960B2 (en) Systems and methods for pipelined processing of sensor data using hardware
US9373038B2 (en) Apparatus and methods for temporal proximity detection
JP2022515895A (ja) 物体認識方法及び装置
CN111401517B (zh) 一种感知网络结构搜索方法及其装置
CN110189304B (zh) 基于人工智能的光学遥感图像目标在线快速检测方法
CN111797983A (zh) 一种神经网络构建方法以及装置
TW201835788A (zh) 用於多維序列預測的方法和裝置
CN111507150A (zh) 利用基于深度神经网络的多重图像块组合识别人脸的方法
US20220207337A1 (en) Method for artificial neural network and neural processing unit
CN112990211A (zh) 一种神经网络的训练方法、图像处理方法以及装置
Slyusar et al. Improvement of the model of object recognition in aero photographs using deep convolutional neural networks
CN114492723A (zh) 神经网络模型的训练方法、图像处理方法及装置
CN117501245A (zh) 神经网络模型训练方法和装置、数据处理方法和装置
Dong et al. Real-time survivor detection in UAV thermal imagery based on deep learning
KR102652476B1 (ko) 인공신경망을 위한 방법 및 신경 프로세싱 유닛
Li et al. Vg-swarm: A vision-based gene regulation network for uavs swarm behavior emergence
Zhao et al. Object detection based on hierarchical multi-view proposal network for autonomous driving
CN113553943A (zh) 目标实时检测方法以及装置、存储介质、电子装置
KR102646894B1 (ko) 고정된 기기 또는 이동가능한 기기에 장착되고, 인공지능 반도체를 탑재한 전자 장치
CN116820131A (zh) 一种基于目标感知ViT的无人机跟踪方法
CN116580324A (zh) 一种基于YOLOv5的无人机对地目标检测方法
Ahmad et al. Computer Vision Techniques for Military Surveillance Drones
US20230316040A1 (en) Neural processing unit capable of switching ann models
CN115686062A (zh) 基于单目深度估计和反应式策略的飞行器自主导航方法
Rahmania et al. Exploration of the impact of kernel size for yolov5-based object detection on quadcopter

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant