KR20240095749A - 비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치 - Google Patents

비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치 Download PDF

Info

Publication number
KR20240095749A
KR20240095749A KR1020220177739A KR20220177739A KR20240095749A KR 20240095749 A KR20240095749 A KR 20240095749A KR 1020220177739 A KR1020220177739 A KR 1020220177739A KR 20220177739 A KR20220177739 A KR 20220177739A KR 20240095749 A KR20240095749 A KR 20240095749A
Authority
KR
South Korea
Prior art keywords
spatial data
tiling
tiles
data
dimensional spatial
Prior art date
Application number
KR1020220177739A
Other languages
English (en)
Inventor
이상설
장성준
김경호
이은총
Original Assignee
한국전자기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자기술연구원 filed Critical 한국전자기술연구원
Priority to KR1020220177739A priority Critical patent/KR20240095749A/ko
Priority to PCT/KR2022/020666 priority patent/WO2024135862A1/ko
Publication of KR20240095749A publication Critical patent/KR20240095749A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치가 제공된다. 본 발명의 실시예에 따른 3차원 공간 데이터 처리 방법은, 3차원 공간 데이터를 매트릭스 형태로 재배열하고, 3차원 공간 데이터가 재배열된 매트릭스들을 타일링하며,타일들을 딥러닝 네트워크로 분석한다. 이에 의해, 제한된 메모리를 갖는 소형의 엣지/모바일 디바이스에서 대용량의 비정형 3차원 공간 데이터에 대한 딥러닝 연산 처리가 가능해진다.

Description

비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치{Data processing and manipulating device for unstructured data processing}
본 발명은 영상 처리 및 시스템 SoC(System on Chip)에 관한 것으로, 더욱 상세하게는 3차원 공간의 비정형 데이터를 입력받아 딥러닝 연산 가속 처리가 가능하도록 데이터를 처리/가공하는 하드웨어에 관한 것이다.
자율주행, 3차원 영상 애플리케이션 등의 활성화로 인해, 3차원 공간 데이터에 대한 딥러인 연산 처리가 필요한 경우가 많아졌다.
이를 위해서는 3차원 공간 데이터를 다양한 방법으로 전처리하여 학습을 진행하고, 해당 결과를 GPU와 같은 대용량 데이터 처리가 가능한 외부 장치 하드웨어에서 빠르게 추론하여 결과를 도출할 수 있다.
그러나 하드웨어(SoC 등과 같은 리소스가 정해져 있는 장치) 상에서 데이터를 처리할 경우 하드웨어 리소스의 부족으로 오랜 시간이 걸리게 되므로 실시간 처리가 불가능하다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 소형의 엣지/모바일 디바이스에서 대용량의 비정형 3차원 공간 데이터에 대한 딥러닝 연산 처리가 가능하도록 하기 위한 방안으로, 비정형 3차원 공간 데이터의 타일링에 의한 데이터 전처리 방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 3차원 공간 데이터 분석 방법은 3차원 공간 데이터를 입력받아 메모리에 저장받는 단계; 메모리에 저장된 3차원 공간 데이터를 매트릭스 형태로 재배열하는 단계; 3차원 공간 데이터가 재배열된 매트릭스들을 타일링하는 단계; 타일링 단계에서 생성되는 타일들을 딥러닝 네트워크로 분석하는 단계;를 포함한다.
타일링 단계는, 제1 매트릭스를 타일링하여 2개의 타일들을 생성하는 제1 타일링 단계; 제2 매트릭스를 타일링하여 4개의 타일들을 생성하는 제2 타일링 단계;를 포함할 수 있다.
제1 타일링 단계는, 제1 매트릭스를 열방향으로 타일링하는 것일 수 있다.
제2 타일링 단계는, 제2 매트릭스를 격자로 타일링하는 것일 수 있다.
타일링 단계는, 제1 타일링 단계에서 생성된 2개의 타일들을 다시 타일링하여 4개의 타일들을 생성하는 제3 타일링 단계;를 더 포함할 수 있다.
제3 타일링 단계는, 제1 타일링 단계에서 생성된 2개의 타일들 중 하나에 대해, 홀수 행들과 짝수 행들로 분류하여 2개의 타일들을 생성하는 것일 수 있다.
제3 타일링 단계는, 제1 타일링 단계에서 생성된 2개의 타일들 중 나머지에 대해, 홀수 행들과 짝수 행들로 분류하여 2개의 타일들을 생성하는 것일 수 있다.
분석 단계는, 타일들을 분석하여, 3차원 공간 데이터에서 객체를 인식하는 것일 수 있다.
3차원 공간 데이터는, 일정한 순서 없이 hole이 많은 비정형 데이터일 수 있다.
본 발명의 다른 측면에 따르면, 3차원 공간 데이터를 입력받아 저장하는 메모리; 메모리에 저장된 3차원 공간 데이터를 매트릭스 형태로 재배열하고, 3차원 공간 데이터가 재배열된 매트릭스들을 타일링하는 전처리부; 및 전처리부에서 생성되는 타일들을 딥러닝 네트워크로 분석하는 딥러닝 가속기;를 포함하는 것을 특징으로 하는 3차원 공간 데이터 분석 장치가 제공된다.
본 발명의 또다른 측면에 따르면, 3차원 공간 데이터를 매트릭스 형태로 재배열하는 단계; 및 3차원 공간 데이터가 재배열된 매트릭스들을 타일링하는 단계;를 포함하는 것을 특징으로 하는 3차원 공간 데이터 처리 방법이 제공된다.
본 발명의 또다른 측면에 따르면, 3차원 공간 데이터를 입력받아 저장하는 메모리; 및 메모리에 저장된 3차원 공간 데이터를 매트릭스 형태로 재배열하고, 3차원 공간 데이터가 재배열된 매트릭스들을 타일링하는 전처리부를 포함하는 것을 특징으로 하는 3차원 공간 데이터 처리 장치가 제공된다.
이상 설명한 바와 같이, 본 발명의 실시예들에 따르면, 비정형 3차원 공간 데이터의 타일링에 의한 데이터 전처리를 통해, 제한된 메모리를 갖는 소형의 엣지/모바일 디바이스에서 대용량의 비정형 3차원 공간 데이터에 대한 딥러닝 연산 처리가 가능해진다.
도 1. 3차원 데이터 표현 형태
도 2. 가공된 3차원 데이터를 이용한 객체 인식 예시
도 3. 3차원 공간 데이터 처리 방법
도 4. 임의의 하드웨어 메모리 공간에 저장된 데이터 및 병렬 데이터 입출력
도 5. 병렬로 출력된 데이터의 곱셈 연산 예시
도 6. 곱셈 연산 병렬 point로 구분된 Matrix 구분
도 7. Mat A의 연산 모듈 군에 따른 분류
도 8 내지 도 11. Mat A(points)의 최종 Tiling 구조 및 표현형 변경
도 12. 본 발명의 일 실시예에 따른 딥러닝 연산 장치
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
본 발명의 실시예에서는 비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치를 제시한다. 3차원 공간의 비정형 데이터를 입력받아 딥러닝 연산 가속 처리가 가능하도록 데이터를 처리/가공하는 하드웨어 설계 기술이다.
도 1은 3차원 공간 데이터를 예시한 도면이다. 도 1에 제시된 바와 같은 3차원 공간 데이터를 다양한 방법으로 가공하여 딥러닝 학습 및 추론을 적용하면 도 2에 제시된 바와 같이 실질적인 영상 없이도 해당 데이터로부터 물체 인식이 가능하다.
그러나 해당 단순 영상 입출력 정보와는 다르게 3차원 공간 데이터의 경우 일정한 순서 없이 hole이 많은 형태로 데이터가 입력된다. 이를 처리 하기 위하여 도 3과 같이 보통 3가지 방법을 사용하게 된다.
도 3에 제시된 3가지의 방법 모두 해당 공간에 필요한 데이터를 적절히 제공하여야 높은 정확도의 결과 도출이 가능한 형태이다. 그러나 매 프레임 포인트의 위치(x,y,z) 및 위치의 대표 값 등이 지속적으로 변화되어 패턴 변경에 따른 성능 열화가 발생하지 않는 비정형 데이터 처리가 필요하다.
그러나, 3차원 공간(x,y,z)에 모두 데이터가 있는 것이 아니고, 순서가 없이 빈 공간이 많은 비정형 데이터라는 점에서, 딥러닝 연산이 가능한 수준의 데이터 처리를 위하여 본 발명의 실시예에서는 병렬 데이터 처리 방법을 제시한다.
도 4는 임의의 하드웨어 메모리 공간에 저장된 데이터 및 병렬 데이터 입출력을 나타내었다. 도 4에서 흰색은 데이터가 없는 공간 또는 의미 없는 데이터(잘못된 정보를 포함하는)를 표현하고 있다.
이 데이터에 대해서는 연산을 처리할 필요가 없을 뿐만 아니라, 하드웨어 관점에서 필요 없는 메모리 공간을 차지하고 있는 경우이다. 해당 메모리 공간은 하드웨어 처리기에서 내부 메모리가 아닌 외부에 큰 용량으로 되어 있는 DDR RAM과 같은 형태의 메모리에 저장되어 있다.
외부 메모리로부터 입력된 데이터를 차례로 입력하여 처리할 때 필요한 데이터를 도 4와 같이 여러개로 나뉘어진 Global Buffer에 차례로 입력하고(3차원 데이터의 경우 대부분 순서가 없기 때문에 편한 방법으로 저장해도 무방함), 입력된 데이터를 병렬로 출력할 수 있도록 registers(S)의 값이 0이 아닐 경우 데이터를 외부로 출력한다. 보통의 연산은 Matrix 곱셈 연산을 수행하기 때문에 Matrix 연산기의 병렬 수에 따라 데이터를 나눠서(Tiling) 연산이 가능한 형태로 재배열 해준다.
도 5는 하드웨어 메모리 공간에서 출력된 병렬 데이터들의 곱셈을 처리하는 예시이다. 도 5에서 곱셈 연산 병렬 point 수는 4개 이고, 연산 모듈 군(그룹)은 2개이다.
도 6은 연산 모듈 군으로 데이터를 입력하기에 앞서 곱셈 연산 병렬 point 수로 Tiling된 영역으로 구분되어진 것이다. 행렬의 곱셈시 Mat A의 열은 행렬 B의 행과 같이 연산이 되므로, 동일한 point 수로 나누어 질 수 있다. 이는 다시 연산 모듈 군 2개의 그룹으로 나누어서 도식화 하면 Mat A는 도 7과 나타낼 수 있다.
도 7은 연산 모듈 군에 따라 다시 Tiling 하면 총 4개의 Tile로 나뉘어지며, 도 8 내지 도 11과 같이 도식화 할 수 있다. Tiling을 함으로써 모든 데이터의 입력이 없더라도 Tiling 데이터 만으로도 지속적으로 Matrix 연산 수행이 가능하며, 연산에 따른 최종 결과를 지속적으로 후처리 단계로 넘겨 줄 수 있다. 이 과정은 Iterative한 연산 적용시 더 효율적이다.
도 8에서 표현하는 a40은 4행 0열(Original Real location 정보 X:a40, Y:a40, Z:a40) → 2행 0열(Original Real location 정보 X':20, Y':20, Z':20), a64는 6행 4열 → 3행 0열로 재표현이 가능해 진다.
연산시에 Tile 에서의 3차원 포인트 표현을 위한 데이터 좌표의 크기가 줄어 드는 효과가 있어 하드웨어 상에서 적은 비트로 데이터 표현이 가능하여 데이터 압축이 가능하다. 이는 입력의 크기와 Tile의 크기에 따라 압축률의 변화가 크게 나타날 수 있다.
도 12는 본 발명의 일 실시예에 따른 딥러닝 연산 장치의 구성을 도시한 도면이다. 본 발명의 실시예에 따른 딥러닝 연산 장치는 도시된 바와 같이, 메모리(110), MCU(120), 전처리부(130) 및 딥러닝 가속기(140)를 포함하여 구성된다.
MCU(120)는 외부 메모리로부터 3차원 공간 데이터를 전달 받아 메모리(110)에 저장한다. 메모리(110)에 저장되는 3차원 공간 데이터는 일정한 순서 없이 hole이 많은 비정형 데이터이다.
전처리부(130)는 메모리(110)에 저장된 3차원 공간 데이터에 대해 딥러닝 연산 처리가 가능하도록 전처리한다. 구체적으로 전처리부(130)는 메모리(110)에 저장된 3차원 공간 데이터를 읽어들여 매트릭스 형태로 재배열하고, 재배열된 매트릭스들을 타일링한다.
전처리부(130)에 의한 타일링 과정은 다음과 같다.
1) 매트릭스 A를 열방향으로 타일링하여 2개의 타일들을 생성
2) 매트릭스 A의 2개 타일들을 다시 타일링하여 4개의 타일들을 생성
여기서는 매트릭스 A의 2개 타일들을 홀수 행들과 짝수 행들로 분류하여 타일링
3) 매트릭스 B를 격자로 타일링하여 4개의 타일들을 생성
딥러닝 가속기(140)는 전처리부(130)에 의한 타일링으로 생성되는 타일들을 딥러닝 네트워크에 입력하여 분석한다. 분석을 통해 3차원 공간 데이터에서 객체를 인식할 수 있다. 이는 딥러닝 네트워크는 3차원 공간 데이터로부터 객체를 인식하도록 설계 및 학습된 경우이다.
다른 추론을 수행하도록 딥러닝 네트워크가 설계 및 학습되는 경우에도 본 발명의 기술적 사상이 적용될 수 있다.
지금까지 비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치에 대해 바람직한 실시예를 들어 상세히 설명하였다.
본 발명의 실시예에서는 비정형 데이터 병렬 처리 및 대용량의 비정형 데이터의 타일링 처리를 통한 딥러닝 가속을 가능하게 하였고, 유연한 데이터 처리 후 딥러닝 장치 연동 및 다양한 어플리케이션에도 적용 가능하도록 하였다.
본 발명의 실시예에서 제시한 데이터 처리 방법은 희소 데이터 처리를 소형의 엣지/모바일 디바이스에 적용한 것으로, 딥러닝 연산 처리를 가능하게 하는 타일링에 의한 데이터 표현형 압축 기법을 제시하였다.
한편, 본 실시예에 따른 장치와 방법의 기능을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
110 : 메모리
120 : MCU
130 : 전처리부
140 : 딥러닝 가속기

Claims (12)

  1. 3차원 공간 데이터를 입력받아 메모리에 저장받는 단계;
    메모리에 저장된 3차원 공간 데이터를 매트릭스 형태로 재배열하는 단계;
    3차원 공간 데이터가 재배열된 매트릭스들을 타일링하는 단계;
    타일링 단계에서 생성되는 타일들을 딥러닝 네트워크로 분석하는 단계;를 포함하는 것을 특징으로 하는 3차원 공간 데이터 분석 방법.
  2. 청구항 1에 있어서,
    타일링 단계는,
    제1 매트릭스를 타일링하여 2개의 타일들을 생성하는 제1 타일링 단계;
    제2 매트릭스를 타일링하여 4개의 타일들을 생성하는 제2 타일링 단계;를 포함하는 것을 특징으로 하는 3차원 공간 데이터 분석 방법.
  3. 청구항 2에 있어서,
    제1 타일링 단계는,
    제1 매트릭스를 열방향으로 타일링하는 것을 특징으로 하는 3차원 공간 데이터 분석 방법.
  4. 청구항 3에 있어서,
    제2 타일링 단계는,
    제2 매트릭스를 격자로 타일링하는 것을 특징으로 하는 3차원 공간 데이터 분석 방법.
  5. 청구항 4에 있어서,
    타일링 단계는,
    제1 타일링 단계에서 생성된 2개의 타일들을 다시 타일링하여 4개의 타일들을 생성하는 제3 타일링 단계;를 더 포함하는 것을 특징으로 하는 3차원 공간 데이터 분석 방법.
  6. 청구항 5에 있어서,
    제3 타일링 단계는,
    제1 타일링 단계에서 생성된 2개의 타일들 중 하나에 대해, 홀수 행들과 짝수 행들로 분류하여 2개의 타일들을 생성하는 것을 특징으로 하는 3차원 공간 데이터 분석 방법.
  7. 청구항 5에 있어서,
    제3 타일링 단계는,
    제1 타일링 단계에서 생성된 2개의 타일들 중 나머지에 대해, 홀수 행들과 짝수 행들로 분류하여 2개의 타일들을 생성하는 것을 특징으로 하는 3차원 공간 데이터 분석 방법.
  8. 청구항 1에 있어서,
    분석 단계는,
    타일들을 분석하여, 3차원 공간 데이터에서 객체를 인식하는 것을 특징으로 하는 3차원 공간 데이터 분석 방법.
  9. 청구항 1에 있어서,
    3차원 공간 데이터는,
    일정한 순서 없이 hole이 많은 비정형 데이터인 것을 특징으로 하는 3차원 공간 데이터 분석 방법.
  10. 3차원 공간 데이터를 입력받아 저장하는 메모리;
    메모리에 저장된 3차원 공간 데이터를 매트릭스 형태로 재배열하고, 3차원 공간 데이터가 재배열된 매트릭스들을 타일링하는 전처리부; 및
    전처리부에서 생성되는 타일들을 딥러닝 네트워크로 분석하는 딥러닝 가속기;를 포함하는 것을 특징으로 하는 3차원 공간 데이터 분석 장치.
  11. 3차원 공간 데이터를 매트릭스 형태로 재배열하는 단계; 및
    3차원 공간 데이터가 재배열된 매트릭스들을 타일링하는 단계;를 포함하는 것을 특징으로 하는 3차원 공간 데이터 처리 방법.
  12. 3차원 공간 데이터를 입력받아 저장하는 메모리; 및
    메모리에 저장된 3차원 공간 데이터를 매트릭스 형태로 재배열하고, 3차원 공간 데이터가 재배열된 매트릭스들을 타일링하는 전처리부를 포함하는 것을 특징으로 하는 3차원 공간 데이터 처리 장치.
KR1020220177739A 2022-12-19 2022-12-19 비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치 KR20240095749A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020220177739A KR20240095749A (ko) 2022-12-19 2022-12-19 비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치
PCT/KR2022/020666 WO2024135862A1 (ko) 2022-12-19 2022-12-19 비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220177739A KR20240095749A (ko) 2022-12-19 2022-12-19 비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치

Publications (1)

Publication Number Publication Date
KR20240095749A true KR20240095749A (ko) 2024-06-26

Family

ID=91589111

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220177739A KR20240095749A (ko) 2022-12-19 2022-12-19 비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치

Country Status (2)

Country Link
KR (1) KR20240095749A (ko)
WO (1) WO2024135862A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2518444B1 (en) * 2011-04-29 2014-06-11 Harman Becker Automotive Systems GmbH Navigation device and method of determining a height coordinate
KR102089471B1 (ko) * 2012-11-30 2020-03-17 삼성전자주식회사 타일 기반 렌더링 방법 및 장치
KR101566167B1 (ko) * 2015-04-22 2015-11-05 (주)이지스 3차원 공간정보에서 지형 데이터를 이용한 객체 렌더링 방법
KR102368364B1 (ko) * 2019-01-23 2022-03-02 한국전자기술연구원 딥러닝 가속 하드웨어 장치
KR102654690B1 (ko) * 2020-08-27 2024-04-04 한국전자기술연구원 딥러닝 가속 장치 및 그 방법

Also Published As

Publication number Publication date
WO2024135862A1 (ko) 2024-06-27

Similar Documents

Publication Publication Date Title
JP7132824B2 (ja) ニューラルネットワークにおいてデコンボルーション演算を実行する装置及びその方法
US10013628B2 (en) Information processing apparatus and information processing method
KR102129895B1 (ko) 폴드된 특징 데이터에 대한 컨볼루션 연산을 수행하기 위한 방법 및 장치
CN111357017A (zh) 低功率卷积神经网络推理应用程序的存储器带宽减少技术
KR20200066952A (ko) 확장 컨벌루션 연산을 수행하는 장치 및 방법
US20240095532A1 (en) Method and apparatus for processing data
KR20210036715A (ko) 뉴럴 프로세싱 장치 및 뉴럴 프로세싱 장치에서 뉴럴 네트워크의 풀링을 처리하는 방법
CN109117940B (zh) 基于卷积神经网络的目标检测方法、装置、终端及存储介质
US11144291B1 (en) Loop-oriented neural network compilation
JP2022550730A (ja) 高速なスパースニューラルネットワーク
JP6955598B2 (ja) 複数の畳み込みウィンドウ内の画像データの並行抽出方法、装置、機器及びコンピュータ可読記憶媒体
US11567778B2 (en) Neural network operation reordering for parallel execution
US20230196113A1 (en) Neural network training under memory restraint
KR20200095300A (ko) 뉴럴 네트워크의 컨볼루션 연산을 처리하는 방법 및 장치
US11562554B1 (en) Workload reduction for non-maximum suppression operation
KR20210039197A (ko) 데이터를 처리하는 방법 및 장치
US8897544B2 (en) System and method for segmentation of three-dimensional image data
US11636569B1 (en) Matrix transpose hardware acceleration
CN112200310B (zh) 智能处理器、数据处理方法及存储介质
KR102606207B1 (ko) 매트릭스 수학 명령어 세트에 대한 타일링 알고리즘
US12014505B2 (en) Method and apparatus with convolution neural network processing using shared operand
KR20240095749A (ko) 비정형 데이터 처리를 지원하는 데이터 처리 및 가공 장치
CN114492797A (zh) 模型剪枝方法、装置、设备和存储介质
CN116824289A (zh) 模型训练方法、图像分割方法、终端设备以及存储介质
CN111831207B (zh) 一种数据处理方法、装置及其设备