KR102618558B1

KR102618558B1 - 조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법

Info

Publication number: KR102618558B1
Application number: KR1020200000794A
Authority: KR
Inventors: 최유진; 이정원; 모스타파 엘 카미
Original assignee: 삼성전자주식회사
Priority date: 2019-03-18
Filing date: 2020-01-03
Publication date: 2023-12-27
Also published as: US10886943B2; US20200395955A1; US20230006692A1; KR20200111093A; US11451242B2; CN111710007A; US11979175B2; US20200304147A1

Abstract

조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법이 제공된다. 일 실시예에서, 압축 방법은 라그랑주 승수를 사용하여 조건부 오토인코더를 학습시키고, 혼합 양자화 빈 사이즈들을 이용하여 조건부 오토인코더를 포함하는 신경망을 학습시킬 수 있다.

Description

조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법{METHOD AND APPARATUS FOR VARIABLE RATE COMPRESSION WITH A CONDITIONAL AUTOENCODER}

본 개시는 데이터 압축에 관한 것이다. 보다 구체적으로, 본 개시는 조건부 오토인코더를 이용한 데이터 압축 방법 및 장치에 관한 것이다.

가변-레이트 압축은 신경망을 이용할 수 있으며, 이미지 압축 및 RFIC(Radio Frequency Integrated Circuit) 출력 압축을 포함하지만 이에 제한되지 않는 다양한 분야에 적용될 수 있다.

이미지 압축은 데이터 압축의 응용으로서, 디지털 이미지의 저장 및/또는 전송 요구 사항을 낮출 수 있다. JPEG(Joint Photographic Experts Group) 및 JPEG2000과 같은 이미지 압축 알고리즘을 생성하는 데 변환 코딩이 사용될 수 있다. 이러한 변환 코딩은 손실 압축(일반적으로 양자화 및 무손실 소스 코딩의 조합)이 더 적절하고 더 효율적인 변환 도메인에서, 입력을 잠재 표현으로 변환한다. 예를 들어, JPEG는 이산 코사인 변환(Discrete cosine transform, DCT)을 사용하여 이미지를 희소 주파수 도메인 표현으로 변환한다. JPEG2000은 DCT를 향상된 이산 웨이블릿 변환으로 대체한다.

딥 러닝은 다양한 컴퓨터 비전 작업에서 향상된 성능을 제공 할 수 있다. 이러한 딥 러닝의 혁신적인 발전과 함께 학습 기반 이미지 압축도 관심을 끌었다. 특히, 딥 뉴럴 네트워크로 설계된 비선형 변환 코딩은 도메인 전문가가 정교하게 설계하고 최적화한 전통적인 이미지 압축 코덱, 예를 들어, HEVC(High Efficiency Video Codec) 표준의 정지 화상 버전인 BPG(Better Portable Graphics)보다 성능이 뛰어나다. 일반적인 학습 기반 이미지 압축 방식은 MSE(Mean Squared Error)를 기반으로 하는 메트릭인 PSNR(Peak Signal-to-Noise Ratio)에 대한 BPG 코덱을 제공한다.

일반적인 오토인코더 기반 이미지 압축 프레임 워크는 라그랑주(Lagrange) 승수 방법을 사용하여 RD(Rate-Distortion) 쌍의 가중치 조합을 최적화한다. 압축 이미지의 품질(또는 레이트)을 조정하기 위해 다양한 모델이 라그랑주 승수의 서로 다른 값에 대해 별도로 학습된다. 즉, 일반적인 시스템은 레이트 적응을 위해 여러 모델을 학습 및 전개하거나, 라그랑주 승수를 변경하는 과정 중에 임의 모델 하나를 유지한다. 이는 광범위한 RD 곡선을 정밀한 해상도로 커버하려고 하고, 각각의 네트워크의 크기가 큰 경우 비실용적일 수 있다.

본 개시는 조건부 오토인코더를 이용해 데이터를 압축하기 위한 시스템 및 방법을 제공한다.

본 개시의 일 실시예의 압축 방법은, 라그랑주 승수를 사용하여 조건부 오토인코더를 학습시키고, 혼합 양자화 빈 사이즈들을 이용하여 조건부 오토인코더를 포함하는 신경망을 학습시킬 수 있다.

본 개시의 일 실시예의 압축 시스템은, 조건부 오토인코더를 포함하는 신경망, 및 프로세서를 포함할 수 있다. 프로세서는 라그랑주 승수를 사용하여 조건부 오토인코더를 학습시키고, 혼합 양자화 빈 사이즈들을 이용하여 신경망을 학습시킬 수 있다.

본 개시에 따른 시스템 및 방법을 통해, 데이터를 압축할 수 있다.

본 개시의 양상들은 도면에 도시된 예시적인 실시예들을 참조하여 설명될 것이다.
도 1a는 본 개시에 따른 가변-레이트 이미지 압축 모델을 도시한다.
도 1b는 본 개시에 따른 가변-레이트 이미지 압축 모델을 도시한다.
도 2는 본 개시에 따른 압축 방법의 흐름도를 도시한다.
도 3은 본 개시에 따른 조건부 오토인코더를 도시한다.
도 4는 본 개시에 따른 개선된 가변-레이트 압축 모델을 도시한다.
도 5는 본 개시에 따른 RFIC 아날로그-디지털 변환기 출력 압축 시스템을 도시한다.
도 6은 본 개시에 따른 조건부 인코더를 도시한다.
도 7은 본 개시에 따른 조건부 인코더를 도시한다.
도 8은 본 개시에 따른 조건부 엔트로피 모델을 도시한다.
도 9는 본 개시에 따른 조건부 엔트로피 모델을 도시한다.
도 10은 본 개시에 따른 조건부 디코더를 도시한다.
도 11은 본 개시에 따른 조건부 디코더를 도시한다
도 12는 본 개시에 따른 네트워크 환경에서 전자 장치를 도시한다.

가변-레이트 압축은 신경망 기능을 이용할 수 있으며, 이미지 압축 및 RFIC(Radio Frequency Integrated Circuit) 출력 압축을 포함하지만 이에 제한되지 않는 다양한 분야에 적용될 수 있다.

일 실시 예에서, 본 시스템 및 방법은 레이트 적응을 수행하는 단일 가변-레이트 이미지 압축 네트워크를 제공한다. 특히, 네트워크는 라그랑 주 승수로 조절된 조건부 오토인코더를 포함할 수 있다(즉, 네트워크는 라그랑주 승수를 입력으로 하여 입력 값에 의존하는 압축률(예를 들어, 이미지 압축에서 BPP(Bits Per Pixel))을 가지는 잠재 표현을 생성할 수 있다). 또한, 네트워크는 잠재 표현의 양자화에 적용된 빈 사이즈를 조정함으로써 압축률의 적응을 허용하는 혼합 양자화 빈 사이즈로 학습될 수 있다. 조건부 모델에서 라그랑주 승수를 변경함으로써 목표에 대한 대략적인 압축률 적응을 달성하고, 양자화 빈 사이즈를 조정함으로써 세부적인 압축률 적응을 수행할 수 있다.

도 1a는 본 개시에 따른 가변-레이트 이미지 압축 모델(100)을 도시한다. 가변-레이트 이미지 압축 모델(100)은 조건부 오토인코더(102), 조건부 디코더(104) 및 조건부 엔트로피 모델(106)을 포함할 수 있다. 조건부 오토인코더(102)는, 압축률을 적응시키고 하나의 조건부 모델에서 다양한 λ 값에 대해 레이트-왜곡 라그랑지안(Lagrangian)을 최적화하는 라그랑주 승수 λ(108)에서 조절될 수 있다. 모델(100)은 양자화 빈 사이즈 Δ(110)의 혼합된 값들에 대해 범용 양자화(111)로 학습되어 있어, 압축률은 Δ(110)를 변경함으로써 달라질 수 있다. 라그랑주 승수(108)는 조건부 엔트로피 모델(106) 및 조건부 디코더(104) 모두에 이용될 수 있다. 모델(100)은 엔트로피 인코딩(112) 및 엔트로피 디코딩(114)을 이용할 수 있다.

현재 조건부 오토인코더(102)는 최적화 문제의 하이퍼 파라미터(즉, 라그랑주 승수 λ(108))를 컨디셔닝 변수로서 수신할 수 있다. 본 시스템 및 방법은 별도의 비-조건부 네트워크들을 사용하여 개별적으로 목표를 해결하는 대신, 하나의 조건부 네트워크를 사용하여 여러 목표를 해결한다. 모델(100)은 다중 반복을 필요로 하지 않는 조건부 오토인코더에 기초한 반면, 품질은 컨디셔닝 변수 λ(108) 및 Δ(110)에 의해 제어될 수 있다.

도 1b는 본 개시에 따른 가변-레이트 이미지 압축 모델(150)을 도시한다. 가변-레이트 이미지 압축 모델(150)은 제1 조건부 오토인코더(152), 제2 조건부 오토인코더(154), 제1 조건부 엔트로피 모델(156), 제2 조건부 엔트로피 모델(158), 제1 조건부 오토디코더(160) 및 제2 조건부 오토디코더(162)를 포함할 수 있다. 가변-레이트 이미지 압축 모델(150)은 또한 제1 범용 양자화 함수(164) 및 제2 범용 양자화 함수(166)뿐만 아니라, 제1 산술 인코딩(Arithmetic Encoding, AE)/디코딩(Arithmetic Decoding, AD) 함수(168) 및 제2 AE/AD 함수(170)를 더 포함할 수 있다. 하이퍼 파라미터(172)는 후술하는 바와 같이 범용 양자화 함수(164, 166)에서 이용될 수 있다.

인코더 및 디코더 를 포함하는 오토인코더 아키텍처에서, x는 입력 범위이며 는 양자화 빈 사이즈 Δ를 갖는 입력 x로부터 인코딩된 양자화된 잠재 표현이고, 이다. 아래 방정식에서, Δ는 1로 고정된다. 무손실 엔트로피 소스 코딩은 양자화된 표현 z로부터 압축된 비트스트림(bitstream)을 생성하는데 사용된다. 양자화된 잠재 변수 z에 대한 엔트로피 소스 코딩을 취하고 그 엔트로피 레이트를 알면, 압축률 R 및 L2 왜곡 D(즉, MSE 손실)는 다음의 수학식 1과 수학식 2에 의해 주어질 수 있다.

수학식 2는 다음과 같다.

p(x)는 모든 자연 이미지의 확률 밀도 함수이고, 는 인코더 및 로부터 유도된 z의 확률 질량 함수이며, 수학식 2를 만족하고,

는 디락(Dirac) 델타 함수를 나타낸다. 라그랑주 승수 방법을 사용한 RD 최적화 문제는 수학식 3으로 표현될 수 있다.

λ는 λ>0인 고정 라그랑주 승수이다. 수학식 1에 제공된 압축률 및 왜곡은, 및 로 인해, 네트워크 파라미터

에 의해 구별 될 수 없으므로, 수학식 3을 최적화하는 것은 간단하지 않다.

일 실시 예에서, 본 시스템은 범용 양자화를 사용할 수 있다. 범용 양자화는 수학식 4에서와 같이 하나의 공통된 균일 랜덤 변수를 사용하여 잠재 표현 의 모든 요소를 디더링한다.

여기서, 디더링 벡터 u는 의 서포트를 받아 단일 균일 랜덤 변수 U의 반복을 포함한다. 범용 양자화는 네트워크 트레이닝의 역전파에서 단위 기울기의 선형 함수로 근사화된다. 범용 양자화에 의해 유발된 노이즈는 차원에 따라 좌우되지만, 범용 양자화는 각 차원에서, 균일한 노이즈를 추가하는 경우에도 실질적으로 동일한 분포를 가진다.

수학식 1과 유사하게, 범용 양자화 하에서, 압축률과 왜곡은 수학식 5와 같이 표현 될 수 있다.

여기서, 이다. 압축률은 이제 미분 엔트로피로서, 미분 가능하지만 여전히 를 계산하기 어렵다. 따라서, 보다 다루기 쉬운 밀도 함수 가 도입되었고 수학식 6은 다음과 같이 유도된다.

여기서, KL은 Kullback-Leibler 분기를 나타낸다. 등호는 일 때 성립한다. 를 그 상한 로 근사함으로써, 수학식 3의 RD 최적화는 수학식 7로 환산된다.

여기서, 고정값 λ는 λ>0이다. 서로 다른 λ 값의 네트워크를 최적화하면, 품질을 압축률과 트레이드오프 할 수 있다. 더 작은 라그랑주 승수 λ를 사용하면, 학습된 네트워크가 더 높은 레이트를 사용하면서 더 높은 품질의 이미지를 생성할 수 있다.

압축된 이미지의 품질 및 압축률을 조정하기 위해, 시스템은 라그랑 주 승수의 다양한 값 λ에 대해 수학식 7의 RD 라그랑주 함수를 최적화할 필요가 있다. 본 개시에서는, 한번 전개되면 재교육의 필요 없이, 사용자의 요구 사항에 따라 다양한 레이트로 다양한 품질의 압축 이미지를 생성하는 데 사용할 수 있는 가변-레이트 모델이 개시된다.

도 2는 본 개시에 따른 압축 방법의 흐름도(200)를 도시한다. 202에서, 시스템은 조건부 오토인코더를 학습시킨다. 시스템은 라그랑주 승수 λ로 조절된 조건부 오토인코더를 학습시킬 수 있다. 네트워크는 입력 이미지와 함께, λ를 컨디셔닝 입력 매개 변수로 수신하고, λ의 컨디셔닝 값에 따라 다양한 압축률과 왜곡으로 압축된 이미지를 생성한다. 따라서, 수학식 5 및 6에서의 압축률 및 왜곡 항은 수학식 8 및 9로 변경될 수 있다.

여기서, 일 때,

는 라그랑주 승수 값들의 사전 정의된 유한 집합이다. 이때, 수학식 10의 목적 함수 조합이 최소화된다.

도 3은 본 개시에 따른 조건부 오토인코더(300)를 도시한다. 조건부 오토인코더를 구현하기 위해 라그랑주 승수에 따라 조절되는 조건부 컨볼루션이 개발된다. 시스템은 컨볼루션 레이어(304)을 통해 입력(302)을 전송하는 반면, 시스템은 원-핫 인코딩 레이어(308)을 통해 라그랑주 승수 λ(306)를 전송하고, 그 출력은 제1 완전-연결 레이어(310)에 대한 입력 및 제2 완전-연결 레이어(312)에 대한 입력으로 분할된다. 시스템은 제1 완전-연결 레이어(310)의 출력을 소프트플러스 함수 블록(314)으로 전송하고, 그 출력은 316에서 컨볼루션 레이어(304)의 출력과 곱해진다. 그 후, 시스템은 곱셈된 출력(318) 및 완전-연결 레이어(312)로부터의 출력을 가산기(319)로 축적하여 출력(320)을 생성한다. 컨볼루션은 라그랑주 승수 λ(306)로 조절되며, 입력되는 라그랑주 승수 λ(306)에 따라 다른 출력을 생성한다.

구체적으로, 도 3를 참조하면, 는 채널 i의 2-D 입력이고, 는 채널 j의 2-D 출력이며, 는 입력 채널 i 및 출력 채널 j를 위한 2-D 컨볼루션 커널(Kernel)이다. 조건부 컨볼루션은 수학식 11에 의해 주어진다.

여기서, *는 2-D 컨볼루션을 나타낸다. 채널별 스케일링 계수 및 가산 바이어스 항은 수학식 12의 λ에 의존한다.

여기서, 및 는 출력 채널 j에 대한 길이 의 완전-연결 레이어 가중치 벡터이며, T는 전치(Transpose)를 나타내고, 은

상의 λ의 원-핫 인코딩이다.

도 2를 참조하면, 204에서, 시스템은 혼합 양자화 빈 사이즈로 네트워크를 학습시킨다. 전술한 조건부 오토인코더는, λ가 미리 결정된 유한 세트

로부터 선택되기 때문에, RD 곡선에서 유한한 불연속 점만을 얻을 수 있다. 커버리지를 RD 곡선의 전체 연속 범위로 확장하기 위해서는, 네트워크의 다른 제어 양상, 즉, 양자화 빈 사이즈가 압축률을 제어하기 위해 포함되어야 한다. 수학식 1의 RD 공식에서, 양자화 빈 사이즈는 Δ=1로 고정된다(즉, 라운드(Round)는 양자화를 위해 사용된다). 실제로는, 빈 사이즈가 클수록 압축률이 낮아지는 것과 같이, 압축률을 조정하기 위해 빈 사이즈를 변경할 수 있다. 다만, 학습시와 추론시 일치하지 않는 빈 사이즈로 인해 성능이 자연스럽게 저하되므로, 시스템은 혼합된 빈 사이즈로 네트워크를 학습한다.

학습 중에 시스템은 다양한 노이즈 레벨(임의의 Δ에서)에 대해 균일한 노이즈를 추출할 수 있다. Δ의 범위 및 범위내의 혼합 분포는 설계상 선택사항이다. 일 예에서, 가 이용되었고, 여기서 b는 가 커버되도록 에서 균일하게 추출된다. b의 범위가 클수록, 성능은 저하될 수 있지만 네트워크를 최적화할 수 있는 RD 곡선의 범위는 더 넓어진다. 최적화는 수학식 13과 같다.

여기서, 는 미리 정의된 Δ의 혼합 밀도이고, 수학식 14에서도 마찬가지이다.

도 2를 참조하면, 206에서, 시스템은 추론을 수행한다. 압축률 적응과 관련하여, 라그랑주 승수 및/또는 양자화 빈 사이즈가 감소함에 따라 압축률은 증가한다. 사용자의 목표 압축률이 주어지면 시스템은 라그랑주 승수를 변경하여 대략적인 불연속 압축률 적응을 달성함과 동시에, 고정 라그랑주 승수의 양자화 빈 사이즈를 조정하여 세부적인 연속 압축률 적응을 수행할 수 있다.

압축과 관련하여, 시스템은 를 선택한 후 라그랑주 승수의 원-핫 인코딩을 수행하고, 그것을 모든 조건부 컨볼루션 레이어들에서 사용하여 입력의 잠재 표현을 인코딩한다. 시스템은 선택된 양자화 빈 사이즈로 인코딩된 표현에 대해 규칙적인 결정론적 양자화를 수행한다. 그 후, 시스템은 인코딩에 사용된 컨디셔닝 변수들의 값을 저장하면서, 엔트로피 인코딩을 사용하여 양자화된 잠재 표현을 압축된 비트스트림으로 인코딩한다.

압축 해제와 관련하여, 시스템은 압축된 비트스트림을 디코딩하고, 압축된 비트스트림으로부터 인코딩에 사용된 컨디셔닝 변수를 검색한다. 시스템은 디코더 정수 값에 양자화 빈 사이즈를 곱함으로써, 디코더 정수 값으로부터 양자화된 잠재 표현을 복원한다. 그 후, 시스템은 복원된 잠재 표현을 디코더에 공급하여 이미지를 재구성한다. 인코딩에 사용된 라그랑주 승수 값은 조건부 생성을 위해 모든 비컨볼루션 레이어에서 다시 사용된다.

도 4는 본 개시에 따른 개선된 가변-레이트 압축 모델을 도시한다. 도 4를 참조하면, 인코더(400) 및 디코더(402)가 도시되어있다. 시스템은 x(406) 및 z(408)에 의존하는 2차 잠재 변수 w(404)를 도입하여 확률 모델을 개선한다. 수학식 14에 주어진 레이트 및 왜곡 항들은 수학식 15에 의해 주어진다.

압축의 경우, 시스템은 x(406)로부터 z(408)를 인코딩하고, z(408), x(406)로부터 w(404)를 추가로 인코딩한다. 인코딩된 표현들 z(408), w(404)는 각각 와 에 기초하여 엔트로피 코딩된다. 압축 해제의 경우, 주어진 로, 시스템은 w(404)를 디코딩하고, 이는 를 계산하고 z(408)를 디코딩하는데 사용된다. 이 모델은 수학식 16과 같이 와 에 자기회귀모델을 도입함으로써 더욱 개선된다.

시스템은 인코딩된 표현의 무손실 소스 코딩 부분을 손실 압축으로 대체함으로써 레이트를 적응시킨다. BPG(Better Portable Graphics)를 포함하지만 이에 제한되지는 않는 임의의 유형의 손실 압축 코덱이 사용될 수 있다. 인코딩된 특징맵의 무손실 압축 대신 손실 압축을 사용함으로써, 시스템은 정확도를 향상시키기 위해 손실 압축 출력의 디코더를 미세 조정할 수 있다.

BPG 손실 압축의 경우, 시스템은 인코딩된 특징맵을 하나의 그레이 스케일 이미지로 재배열할 수 있다. 시스템은 재배열된 그레이 스케일 이미지를 BPG 손실 압축으로 더 압축할 수 있다. 압축 해제의 경우, 시스템은 BPG에서 특징맵을 압축 해제한 다음, 압축 해제된 특징맵을 디코더로 전달하여 압축 해제된 이미지를 얻을 수 있다.

일 실시예에서, 시스템 및 방법은 무선 통신 칩셋의 도메인에 적용될 수 있다.

도 5는 본 개시에 따른 RFIC 아날로그-디지털 변환기(Analog-to-Digital Converter, ADC) 출력 압축 시스템(500)을 도시한다. 시스템은 RFIC(502), 가변-레이트 압축 네트워크(504), 기저 대역 모뎀(506) 및 룩업 테이블(508)을 포함한다. 시스템은 SNR(Signal-to-Noise Ratio)에 의해 결정되는 변조 코딩 방식(Modulation Coding Scheme, MCS)(510)에 기초하여, 압축률(예를 들어, 비트/서브프레임, 비트/프레임, 비트/슬롯 등)을 적응시킨다. 시스템은 MCS의 함수로서, 압축률 및 왜곡을 결정하는 컨디셔닝 변수들(

,Δ)을 선택할 수 있다. 여기서, 압축으로 인한 성능 저하를 피하기 위해 왜곡 정도가 동작 SNR보다 낮을 수 있다. 시스템은 MCS를

,Δ 에 매핑하는 룩업 테이블(508)을 포함 할 수 있다.

시스템은 본 가변-레이트 압축 방식을 적용하여 RFIC(Radio Frequency Integrated Circuit)의 아날로그-디지털 변환기(ADC)(502) 출력을 압축할 수 있다. 시스템은 압축 네트워크(504)로 ADC(502) 출력을 압축할 수 있고, 압축된 ADC 출력을 기저 대역(Baseband, BB) 모뎀(506)으로 전달하여 RFIC와 BB 사이의 통신 비용(즉, 대역폭 및/또는 레인(Lane)의 수)을 감소시킬 수 있다. 가능한 대역폭 및 지연에 따라, 모든 슬롯, 모든 서브 프레임 또는 모든 프레임에서 압축이 수행될 수 있다.

도 6은 본 개시에 따른 제1 조건부 인코더(600)를 도시한다. 조건부 인코더(600)는 도 1a에 도시된 조건부 오토인코더(102) 및 도 1b에 도시된 조건부 오토인코더(152)와 유사할 수 있다. 입력(예를 들어, 이미지, ADC 출력 등)(602)이 제공되면, 시스템은 입력(602)을 제1 192x5x5/2 조건부 컨볼루션 레이어(604), 제1 GDN(Generalized Divisive Normalization) 레이어(606), 제2 192x5x5/2 조건부 컨볼루션 레이어(608), 제2 GDN 레이어(610), 제3 192x5x5/2 조건부 컨볼루션 레이어(612), 제3 GDN 레이어(614), 384x5x5/2 조건부 컨볼루션 레이어(616), 및 범용 양자화(UnivQuant) 레이어(618)를 통해 진행시키고, 출력(620)을 생성한다. 제3 GDN 레이어(614)는 출력(622)을 생성하고, 그 출력(622)은 192x5x5/2 조건부 컨볼루션 레이어(624) 및 누설 ReLU 활성화 함수(626)로 전송되고, 출력(628)을 생성한다.

도 7은 본 개시에 따른 제2 조건부 인코더(700)를 도시한다. 제2 조건부 인코더(700)는 도 1b에 도시된 조건부 오토인코더(154)와 유사할 수 있다. Concat 레이어(702)는 출력(620) 및 출력(628)을 수신하고, 시스템은 192x3x3/1 조건부 컨볼루션 레이어(704), 제1 누설 ReLU 활성화 함수(706), 제1 192x5x5/2 조건부 컨볼루션 레이어(708), 제2 누설 ReLU 활성화 함수(710), 제2 192x5x5/2 조건부 컨볼루션 레이어(712), 및 UnivQuant 레이어(714)를 통해, 출력(716)을 생성한다.

도 8은 본 개시에 따른 조건부 엔트로피 모델(800)을 도시한다. 엔트로피 모델(800)은 도 1b에 도시된 조건부 엔트로피 모델(158)과 동일하거나 유사할 수 있다. 엔트로피 모델(800)은 출력(716)을 수신하고, AE(802) 및 AD(804)를 통해 처리한다. 엔트로피 모델(800)은 마스킹된 384x5x5/1 조건부 컨볼루션 레이어(806), 640x1x1/1 조건부 컨볼루션 레이어(808), 제1 누설 ReLU 활성화 함수(810), 512x1x1/1 조건부 컨볼루션 레이어(812), 및 제2 누설 ReLU 활성화 함수(814)를 통해 출력(716)을 처리한다. ReLU 함수(814)의 출력은 제1 192x1x1/1 조건부 컨볼루션 레이어(816)뿐만 아니라, 제2 192x1x1/1 조건부 컨볼루션 레이어(818)를 통해 처리된다. 제2 조건부 컨볼루션 레이어(818)의 출력은 제3 ReLU 활성화 함수(820)를 통해 처리되고, 제1 조건부 컨볼루션 레이어(816) 및 ReLU 활성화 함수(820)의 출력은 가우스 모델(822)을 생성하도록 처리된다. 가우스 모델(822)은 출력(826)을 생성하기 위해 AE(802) 및 AD(804)와 함께 이용될 수 있다.

도 9는 본 개시에 따른 조건부 엔트로피 모델(900)을 도시한다. 조건부 엔트로피 모델(900)은 도 1a에 도시된 조건부 엔트로피 모델(106) 및 도 1b에 도시된 조건부 엔트로피 모델(156)과 유사할 수 있다. 마스킹된 768x5x5/1 조건부 컨볼루션 레이어(914)는 입력(826)을 수신하고 출력(916)을 생성한다. 또한, 시스템은 출력(826)을 수신하여, 384x5x5/2 조건부 컨볼루션 레이어(902), 제1 누설 ReLU 활성화 함수(904), 576x5x5/2 조건부 컨볼루션 레이어(906), 제2 누설 ReLU 활성화 함수(908) 및 768x3x3/1 조건부 컨볼루션 레이어(910)를 통해 출력을 생성한다. 시스템은 Concat 함수를 통해 레이어(910)의 출력 및 출력(916)을 처리하며, 처리된 출력은 1280x1x1/1 조건부 컨볼루션 레이어(918), 제3 누설 ReLU 활성화 함수(920), 1024x1x1/1 조건부 컨볼루션 레이어(922) 및 제4 누설 ReLU 활성화 함수(924)를 통해 처리되어 출력(926)을 생성한다. 그 후, 시스템은 출력(926)을 제1 384x1x1/1 조건부 컨볼루션 레이어(928) 및 제2 384x1x1/1 조건부 컨볼루션 레이어(930)를 통해 처리한다. 제1 384x1x1/1 조건부 컨볼루션 레이어(928)의 출력은 ReLU 활성화 함수(932)을 통해 처리되고, ReLU 활성화 함수(932)의 출력(931) 및 제2 384x1x1/1 조건부 컨볼루션 레이어(930)의 출력(933)은 가우스 밀도 모델(934)를 통해 처리된다.

시스템은 가우스 밀도 모델(934)의 출력(936) 및 조건부 인코더(600)로부터의 출력(620)을 오토인코더(AE)(938)로 처리하여 양자화 테이블(939)을 통해 처리되는 신호를 생성한다. 시스템은 양자화 테이블(939)의 출력 및 가우스 밀도 모델(934)의 출력(936)을 디코더(AD)(940)로 처리하여 출력(942)을 생성한다.

도 10은 본 개시에 따른 조건부 디코더(1000)를 도시한다. 조건부 디코더(1000)는 도 1b에 도시된 조건부 오토디코더(160)와 유사할 수 있다. 디코더(1000)는 출력(826)을 수신하여, 제1 192x5x5/2 조건부 컨볼루션 레이어(1002), 제1 누설 ReLU 활성화 함수(1004), 제2 192x5x5/2 조건부 컨볼루션 레이어(1006), 제2 누설 ReLU 활성화 함수(1008), 192x3x3/1 조건부 컨볼루션 레이어(1010) 및 제3 누설 ReLU 활성화 함수(1012)를 통해 출력(1014)을 생성한다.

도 11은 본 개시에 따른 조건부 디코더(1100)를 도시한다. 조건부 디코더(1100)는 도 1a에 도시된 조건부 디코더(104) 및 도 1b에 도시된 조건부 디코더(162)와 유사할 수 있다. 디코더는 출력(1014) 및 출력(940)을 수신하고, Concat 함수(1102)에서 처리한다. 시스템은 Concat 함수(1102)의 출력을, 제1 192x5x5/2 조건부 컨볼루션 레이어(1104), 제1 IGDN(Inverse Generalized Divisive Normalization) 레이어(1106), 제2 192x5x5/2 조건부 컨볼루션 레이어(1108), 제2 IGDN 레이어(1110), 제3 192x5x5/2 조건부 컨볼루션 레이어(1112), 제3 IGDN 레이어(1114) 및 3x5x5/2 조건부 컨볼루션 레이어(1116)를 통해 처리하고, 재구성된 입력(1118)을 생성한다.

도 12는 본 개시에 따른 네트워크 환경(1200)에서 전자 장치(1201)를 도시한다. 도 12를 참조하면, 네트워크 환경(1200) 내의 전자 장치(1201)는 제1 네트워크(1298)(예를 들어, 단거리 무선 통신 네트워크)를 통해 전자 장치(1202)와 통신하거나, 제2 네트워크(1299)(예를 들어, 장거리 무선 통신 네트워크)를 통해 전자 장치(1204) 또는 서버(1208)와 통신할 수 있다. 전자 장치(1201)는 서버(1208)를 통해 전자 장치(1204)와 통신할 수도 있다. 전자 장치(1201)는 프로세서(1220), 메모리(1230), 입력 장치(1250), 음향 출력 장치(1255), 디스플레이 장치(1260), 오디오 모듈(1270), 센서 모듈(1276), 인터페이스(1277), 햅틱 모듈(1279), 카메라 모듈(1280), 전력 관리 모듈(1288), 배터리(1289), 통신 모듈(1290), 가입자 식별 모듈(Subscriber Identification Module, SIM)(1296) 또는 안테나 모듈(1297)을 포함할 수 있다. 일 실시예에서, 구성요소들 중 적어도 하나(예를 들어, 디스플레이 장치(1260) 또는 카메라 모듈(1280))는 전자 장치(1201)에서 생략될 수 있고, 하나 이상의 다른 구성요소가 전자 장치(1201)에 추가될 수도 있다. 일 실시예에서, 구성요소들 중 일부는 단일 집적회로(IC)로 구현될 수 있다. 예를 들어, 센서 모듈(1276)(예를 들어, 지문센서, 홍채센서 또는 조도센서)이 디스플레이 장치(1260)(예를 들어, 디스플레이)에 내장될 수 있다.

프로세서(1220)는 프로세서(1220)와 연결된 전자 장치(1201)의 적어도 하나의 다른 구성요소(예를 들어, 하드웨어 또는 소프트웨어)를 제어하기 위한 소프트웨어(예를 들어, 프로그램(1240))를 실행할 수 있고, 다양한 데이터를 처리 또는 계산할 수 있다. 프로세서(1220)는 데이터 처리 또는 계산의 일부로서, 다른 구성요소(예를 들어, 센서 모듈(1276) 또는 통신 모듈(1290))로부터 수신된 명령 또는 데이터를 휘발성 메모리(1232)에 로드하고, 휘발성 메모리(1232)에 저장된 명령 또는 데이터를 처리하고, 그 결과 데이터를 비휘발성 메모리(1234)에 저장할 수 있다. 프로세서(1220)는 메인 프로세서(1221)(예를 들어, 중앙처리장치(CPU) 또는 애플리케이션 프로세서(AP)) 및 메인 프로세서(1221)와 독립적으로 동작하거나 함께 동작할 수 있는 보조 프로세서(1223)(예를 들어, 그래픽 처리장치(GPU), 이미지 신호 프로세서(ISP), 센서 허브 프로세서, 통신 프로세서(CP))를 포함할 수 있다. 부가적으로 또는 대안적으로, 보조 프로세서(1223)는 메인 프로세서(1221)보다 적은 전력을 소비하거나, 특정 기능을 실행하도록 구성될 수 있다. 보조 프로세서(1223)는 메인 프로세서(1221)와 별개로 또는 메인 프로세서(1221)의 일부로 구현될 수 있다.

보조 프로세서(1223)는, 메인 프로세서(1221)가 비활성 상태(예를 들어, 슬립)에 있는 동안에는 메인 프로세서(1221)를 대신하여, 메인 프로세서(1221)가 활성 상태(예를 들어, 애플리케이션을 실행하는 동안)에 있는 동안에는 메인 프로세서(1221)와 함께, 전자 장치(1201)의 구성요소 중 적어도 하나(예를 들어, 디스플레이 장치(1260), 센서 모듈(1276) 또는 통신 모듈(1290))와 관련된 기능 또는 상태를 제어할 수 있다. 일 실시예에서, 보조 프로세서(1223)(예를 들어, 이미지 신호 프로세서 또는 통신 프로세서)는 기능적으로 관련된 다른 구성요소(예를 들어, 카메라 모듈(1280) 또는 통신 모듈(1290))의 일부로 구현될 수 있다.

메모리(1230)는 전자 장치(1201)의 적어도 하나의 구성요소(예를 들어, 프로세서(1220) 또는 센서 모듈(1276))가 사용하는 다양한 데이터를 저장할 수 있다. 다양한 데이터는, 예를 들어, 소프트웨어(예를 들어, 프로그램(1240)) 및 관련 명령에 대한 입력데이터 또는 출력데이터를 포함할 수 있다. 메모리(1230)는 휘발성 메모리(1232) 또는 비휘발성 메모리(1234)를 포함할 수 있다.

프로그램(1240)은 소프트웨어로서 메모리(1230)에 저장될 수 있으며, 운영체제(OS)(1242), 미들웨어(1244) 또는 애플리케이션(1246)을 포함할 수 있다.

입력 장치(1250)는 전자 장치(1201)의 외부(예를 들어, 사용자)로부터 전자 장치(1201)의 다른 구성요소(예를 들어, 프로세서(1220))가 사용할 명령 또는 데이터를 수신할 수 있다. 입력장치(1250)는, 마이크, 마우스 또는 키보드를 포함할 수 있다.

음향 출력 장치(1255)는 음향 신호를 전자 장치(1201) 외부로 출력할 수 있다. 음향 출력 장치(1255)는 예를 들어, 스피커 또는 수신기를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 기록과 같은 일반적인 목적으로 사용될 수 있고, 수신기는 수신 전화를 수신하기 위해 사용될 수 있다. 일 실시예에서, 수신기는 스피커와 분리되거나 스피커의 일부로 구현될 수 있다.

디스플레이 장치(1260)는 전자 장치(1201)의 외부(예를 들어, 사용자)에게 정보를 시각적으로 제공할 수 있다. 디스플레이 장치(1260)는, 예를 들어, 디스플레이, 홀로그램 장치, 또는 프로젝터와, 대응하는 디스플레이, 홀로그램 장치 또는 프로젝터를 제어하기 위한 제어회로를 포함할 수 있다. 일 실시예에서, 디스플레이 장치(1260)는 터치를 검출하도록 구성된 터치회로, 또는 터치에 의해 발생된 힘의 세기를 측정하도록 구성된 센서회로(예를 들어, 압력 센서)를 포함할 수 있다.

오디오 모듈(1270)은 사운드를 전기 신호로 또는 그 반대로 변환할 수 있다. 일 실시예에서, 오디오 모듈(1270)은 입력 장치(1250)를 통해 사운드를 획득하거나, 음향 출력 장치(1255) 또는 전자 장치(1201)와 유선 또는 무선 결합된 외부 전자 장치(1202)의 헤드폰을 통해 사운드를 출력할 수 있다.

센서 모듈(1276)은 전자 장치(1201)의 동작 상태(예를 들어, 전력 또는 온도) 또는 전자 장치(1201) 외부의 환경 상태(예를 들어, 사용자 상태)를 감지하여 전기적 신호 또는 데이터 값을 생성할 수 있다. 센서 모듈(1276)은, 예를 들어, 제스처 센서, 자이로 센서, 대기압 센서, 자기 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, 적외선(IR) 센서, 생체 인식 센서, 온도 센서, 습도 센서 또는 조도 센서를 포함할 수 있다.

인터페이스(1277)는 전자 장치(1201)가 외부 전자 장치(1202)와 직접(유선) 또는 무선으로 연결되는데 사용될 하나 이상의 특정 프로토콜을 지원할 수 있다. 일 실시예에서, 인터페이스(1277)는 HDMI(High Definition Multimedia Interface), USB(Universal Serial Bus) 인터페이스, SD(Secure Digital)카드 인터페이스 또는 오디오 인터페이스를 포함할 수 있다.

연결 단자(1278)는 전자 장치(1201)가 외부 전자 장치(1202)와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일 실시예에서, 연결 단자(1278)는 HDMI 커넥터, USB 커넥터, SD카드 커넥터 또는 오디오 커넥터(예를 들어, 헤드폰 커넥터)를 포함할 수 있다.

햅틱 모듈(1279)은 전기적 신호를, 촉각 또는 운동 감각을 통해 사용자에게 인식될 수 있는 기계적 자극(예를 들어, 진동 또는 움직임) 또는 전기적 자극으로 변환할 수 있다. 일 실시예에서, 햅틱 모듈(1279)은 모터, 압전 소자 또는 전기 자극기를 포함할 수 있다.

카메라 모듈(1280)은 정지 이미지 또는 동영상을 캡처할 수 있다. 일 실시예에서, 카메라 모듈(1280)은 하나 이상의 렌즈, 이미지 센서, 이미지 신호 프로세서 또는 플래시를 포함할 수 있다.

전력 관리 모듈(1288)은 전자 장치(1201)에 공급되는 전원을 관리할 수 있다. 전력 관리 모듈(1288)은 전력 관리 집적회로(PMIC)의 일부로서 구현될 수 있다.

배터리(1289)는 전자 장치(1201)의 적어도 하나의 구성요소에 전원을 공급할 수 있다. 일 실시예에서, 배터리(1289)는 재충전이 불가능한 1차 전지, 재충전이 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.

통신 모듈(1290)은 전자 장치(1201)와 외부 전자 장치(예를 들어, 전자 장치(1202), 전자 장치(1204) 또는 서버(1208)) 사이의 직접(유선) 통신 채널 또는 무선 통신 채널 설정을 지원할 수 있고, 설정된 통신 채널을 통해 통신을 수행할 수 있다. 통신 모듈(1290)은 프로세서(1220)(예를 들어, AP)와 독립적으로 동작하고 직접(유선) 통신 또는 무선 통신을 지원하는 하나 이상의 통신 프로세서를 포함할 수 있다. 일 실시예에서, 통신 모듈(1290)은 무선 통신 모듈(1292)(예를 들어, 셀룰러 통신 모듈, 근거리 무선 통신 모듈 또는 GNSS(Global Navigation Satellite System) 통신 모듈) 또는 유선 통신 모듈(1294)(예를 들어, 근거리 통신망(LAN) 통신 모듈 또는 전력선 통신(PLC) 모듈)을 포함할 수 있다. 이들 통신 모듈은 제1 네트워크(1298)(예를 들어, 블루투스, Wi-Fi 다이렉트 또는 IrDA(Infrared Data Association)와 같은 단거리 통신 네트워크) 또는 제2 네트워크(1299)(예를 들어, 셀룰러 네트워크, 인터넷 또는 컴퓨터 네트워크(LAN, WAN)와 같은 장거리 통신 네트워크)를 통해 외부 전자 장치와 통신할 수 있다. 이러한 다양한 유형의 통신 모듈은 단일 구성요소(예를 들어, 단일 IC)로 구현되거나 서로 분리된 복수의 구성요소(예를 들어, 다중 IC)로 구현될 수 있다. 무선 통신 모듈(1292)은 가입자 식별 모듈(1296)에 저장된 가입자 정보(예를 들어, IMSI(International Mobile Subscriber Identity))를 이용하여 제1 네트워크(1298) 또는 제2 네트워크(1299)와 같은 통신 네트워크에서 전자 장치(1201)를 식별하고 인증할 수 있다.

안테나 모듈(1297)은 전자 장치(1201)의 외부(예를 들어, 외부 전자 장치)와 신호 또는 전력을 송수신할 수 있다. 일 실시예에서, 안테나 모듈(1297)은 하나 이상의 안테나를 포함할 수 있고, 그로부터 제1 네트워크(1298) 또는 제2 네트워크(1299)와 같은 통신 네트워크에 사용되는 통신 방식에 적합한 적어도 하나의 안테나가 선택될 수 있다. 그 후, 신호 또는 전력은 선택된 적어도 하나의 안테나를 통해 통신 모듈(1290)과 외부 전자 장치 사이에서 전송 또는 수신될 수 있다.

전술한 구성요소들 중 적어도 일부는 서로 결합되어 주변 장치 사이의 통신 방식(예를 들어, 버스, GPIO(General Purpose Input and Output), SPI(Serial Peripheral Interface), MIPI(Mobile Industry Processor Interface))을 통해 신호(예를 들어, 명령 또는 데이터)를 전달할 수 있다.

일 실시예에서, 명령 또는 데이터는 제2 네트워크(1299)와 연결된 서버(1208)를 통해 전자 장치(1201)와 외부 전자 장치(1204) 사이에서 전송 또는 수신될 수 있다. 전자 장치들(1202, 1204) 각각은 전자 장치(1201)와 동일한 유형 또는 상이한 유형의 장치일 수 있다. 전자 장치(1201)에서 실행될 동작의 전부 또는 일부는 외부 전자 장치(1202, 1204 또는 1208) 중 하나 이상에서 실행될 수 있다. 예를 들어, 전자 장치(1201)가 기능 또는 서비스를 자동으로 수행해야 하거나 사용자 또는 다른 장치의 요청에 응답하여 기능 또는 서비스를 수행해야 하는 경우, 전자 장치(1201)가 직접 수행하는 것에 대신하거나 부가하여, 하나 이상의 외부 전자 장치에게 기능 또는 서비스의 일부를 수행하도록 요청할 수 있다. 요청을 수신한 하나 이상의 외부 전자 장치는 요청된 기능 또는 서비스의 적어도 일부 또는 요청과 관련된 추가 기능 또는 추가 서비스를 수행하고, 수행 결과를 전자 장치(1201)로 전달할 수 있다. 전자 장치(1201)는 요청에 대한 응답의 적어도 일부로서 결과를 추가 처리와 함께 또는 추가 처리 없이 제공할 수 있다. 이를 위해, 예를 들어, 클라우드 컴퓨팅, 분산 컴퓨팅 또는 클라이언트-서버 컴퓨팅 기술이 사용될 수 있다.

일 실시예는 기계(예를 들어, 전자 장치(1201))에 의해 판독 가능한 저장매체(예를 들어, 내장 메모리(1236) 또는 외장 메모리(1238))에 저장된 하나 이상의 명령어를 포함하는 소프트웨어(예를 들어, 프로그램(1240))로서 구현될 수 있다. 예를 들어, 전자 장치(1201)의 프로세서는, 저장매체에 저장된 하나 이상의 명령어 중 적어도 하나를 호출하고, 프로세서의 제어 하에 하나 이상의 다른 구성요소를 사용하거나 다른 구성요소를 사용하지 않고 명령어를 실행할 수 있다. 따라서, 호출된 적어도 하나의 명령에 따라 적어도 하나의 기능을 수행하도록 기계가 작동될 수 있다. 하나 이상의 명령어는 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행 가능한 코드를 포함할 수 있다. 기계 판독 가능한 저장매체는 비일시적 저장매체의 형태로 제공될 수 있다. "비일시적"이라는 용어는 저장매체가 유형의 장치이고 신호(예를 들어, 전자기파)를 포함하지 않는다는 것을 암시하지만, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 것과 데이터가 저장매체에 일시적으로 저장되는 것을 구별하는 것은 아니다.

일 실시예에서, 본 개시의 방법은 컴퓨터 프로그램 제품에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 판매자와 구매자 사이의 제품으로 거래될 수 있다. 컴퓨터 프로그램 제품은 기계 판독 가능한 저장 매체(예를 들어, CD-ROM(Compact Disc Read Only Memory))의 형태로 배포되거나, 애플리케이션 스토어(예를 들어, Play Store^TM)를 통해 온라인으로 배포(예를 들어, 다운로드 또는 업로드)되거나, 두 사용자 기기(예를 들어, 스마트폰) 사이에서 직접 배포될 수 있다. 온라인으로 배포되는 경우, 컴퓨터 프로그램 제품의 적어도 일부는 제조자 서버의 메모리, 애플리케이션 스토어의 서버, 또는 중계 서버와 같은 기계 판독 가능한 저장 매체에 일시적으로 생성되거나 저장될 수 있다.

일 실시예에서, 전술한 구성요소들의 각 구성요소(예를 들어, 모듈 또는 프로그램)는 단일한 본체 또는 다중 본체를 포함할 수 있다. 전술한 구성요소들 중 하나 이상이 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 대안적으로 또는 추가적으로, 복수의 구성요소(예를 들어, 모듈 또는 프로그램)들이 단일한 구성요소에 통합될 수 있다. 이 경우, 통합 구성요소는 통합 이전의 복수의 구성요소 중 대응하는 하나의 구성요소에 의해 수행되는 것과 동일하거나 유사한 방식으로 복수의 구성요소 각각의 기능을 여전히 수행할 수 있다. 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작은 순차적으로, 병렬로, 반복적으로 또는 경험적으로 수행될 수 있고, 하나 이상의 동작이 서로 다른 순서로 실행되거나 생략될 수 있으며, 하나 이상의 다른 동작이 추가될 수도 있다.

이상, 본 개시의 상세한 설명에서 본 개시의 특정 실시예들이 설명되었지만, 본 개시는 본 개시의 범위를 벗어나지 않으면서, 다양한 형태로 변형될 수 있다. 따라서, 본 개시의 범위는 단지 설명된 실시예들에 기초하여 결정되어서는 안되며, 오히려 첨부된 청구 범위 및 그 균등물들에 기초하여 결정된다.

100, 150: 가변-레이트 이미지 압축 모델
102: 조건부 오토인코더
104: 조건부 디코더
106: 조건부 엔트로피 모델
108: 라그랑주 승수
110: 양자화 빈 사이즈
111: 범용 양자화
112: 엔트로피 인코딩
114: 엔트로피 디코딩
152: 제1 조건부 오토인코더
154: 제2 조건부 오토인코더
156: 제1 조건부 엔트로피 모델
158: 제2 조건부 엔트로피 모델
160: 제1 조건부 오토디코더
162: 제2 조건부 오토디코더
164: 제1 범용 양자화 함수
166: 제2 범용 양자화 함수
168: 제1 산술 인코딩/디코딩 함수
170: 제2 산술 인코딩/디코딩 함수
172: 하이퍼 파라미터
300: 조건부 오토인코더
302: 입력
304: 컨볼루션 레이어
306: 라그랑주 승수
308: 원-핫 인코딩 레이어
310: 제1 완전-연결 레이어
312: 제2 완전-연결 레이어
314: 소프트플러스 함수 블록
320: 출력
400: 인코더
402: 디코더
500: RFIC ADC 출력 압축 시스템
502: RFIC
504: 가변-레이트 압축 네트워크
506: 기저 대역 모뎀
508: 룩업 테이블
510: 변조 코딩 방식
600: 제1 조건부 인코더
700: 제2 조건부 인코더
800, 900: 조건부 엔트로피 모델
1000, 1100: 조건부 디코더
1200: 네트워크 환경
1298: 제1 네트워크

Claims

라그랑주 승수를 사용하여 조건부 오토인코더를 학습시키고,
혼합 양자화 빈 사이즈들을 이용하여 상기 조건부 오토인코더를 포함하는 신경망을 학습시키는, 압축 방법.
제1항에 있어서,
상기 라그랑주 승수의 값은 미리 결정된 값 세트로부터 선택되는, 압축 방법.
제1항에 있어서,
상기 신경망은 라그랑주 승수의 컨디셔닝 값에 따라 다양한 압축률 및 왜곡으로 압축 된 압축물을 생성하는, 압축 방법.
제1항에 있어서,
상기 조건부 오토인코더는 조건부 컨볼루션을 사용하여 학습되는, 압축 방법.
제1항에 있어서,
상기 혼합 양자화 빈 사이즈로 상기 신경망을 학습시키는 것은 양자화 빈 사이즈를 조정하는 것을 더 포함하는, 압축 방법.
제1항에 있어서,
상기 혼합 양자화 빈 사이즈로 상기 신경망을 학습시키는 것은 임의의 양자화 빈 사이즈에 대한 다양한 노이즈 레벨에 대해 균일한 노이즈를 인출하는 것을 더 포함하는, 압축 방법.
제1항에 있어서,
상기 신경망은 BPG(Better Portable Graphics) 압축을 수행하도록 구성된, 압축 방법.
제1항에 있어서,
상기 신경망은 RFIC(Radio Frequency Integrated Circuit)의 아날로그-디지털 변환기 출력의 압축을 수행하도록 구성된, 압축 방법.
제8항에 있어서,
MCS(변조 코딩 방식)의 함수로서 라그랑주 승수 및 양자화 빈 사이즈를 더 선택하는, 압축 방법.
제9항에 있어서,
상기 신경망은 상기 MCS를 상기 라그랑주 승수 및 상기 양자화 빈 사이즈에 매핑하는 룩업 테이블을 더 포함하는, 압축 방법.
조건부 오토인코더를 포함하는 신경망; 및
프로세서를 포함하고,
상기 프로세서는,
라그랑주 승수를 사용하여 상기 조건부 오토인코더를 학습시키고,
혼합 양자화 빈 사이즈들을 이용하여 상기 신경망을 학습시키는, 압축 시스템.
제11항에 있어서,
상기 라그랑주 승수의 값은 미리 결정된 값 세트로부터 선택되는, 압축 시스템.
제11항에 있어서,
상기 신경망은 라그랑주 승수의 컨디셔닝 값에 따라 다양한 압축률 및 왜곡으로 압축 된 압축물을 생성하는, 압축 시스템.
제11항에 있어서,
상기 프로세서는 조건부 컨볼루션을 사용하여 상기 조건부 오토인코더를 학습시키도록 구성된, 압축 시스템.
제11항에 있어서,
상기 프로세서는 양자화 빈 사이즈를 조정함으로써 상기 혼합 양자화 빈 사이즈로 상기 신경망을 학습시키도록 추가로 구성된, 압축 시스템.
제11항에 있어서,
상기 프로세서는 임의의 양자화 빈 사이즈에 대한 다양한 노이즈 레벨에 대해 균일한 노이즈를 인출함으로써 상기 혼합 양자화 빈 사이즈로 상기 신경망을 학습시키도록 추가로 구성된, 압축 시스템.
제11항에 있어서,
상기 신경망은 BPG(Better Portable Graphics) 압축을 수행하도록 구성된, 압축 시스템.
제11항에 있어서,
상기 신경망은 RFIC(Radio Frequency Integrated Circuit)의 아날로그-디지털 변환기 출력의 압축을 수행하도록 구성된, 압축 시스템.
제18항에 있어서,
상기 프로세서는 MCS(변조 코딩 방식)의 함수로서 라그랑주 승수 및 양자화 빈 사이즈를 선택하도록 추가로 구성된, 압축 시스템.
제19항에 있어서,
상기 신경망은 상기 MCS를 상기 라그랑주 승수 및 상기 양자화 빈 사이즈에 매핑하는 룩업 테이블을 더 포함하는, 압축 시스템.