KR102618558B1 - 조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법 - Google Patents

조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법 Download PDF

Info

Publication number
KR102618558B1
KR102618558B1 KR1020200000794A KR20200000794A KR102618558B1 KR 102618558 B1 KR102618558 B1 KR 102618558B1 KR 1020200000794 A KR1020200000794 A KR 1020200000794A KR 20200000794 A KR20200000794 A KR 20200000794A KR 102618558 B1 KR102618558 B1 KR 102618558B1
Authority
KR
South Korea
Prior art keywords
conditional
compression
neural network
clause
quantization bin
Prior art date
Application number
KR1020200000794A
Other languages
English (en)
Other versions
KR20200111093A (ko
Inventor
최유진
이정원
모스타파 엘 카미
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of KR20200111093A publication Critical patent/KR20200111093A/ko
Application granted granted Critical
Publication of KR102618558B1 publication Critical patent/KR102618558B1/ko

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6011Encoder aspects
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3059Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0015Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy
    • H04L1/0016Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the adaptation strategy involving special memory structures, e.g. look-up tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0002Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the transmission rate
    • H04L1/0003Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the transmission rate by switching between different modulation schemes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0009Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the channel coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법이 제공된다. 일 실시예에서, 압축 방법은 라그랑주 승수를 사용하여 조건부 오토인코더를 학습시키고, 혼합 양자화 빈 사이즈들을 이용하여 조건부 오토인코더를 포함하는 신경망을 학습시킬 수 있다.

Description

조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법{METHOD AND APPARATUS FOR VARIABLE RATE COMPRESSION WITH A CONDITIONAL AUTOENCODER}
본 개시는 데이터 압축에 관한 것이다. 보다 구체적으로, 본 개시는 조건부 오토인코더를 이용한 데이터 압축 방법 및 장치에 관한 것이다.
가변-레이트 압축은 신경망을 이용할 수 있으며, 이미지 압축 및 RFIC(Radio Frequency Integrated Circuit) 출력 압축을 포함하지만 이에 제한되지 않는 다양한 분야에 적용될 수 있다.
이미지 압축은 데이터 압축의 응용으로서, 디지털 이미지의 저장 및/또는 전송 요구 사항을 낮출 수 있다. JPEG(Joint Photographic Experts Group) 및 JPEG2000과 같은 이미지 압축 알고리즘을 생성하는 데 변환 코딩이 사용될 수 있다. 이러한 변환 코딩은 손실 압축(일반적으로 양자화 및 무손실 소스 코딩의 조합)이 더 적절하고 더 효율적인 변환 도메인에서, 입력을 잠재 표현으로 변환한다. 예를 들어, JPEG는 이산 코사인 변환(Discrete cosine transform, DCT)을 사용하여 이미지를 희소 주파수 도메인 표현으로 변환한다. JPEG2000은 DCT를 향상된 이산 웨이블릿 변환으로 대체한다.
딥 러닝은 다양한 컴퓨터 비전 작업에서 향상된 성능을 제공 할 수 있다. 이러한 딥 러닝의 혁신적인 발전과 함께 학습 기반 이미지 압축도 관심을 끌었다. 특히, 딥 뉴럴 네트워크로 설계된 비선형 변환 코딩은 도메인 전문가가 정교하게 설계하고 최적화한 전통적인 이미지 압축 코덱, 예를 들어, HEVC(High Efficiency Video Codec) 표준의 정지 화상 버전인 BPG(Better Portable Graphics)보다 성능이 뛰어나다. 일반적인 학습 기반 이미지 압축 방식은 MSE(Mean Squared Error)를 기반으로 하는 메트릭인 PSNR(Peak Signal-to-Noise Ratio)에 대한 BPG 코덱을 제공한다.
일반적인 오토인코더 기반 이미지 압축 프레임 워크는 라그랑주(Lagrange) 승수 방법을 사용하여 RD(Rate-Distortion) 쌍의 가중치 조합을 최적화한다. 압축 이미지의 품질(또는 레이트)을 조정하기 위해 다양한 모델이 라그랑주 승수의 서로 다른 값에 대해 별도로 학습된다. 즉, 일반적인 시스템은 레이트 적응을 위해 여러 모델을 학습 및 전개하거나, 라그랑주 승수를 변경하는 과정 중에 임의 모델 하나를 유지한다. 이는 광범위한 RD 곡선을 정밀한 해상도로 커버하려고 하고, 각각의 네트워크의 크기가 큰 경우 비실용적일 수 있다.
본 개시는 조건부 오토인코더를 이용해 데이터를 압축하기 위한 시스템 및 방법을 제공한다.
본 개시의 일 실시예의 압축 방법은, 라그랑주 승수를 사용하여 조건부 오토인코더를 학습시키고, 혼합 양자화 빈 사이즈들을 이용하여 조건부 오토인코더를 포함하는 신경망을 학습시킬 수 있다.
본 개시의 일 실시예의 압축 시스템은, 조건부 오토인코더를 포함하는 신경망, 및 프로세서를 포함할 수 있다. 프로세서는 라그랑주 승수를 사용하여 조건부 오토인코더를 학습시키고, 혼합 양자화 빈 사이즈들을 이용하여 신경망을 학습시킬 수 있다.
본 개시에 따른 시스템 및 방법을 통해, 데이터를 압축할 수 있다.
본 개시의 양상들은 도면에 도시된 예시적인 실시예들을 참조하여 설명될 것이다.
도 1a는 본 개시에 따른 가변-레이트 이미지 압축 모델을 도시한다.
도 1b는 본 개시에 따른 가변-레이트 이미지 압축 모델을 도시한다.
도 2는 본 개시에 따른 압축 방법의 흐름도를 도시한다.
도 3은 본 개시에 따른 조건부 오토인코더를 도시한다.
도 4는 본 개시에 따른 개선된 가변-레이트 압축 모델을 도시한다.
도 5는 본 개시에 따른 RFIC 아날로그-디지털 변환기 출력 압축 시스템을 도시한다.
도 6은 본 개시에 따른 조건부 인코더를 도시한다.
도 7은 본 개시에 따른 조건부 인코더를 도시한다.
도 8은 본 개시에 따른 조건부 엔트로피 모델을 도시한다.
도 9는 본 개시에 따른 조건부 엔트로피 모델을 도시한다.
도 10은 본 개시에 따른 조건부 디코더를 도시한다.
도 11은 본 개시에 따른 조건부 디코더를 도시한다
도 12는 본 개시에 따른 네트워크 환경에서 전자 장치를 도시한다.
가변-레이트 압축은 신경망 기능을 이용할 수 있으며, 이미지 압축 및 RFIC(Radio Frequency Integrated Circuit) 출력 압축을 포함하지만 이에 제한되지 않는 다양한 분야에 적용될 수 있다.
일 실시 예에서, 본 시스템 및 방법은 레이트 적응을 수행하는 단일 가변-레이트 이미지 압축 네트워크를 제공한다. 특히, 네트워크는 라그랑 주 승수로 조절된 조건부 오토인코더를 포함할 수 있다(즉, 네트워크는 라그랑주 승수를 입력으로 하여 입력 값에 의존하는 압축률(예를 들어, 이미지 압축에서 BPP(Bits Per Pixel))을 가지는 잠재 표현을 생성할 수 있다). 또한, 네트워크는 잠재 표현의 양자화에 적용된 빈 사이즈를 조정함으로써 압축률의 적응을 허용하는 혼합 양자화 빈 사이즈로 학습될 수 있다. 조건부 모델에서 라그랑주 승수를 변경함으로써 목표에 대한 대략적인 압축률 적응을 달성하고, 양자화 빈 사이즈를 조정함으로써 세부적인 압축률 적응을 수행할 수 있다.
도 1a는 본 개시에 따른 가변-레이트 이미지 압축 모델(100)을 도시한다. 가변-레이트 이미지 압축 모델(100)은 조건부 오토인코더(102), 조건부 디코더(104) 및 조건부 엔트로피 모델(106)을 포함할 수 있다. 조건부 오토인코더(102)는, 압축률을 적응시키고 하나의 조건부 모델에서 다양한 λ 값에 대해 레이트-왜곡 라그랑지안(Lagrangian)을 최적화하는 라그랑주 승수 λ(108)에서 조절될 수 있다. 모델(100)은 양자화 빈 사이즈 Δ(110)의 혼합된 값들에 대해 범용 양자화(111)로 학습되어 있어, 압축률은 Δ(110)를 변경함으로써 달라질 수 있다. 라그랑주 승수(108)는 조건부 엔트로피 모델(106) 및 조건부 디코더(104) 모두에 이용될 수 있다. 모델(100)은 엔트로피 인코딩(112) 및 엔트로피 디코딩(114)을 이용할 수 있다.
현재 조건부 오토인코더(102)는 최적화 문제의 하이퍼 파라미터(즉, 라그랑주 승수 λ(108))를 컨디셔닝 변수로서 수신할 수 있다. 본 시스템 및 방법은 별도의 비-조건부 네트워크들을 사용하여 개별적으로 목표를 해결하는 대신, 하나의 조건부 네트워크를 사용하여 여러 목표를 해결한다. 모델(100)은 다중 반복을 필요로 하지 않는 조건부 오토인코더에 기초한 반면, 품질은 컨디셔닝 변수 λ(108) 및 Δ(110)에 의해 제어될 수 있다.
도 1b는 본 개시에 따른 가변-레이트 이미지 압축 모델(150)을 도시한다. 가변-레이트 이미지 압축 모델(150)은 제1 조건부 오토인코더(152), 제2 조건부 오토인코더(154), 제1 조건부 엔트로피 모델(156), 제2 조건부 엔트로피 모델(158), 제1 조건부 오토디코더(160) 및 제2 조건부 오토디코더(162)를 포함할 수 있다. 가변-레이트 이미지 압축 모델(150)은 또한 제1 범용 양자화 함수(164) 및 제2 범용 양자화 함수(166)뿐만 아니라, 제1 산술 인코딩(Arithmetic Encoding, AE)/디코딩(Arithmetic Decoding, AD) 함수(168) 및 제2 AE/AD 함수(170)를 더 포함할 수 있다. 하이퍼 파라미터(172)는 후술하는 바와 같이 범용 양자화 함수(164, 166)에서 이용될 수 있다.
인코더 및 디코더 를 포함하는 오토인코더 아키텍처에서, x는 입력 범위이며 는 양자화 빈 사이즈 Δ를 갖는 입력 x로부터 인코딩된 양자화된 잠재 표현이고, 이다. 아래 방정식에서, Δ는 1로 고정된다. 무손실 엔트로피 소스 코딩은 양자화된 표현 z로부터 압축된 비트스트림(bitstream)을 생성하는데 사용된다. 양자화된 잠재 변수 z에 대한 엔트로피 소스 코딩을 취하고 그 엔트로피 레이트를 알면, 압축률 R 및 L2 왜곡 D(즉, MSE 손실)는 다음의 수학식 1과 수학식 2에 의해 주어질 수 있다.
수학식 2는 다음과 같다.
p(x)는 모든 자연 이미지의 확률 밀도 함수이고, 는 인코더 로부터 유도된 z의 확률 질량 함수이며, 수학식 2를 만족하고,
Figure 112020000637710-pat00010
는 디락(Dirac) 델타 함수를 나타낸다. 라그랑주 승수 방법을 사용한 RD 최적화 문제는 수학식 3으로 표현될 수 있다.
λ는 λ>0인 고정 라그랑주 승수이다. 수학식 1에 제공된 압축률 및 왜곡은, 로 인해, 네트워크 파라미터
Figure 112020000637710-pat00014
에 의해 구별 될 수 없으므로, 수학식 3을 최적화하는 것은 간단하지 않다.
일 실시 예에서, 본 시스템은 범용 양자화를 사용할 수 있다. 범용 양자화는 수학식 4에서와 같이 하나의 공통된 균일 랜덤 변수를 사용하여 잠재 표현 의 모든 요소를 디더링한다.
여기서, 디더링 벡터 u는 의 서포트를 받아 단일 균일 랜덤 변수 U의 반복을 포함한다. 범용 양자화는 네트워크 트레이닝의 역전파에서 단위 기울기의 선형 함수로 근사화된다. 범용 양자화에 의해 유발된 노이즈는 차원에 따라 좌우되지만, 범용 양자화는 각 차원에서, 균일한 노이즈를 추가하는 경우에도 실질적으로 동일한 분포를 가진다.
수학식 1과 유사하게, 범용 양자화 하에서, 압축률과 왜곡은 수학식 5와 같이 표현 될 수 있다.
여기서, 이다. 압축률은 이제 미분 엔트로피로서, 미분 가능하지만 여전히 를 계산하기 어렵다. 따라서, 보다 다루기 쉬운 밀도 함수 가 도입되었고 수학식 6은 다음과 같이 유도된다.
여기서, KL은 Kullback-Leibler 분기를 나타낸다. 등호는 일 때 성립한다. 를 그 상한 로 근사함으로써, 수학식 3의 RD 최적화는 수학식 7로 환산된다.
여기서, 고정값 λ는 λ>0이다. 서로 다른 λ 값의 네트워크를 최적화하면, 품질을 압축률과 트레이드오프 할 수 있다. 더 작은 라그랑주 승수 λ를 사용하면, 학습된 네트워크가 더 높은 레이트를 사용하면서 더 높은 품질의 이미지를 생성할 수 있다.
압축된 이미지의 품질 및 압축률을 조정하기 위해, 시스템은 라그랑 주 승수의 다양한 값 λ에 대해 수학식 7의 RD 라그랑주 함수를 최적화할 필요가 있다. 본 개시에서는, 한번 전개되면 재교육의 필요 없이, 사용자의 요구 사항에 따라 다양한 레이트로 다양한 품질의 압축 이미지를 생성하는 데 사용할 수 있는 가변-레이트 모델이 개시된다.
도 2는 본 개시에 따른 압축 방법의 흐름도(200)를 도시한다. 202에서, 시스템은 조건부 오토인코더를 학습시킨다. 시스템은 라그랑주 승수 λ로 조절된 조건부 오토인코더를 학습시킬 수 있다. 네트워크는 입력 이미지와 함께, λ를 컨디셔닝 입력 매개 변수로 수신하고, λ의 컨디셔닝 값에 따라 다양한 압축률과 왜곡으로 압축된 이미지를 생성한다. 따라서, 수학식 5 및 6에서의 압축률 및 왜곡 항은 수학식 8 및 9로 변경될 수 있다.
여기서, 일 때,
Figure 112020000637710-pat00030
는 라그랑주 승수 값들의 사전 정의된 유한 집합이다. 이때, 수학식 10의 목적 함수 조합이 최소화된다.
도 3은 본 개시에 따른 조건부 오토인코더(300)를 도시한다. 조건부 오토인코더를 구현하기 위해 라그랑주 승수에 따라 조절되는 조건부 컨볼루션이 개발된다. 시스템은 컨볼루션 레이어(304)을 통해 입력(302)을 전송하는 반면, 시스템은 원-핫 인코딩 레이어(308)을 통해 라그랑주 승수 λ(306)를 전송하고, 그 출력은 제1 완전-연결 레이어(310)에 대한 입력 및 제2 완전-연결 레이어(312)에 대한 입력으로 분할된다. 시스템은 제1 완전-연결 레이어(310)의 출력을 소프트플러스 함수 블록(314)으로 전송하고, 그 출력은 316에서 컨볼루션 레이어(304)의 출력과 곱해진다. 그 후, 시스템은 곱셈된 출력(318) 및 완전-연결 레이어(312)로부터의 출력을 가산기(319)로 축적하여 출력(320)을 생성한다. 컨볼루션은 라그랑주 승수 λ(306)로 조절되며, 입력되는 라그랑주 승수 λ(306)에 따라 다른 출력을 생성한다.
구체적으로, 도 3를 참조하면, 는 채널 i의 2-D 입력이고, 는 채널 j의 2-D 출력이며, 는 입력 채널 i 및 출력 채널 j를 위한 2-D 컨볼루션 커널(Kernel)이다. 조건부 컨볼루션은 수학식 11에 의해 주어진다.
여기서, *는 2-D 컨볼루션을 나타낸다. 채널별 스케일링 계수 및 가산 바이어스 항은 수학식 12의 λ에 의존한다.
여기서, 는 출력 채널 j에 대한 길이 의 완전-연결 레이어 가중치 벡터이며, T는 전치(Transpose)를 나타내고,
Figure 112020000637710-pat00041
상의 λ의 원-핫 인코딩이다.
도 2를 참조하면, 204에서, 시스템은 혼합 양자화 빈 사이즈로 네트워크를 학습시킨다. 전술한 조건부 오토인코더는, λ가 미리 결정된 유한 세트
Figure 112020000637710-pat00042
로부터 선택되기 때문에, RD 곡선에서 유한한 불연속 점만을 얻을 수 있다. 커버리지를 RD 곡선의 전체 연속 범위로 확장하기 위해서는, 네트워크의 다른 제어 양상, 즉, 양자화 빈 사이즈가 압축률을 제어하기 위해 포함되어야 한다. 수학식 1의 RD 공식에서, 양자화 빈 사이즈는 Δ=1로 고정된다(즉, 라운드(Round)는 양자화를 위해 사용된다). 실제로는, 빈 사이즈가 클수록 압축률이 낮아지는 것과 같이, 압축률을 조정하기 위해 빈 사이즈를 변경할 수 있다. 다만, 학습시와 추론시 일치하지 않는 빈 사이즈로 인해 성능이 자연스럽게 저하되므로, 시스템은 혼합된 빈 사이즈로 네트워크를 학습한다.
학습 중에 시스템은 다양한 노이즈 레벨(임의의 Δ에서)에 대해 균일한 노이즈를 추출할 수 있다. Δ의 범위 및 범위내의 혼합 분포는 설계상 선택사항이다. 일 예에서, 가 이용되었고, 여기서 b는 가 커버되도록 에서 균일하게 추출된다. b의 범위가 클수록, 성능은 저하될 수 있지만 네트워크를 최적화할 수 있는 RD 곡선의 범위는 더 넓어진다. 최적화는 수학식 13과 같다.
여기서, 는 미리 정의된 Δ의 혼합 밀도이고, 수학식 14에서도 마찬가지이다.
도 2를 참조하면, 206에서, 시스템은 추론을 수행한다. 압축률 적응과 관련하여, 라그랑주 승수 및/또는 양자화 빈 사이즈가 감소함에 따라 압축률은 증가한다. 사용자의 목표 압축률이 주어지면 시스템은 라그랑주 승수를 변경하여 대략적인 불연속 압축률 적응을 달성함과 동시에, 고정 라그랑주 승수의 양자화 빈 사이즈를 조정하여 세부적인 연속 압축률 적응을 수행할 수 있다.
압축과 관련하여, 시스템은 를 선택한 후 라그랑주 승수의 원-핫 인코딩을 수행하고, 그것을 모든 조건부 컨볼루션 레이어들에서 사용하여 입력의 잠재 표현을 인코딩한다. 시스템은 선택된 양자화 빈 사이즈로 인코딩된 표현에 대해 규칙적인 결정론적 양자화를 수행한다. 그 후, 시스템은 인코딩에 사용된 컨디셔닝 변수들의 값을 저장하면서, 엔트로피 인코딩을 사용하여 양자화된 잠재 표현을 압축된 비트스트림으로 인코딩한다.
압축 해제와 관련하여, 시스템은 압축된 비트스트림을 디코딩하고, 압축된 비트스트림으로부터 인코딩에 사용된 컨디셔닝 변수를 검색한다. 시스템은 디코더 정수 값에 양자화 빈 사이즈를 곱함으로써, 디코더 정수 값으로부터 양자화된 잠재 표현을 복원한다. 그 후, 시스템은 복원된 잠재 표현을 디코더에 공급하여 이미지를 재구성한다. 인코딩에 사용된 라그랑주 승수 값은 조건부 생성을 위해 모든 비컨볼루션 레이어에서 다시 사용된다.
도 4는 본 개시에 따른 개선된 가변-레이트 압축 모델을 도시한다. 도 4를 참조하면, 인코더(400) 및 디코더(402)가 도시되어있다. 시스템은 x(406) 및 z(408)에 의존하는 2차 잠재 변수 w(404)를 도입하여 확률 모델을 개선한다. 수학식 14에 주어진 레이트 및 왜곡 항들은 수학식 15에 의해 주어진다.
압축의 경우, 시스템은 x(406)로부터 z(408)를 인코딩하고, z(408), x(406)로부터 w(404)를 추가로 인코딩한다. 인코딩된 표현들 z(408), w(404)는 각각 에 기초하여 엔트로피 코딩된다. 압축 해제의 경우, 주어진 로, 시스템은 w(404)를 디코딩하고, 이는 를 계산하고 z(408)를 디코딩하는데 사용된다. 이 모델은 수학식 16과 같이 에 자기회귀모델을 도입함으로써 더욱 개선된다.
시스템은 인코딩된 표현의 무손실 소스 코딩 부분을 손실 압축으로 대체함으로써 레이트를 적응시킨다. BPG(Better Portable Graphics)를 포함하지만 이에 제한되지는 않는 임의의 유형의 손실 압축 코덱이 사용될 수 있다. 인코딩된 특징맵의 무손실 압축 대신 손실 압축을 사용함으로써, 시스템은 정확도를 향상시키기 위해 손실 압축 출력의 디코더를 미세 조정할 수 있다.
BPG 손실 압축의 경우, 시스템은 인코딩된 특징맵을 하나의 그레이 스케일 이미지로 재배열할 수 있다. 시스템은 재배열된 그레이 스케일 이미지를 BPG 손실 압축으로 더 압축할 수 있다. 압축 해제의 경우, 시스템은 BPG에서 특징맵을 압축 해제한 다음, 압축 해제된 특징맵을 디코더로 전달하여 압축 해제된 이미지를 얻을 수 있다.
일 실시예에서, 시스템 및 방법은 무선 통신 칩셋의 도메인에 적용될 수 있다.
도 5는 본 개시에 따른 RFIC 아날로그-디지털 변환기(Analog-to-Digital Converter, ADC) 출력 압축 시스템(500)을 도시한다. 시스템은 RFIC(502), 가변-레이트 압축 네트워크(504), 기저 대역 모뎀(506) 및 룩업 테이블(508)을 포함한다. 시스템은 SNR(Signal-to-Noise Ratio)에 의해 결정되는 변조 코딩 방식(Modulation Coding Scheme, MCS)(510)에 기초하여, 압축률(예를 들어, 비트/서브프레임, 비트/프레임, 비트/슬롯 등)을 적응시킨다. 시스템은 MCS의 함수로서, 압축률 및 왜곡을 결정하는 컨디셔닝 변수들(
Figure 112020000637710-pat00058
,Δ)을 선택할 수 있다. 여기서, 압축으로 인한 성능 저하를 피하기 위해 왜곡 정도가 동작 SNR보다 낮을 수 있다. 시스템은 MCS를
Figure 112020000637710-pat00059
,Δ 에 매핑하는 룩업 테이블(508)을 포함 할 수 있다.
시스템은 본 가변-레이트 압축 방식을 적용하여 RFIC(Radio Frequency Integrated Circuit)의 아날로그-디지털 변환기(ADC)(502) 출력을 압축할 수 있다. 시스템은 압축 네트워크(504)로 ADC(502) 출력을 압축할 수 있고, 압축된 ADC 출력을 기저 대역(Baseband, BB) 모뎀(506)으로 전달하여 RFIC와 BB 사이의 통신 비용(즉, 대역폭 및/또는 레인(Lane)의 수)을 감소시킬 수 있다. 가능한 대역폭 및 지연에 따라, 모든 슬롯, 모든 서브 프레임 또는 모든 프레임에서 압축이 수행될 수 있다.
도 6은 본 개시에 따른 제1 조건부 인코더(600)를 도시한다. 조건부 인코더(600)는 도 1a에 도시된 조건부 오토인코더(102) 및 도 1b에 도시된 조건부 오토인코더(152)와 유사할 수 있다. 입력(예를 들어, 이미지, ADC 출력 등)(602)이 제공되면, 시스템은 입력(602)을 제1 192x5x5/2 조건부 컨볼루션 레이어(604), 제1 GDN(Generalized Divisive Normalization) 레이어(606), 제2 192x5x5/2 조건부 컨볼루션 레이어(608), 제2 GDN 레이어(610), 제3 192x5x5/2 조건부 컨볼루션 레이어(612), 제3 GDN 레이어(614), 384x5x5/2 조건부 컨볼루션 레이어(616), 및 범용 양자화(UnivQuant) 레이어(618)를 통해 진행시키고, 출력(620)을 생성한다. 제3 GDN 레이어(614)는 출력(622)을 생성하고, 그 출력(622)은 192x5x5/2 조건부 컨볼루션 레이어(624) 및 누설 ReLU 활성화 함수(626)로 전송되고, 출력(628)을 생성한다.
도 7은 본 개시에 따른 제2 조건부 인코더(700)를 도시한다. 제2 조건부 인코더(700)는 도 1b에 도시된 조건부 오토인코더(154)와 유사할 수 있다. Concat 레이어(702)는 출력(620) 및 출력(628)을 수신하고, 시스템은 192x3x3/1 조건부 컨볼루션 레이어(704), 제1 누설 ReLU 활성화 함수(706), 제1 192x5x5/2 조건부 컨볼루션 레이어(708), 제2 누설 ReLU 활성화 함수(710), 제2 192x5x5/2 조건부 컨볼루션 레이어(712), 및 UnivQuant 레이어(714)를 통해, 출력(716)을 생성한다.
도 8은 본 개시에 따른 조건부 엔트로피 모델(800)을 도시한다. 엔트로피 모델(800)은 도 1b에 도시된 조건부 엔트로피 모델(158)과 동일하거나 유사할 수 있다. 엔트로피 모델(800)은 출력(716)을 수신하고, AE(802) 및 AD(804)를 통해 처리한다. 엔트로피 모델(800)은 마스킹된 384x5x5/1 조건부 컨볼루션 레이어(806), 640x1x1/1 조건부 컨볼루션 레이어(808), 제1 누설 ReLU 활성화 함수(810), 512x1x1/1 조건부 컨볼루션 레이어(812), 및 제2 누설 ReLU 활성화 함수(814)를 통해 출력(716)을 처리한다. ReLU 함수(814)의 출력은 제1 192x1x1/1 조건부 컨볼루션 레이어(816)뿐만 아니라, 제2 192x1x1/1 조건부 컨볼루션 레이어(818)를 통해 처리된다. 제2 조건부 컨볼루션 레이어(818)의 출력은 제3 ReLU 활성화 함수(820)를 통해 처리되고, 제1 조건부 컨볼루션 레이어(816) 및 ReLU 활성화 함수(820)의 출력은 가우스 모델(822)을 생성하도록 처리된다. 가우스 모델(822)은 출력(826)을 생성하기 위해 AE(802) 및 AD(804)와 함께 이용될 수 있다.
도 9는 본 개시에 따른 조건부 엔트로피 모델(900)을 도시한다. 조건부 엔트로피 모델(900)은 도 1a에 도시된 조건부 엔트로피 모델(106) 및 도 1b에 도시된 조건부 엔트로피 모델(156)과 유사할 수 있다. 마스킹된 768x5x5/1 조건부 컨볼루션 레이어(914)는 입력(826)을 수신하고 출력(916)을 생성한다. 또한, 시스템은 출력(826)을 수신하여, 384x5x5/2 조건부 컨볼루션 레이어(902), 제1 누설 ReLU 활성화 함수(904), 576x5x5/2 조건부 컨볼루션 레이어(906), 제2 누설 ReLU 활성화 함수(908) 및 768x3x3/1 조건부 컨볼루션 레이어(910)를 통해 출력을 생성한다. 시스템은 Concat 함수를 통해 레이어(910)의 출력 및 출력(916)을 처리하며, 처리된 출력은 1280x1x1/1 조건부 컨볼루션 레이어(918), 제3 누설 ReLU 활성화 함수(920), 1024x1x1/1 조건부 컨볼루션 레이어(922) 및 제4 누설 ReLU 활성화 함수(924)를 통해 처리되어 출력(926)을 생성한다. 그 후, 시스템은 출력(926)을 제1 384x1x1/1 조건부 컨볼루션 레이어(928) 및 제2 384x1x1/1 조건부 컨볼루션 레이어(930)를 통해 처리한다. 제1 384x1x1/1 조건부 컨볼루션 레이어(928)의 출력은 ReLU 활성화 함수(932)을 통해 처리되고, ReLU 활성화 함수(932)의 출력(931) 및 제2 384x1x1/1 조건부 컨볼루션 레이어(930)의 출력(933)은 가우스 밀도 모델(934)를 통해 처리된다.
시스템은 가우스 밀도 모델(934)의 출력(936) 및 조건부 인코더(600)로부터의 출력(620)을 오토인코더(AE)(938)로 처리하여 양자화 테이블(939)을 통해 처리되는 신호를 생성한다. 시스템은 양자화 테이블(939)의 출력 및 가우스 밀도 모델(934)의 출력(936)을 디코더(AD)(940)로 처리하여 출력(942)을 생성한다.
도 10은 본 개시에 따른 조건부 디코더(1000)를 도시한다. 조건부 디코더(1000)는 도 1b에 도시된 조건부 오토디코더(160)와 유사할 수 있다. 디코더(1000)는 출력(826)을 수신하여, 제1 192x5x5/2 조건부 컨볼루션 레이어(1002), 제1 누설 ReLU 활성화 함수(1004), 제2 192x5x5/2 조건부 컨볼루션 레이어(1006), 제2 누설 ReLU 활성화 함수(1008), 192x3x3/1 조건부 컨볼루션 레이어(1010) 및 제3 누설 ReLU 활성화 함수(1012)를 통해 출력(1014)을 생성한다.
도 11은 본 개시에 따른 조건부 디코더(1100)를 도시한다. 조건부 디코더(1100)는 도 1a에 도시된 조건부 디코더(104) 및 도 1b에 도시된 조건부 디코더(162)와 유사할 수 있다. 디코더는 출력(1014) 및 출력(940)을 수신하고, Concat 함수(1102)에서 처리한다. 시스템은 Concat 함수(1102)의 출력을, 제1 192x5x5/2 조건부 컨볼루션 레이어(1104), 제1 IGDN(Inverse Generalized Divisive Normalization) 레이어(1106), 제2 192x5x5/2 조건부 컨볼루션 레이어(1108), 제2 IGDN 레이어(1110), 제3 192x5x5/2 조건부 컨볼루션 레이어(1112), 제3 IGDN 레이어(1114) 및 3x5x5/2 조건부 컨볼루션 레이어(1116)를 통해 처리하고, 재구성된 입력(1118)을 생성한다.
도 12는 본 개시에 따른 네트워크 환경(1200)에서 전자 장치(1201)를 도시한다. 도 12를 참조하면, 네트워크 환경(1200) 내의 전자 장치(1201)는 제1 네트워크(1298)(예를 들어, 단거리 무선 통신 네트워크)를 통해 전자 장치(1202)와 통신하거나, 제2 네트워크(1299)(예를 들어, 장거리 무선 통신 네트워크)를 통해 전자 장치(1204) 또는 서버(1208)와 통신할 수 있다. 전자 장치(1201)는 서버(1208)를 통해 전자 장치(1204)와 통신할 수도 있다. 전자 장치(1201)는 프로세서(1220), 메모리(1230), 입력 장치(1250), 음향 출력 장치(1255), 디스플레이 장치(1260), 오디오 모듈(1270), 센서 모듈(1276), 인터페이스(1277), 햅틱 모듈(1279), 카메라 모듈(1280), 전력 관리 모듈(1288), 배터리(1289), 통신 모듈(1290), 가입자 식별 모듈(Subscriber Identification Module, SIM)(1296) 또는 안테나 모듈(1297)을 포함할 수 있다. 일 실시예에서, 구성요소들 중 적어도 하나(예를 들어, 디스플레이 장치(1260) 또는 카메라 모듈(1280))는 전자 장치(1201)에서 생략될 수 있고, 하나 이상의 다른 구성요소가 전자 장치(1201)에 추가될 수도 있다. 일 실시예에서, 구성요소들 중 일부는 단일 집적회로(IC)로 구현될 수 있다. 예를 들어, 센서 모듈(1276)(예를 들어, 지문센서, 홍채센서 또는 조도센서)이 디스플레이 장치(1260)(예를 들어, 디스플레이)에 내장될 수 있다.
프로세서(1220)는 프로세서(1220)와 연결된 전자 장치(1201)의 적어도 하나의 다른 구성요소(예를 들어, 하드웨어 또는 소프트웨어)를 제어하기 위한 소프트웨어(예를 들어, 프로그램(1240))를 실행할 수 있고, 다양한 데이터를 처리 또는 계산할 수 있다. 프로세서(1220)는 데이터 처리 또는 계산의 일부로서, 다른 구성요소(예를 들어, 센서 모듈(1276) 또는 통신 모듈(1290))로부터 수신된 명령 또는 데이터를 휘발성 메모리(1232)에 로드하고, 휘발성 메모리(1232)에 저장된 명령 또는 데이터를 처리하고, 그 결과 데이터를 비휘발성 메모리(1234)에 저장할 수 있다. 프로세서(1220)는 메인 프로세서(1221)(예를 들어, 중앙처리장치(CPU) 또는 애플리케이션 프로세서(AP)) 및 메인 프로세서(1221)와 독립적으로 동작하거나 함께 동작할 수 있는 보조 프로세서(1223)(예를 들어, 그래픽 처리장치(GPU), 이미지 신호 프로세서(ISP), 센서 허브 프로세서, 통신 프로세서(CP))를 포함할 수 있다. 부가적으로 또는 대안적으로, 보조 프로세서(1223)는 메인 프로세서(1221)보다 적은 전력을 소비하거나, 특정 기능을 실행하도록 구성될 수 있다. 보조 프로세서(1223)는 메인 프로세서(1221)와 별개로 또는 메인 프로세서(1221)의 일부로 구현될 수 있다.
보조 프로세서(1223)는, 메인 프로세서(1221)가 비활성 상태(예를 들어, 슬립)에 있는 동안에는 메인 프로세서(1221)를 대신하여, 메인 프로세서(1221)가 활성 상태(예를 들어, 애플리케이션을 실행하는 동안)에 있는 동안에는 메인 프로세서(1221)와 함께, 전자 장치(1201)의 구성요소 중 적어도 하나(예를 들어, 디스플레이 장치(1260), 센서 모듈(1276) 또는 통신 모듈(1290))와 관련된 기능 또는 상태를 제어할 수 있다. 일 실시예에서, 보조 프로세서(1223)(예를 들어, 이미지 신호 프로세서 또는 통신 프로세서)는 기능적으로 관련된 다른 구성요소(예를 들어, 카메라 모듈(1280) 또는 통신 모듈(1290))의 일부로 구현될 수 있다.
메모리(1230)는 전자 장치(1201)의 적어도 하나의 구성요소(예를 들어, 프로세서(1220) 또는 센서 모듈(1276))가 사용하는 다양한 데이터를 저장할 수 있다. 다양한 데이터는, 예를 들어, 소프트웨어(예를 들어, 프로그램(1240)) 및 관련 명령에 대한 입력데이터 또는 출력데이터를 포함할 수 있다. 메모리(1230)는 휘발성 메모리(1232) 또는 비휘발성 메모리(1234)를 포함할 수 있다.
프로그램(1240)은 소프트웨어로서 메모리(1230)에 저장될 수 있으며, 운영체제(OS)(1242), 미들웨어(1244) 또는 애플리케이션(1246)을 포함할 수 있다.
입력 장치(1250)는 전자 장치(1201)의 외부(예를 들어, 사용자)로부터 전자 장치(1201)의 다른 구성요소(예를 들어, 프로세서(1220))가 사용할 명령 또는 데이터를 수신할 수 있다. 입력장치(1250)는, 마이크, 마우스 또는 키보드를 포함할 수 있다.
음향 출력 장치(1255)는 음향 신호를 전자 장치(1201) 외부로 출력할 수 있다. 음향 출력 장치(1255)는 예를 들어, 스피커 또는 수신기를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 기록과 같은 일반적인 목적으로 사용될 수 있고, 수신기는 수신 전화를 수신하기 위해 사용될 수 있다. 일 실시예에서, 수신기는 스피커와 분리되거나 스피커의 일부로 구현될 수 있다.
디스플레이 장치(1260)는 전자 장치(1201)의 외부(예를 들어, 사용자)에게 정보를 시각적으로 제공할 수 있다. 디스플레이 장치(1260)는, 예를 들어, 디스플레이, 홀로그램 장치, 또는 프로젝터와, 대응하는 디스플레이, 홀로그램 장치 또는 프로젝터를 제어하기 위한 제어회로를 포함할 수 있다. 일 실시예에서, 디스플레이 장치(1260)는 터치를 검출하도록 구성된 터치회로, 또는 터치에 의해 발생된 힘의 세기를 측정하도록 구성된 센서회로(예를 들어, 압력 센서)를 포함할 수 있다.
오디오 모듈(1270)은 사운드를 전기 신호로 또는 그 반대로 변환할 수 있다. 일 실시예에서, 오디오 모듈(1270)은 입력 장치(1250)를 통해 사운드를 획득하거나, 음향 출력 장치(1255) 또는 전자 장치(1201)와 유선 또는 무선 결합된 외부 전자 장치(1202)의 헤드폰을 통해 사운드를 출력할 수 있다.
센서 모듈(1276)은 전자 장치(1201)의 동작 상태(예를 들어, 전력 또는 온도) 또는 전자 장치(1201) 외부의 환경 상태(예를 들어, 사용자 상태)를 감지하여 전기적 신호 또는 데이터 값을 생성할 수 있다. 센서 모듈(1276)은, 예를 들어, 제스처 센서, 자이로 센서, 대기압 센서, 자기 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, 적외선(IR) 센서, 생체 인식 센서, 온도 센서, 습도 센서 또는 조도 센서를 포함할 수 있다.
인터페이스(1277)는 전자 장치(1201)가 외부 전자 장치(1202)와 직접(유선) 또는 무선으로 연결되는데 사용될 하나 이상의 특정 프로토콜을 지원할 수 있다. 일 실시예에서, 인터페이스(1277)는 HDMI(High Definition Multimedia Interface), USB(Universal Serial Bus) 인터페이스, SD(Secure Digital)카드 인터페이스 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(1278)는 전자 장치(1201)가 외부 전자 장치(1202)와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일 실시예에서, 연결 단자(1278)는 HDMI 커넥터, USB 커넥터, SD카드 커넥터 또는 오디오 커넥터(예를 들어, 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(1279)은 전기적 신호를, 촉각 또는 운동 감각을 통해 사용자에게 인식될 수 있는 기계적 자극(예를 들어, 진동 또는 움직임) 또는 전기적 자극으로 변환할 수 있다. 일 실시예에서, 햅틱 모듈(1279)은 모터, 압전 소자 또는 전기 자극기를 포함할 수 있다.
카메라 모듈(1280)은 정지 이미지 또는 동영상을 캡처할 수 있다. 일 실시예에서, 카메라 모듈(1280)은 하나 이상의 렌즈, 이미지 센서, 이미지 신호 프로세서 또는 플래시를 포함할 수 있다.
전력 관리 모듈(1288)은 전자 장치(1201)에 공급되는 전원을 관리할 수 있다. 전력 관리 모듈(1288)은 전력 관리 집적회로(PMIC)의 일부로서 구현될 수 있다.
배터리(1289)는 전자 장치(1201)의 적어도 하나의 구성요소에 전원을 공급할 수 있다. 일 실시예에서, 배터리(1289)는 재충전이 불가능한 1차 전지, 재충전이 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(1290)은 전자 장치(1201)와 외부 전자 장치(예를 들어, 전자 장치(1202), 전자 장치(1204) 또는 서버(1208)) 사이의 직접(유선) 통신 채널 또는 무선 통신 채널 설정을 지원할 수 있고, 설정된 통신 채널을 통해 통신을 수행할 수 있다. 통신 모듈(1290)은 프로세서(1220)(예를 들어, AP)와 독립적으로 동작하고 직접(유선) 통신 또는 무선 통신을 지원하는 하나 이상의 통신 프로세서를 포함할 수 있다. 일 실시예에서, 통신 모듈(1290)은 무선 통신 모듈(1292)(예를 들어, 셀룰러 통신 모듈, 근거리 무선 통신 모듈 또는 GNSS(Global Navigation Satellite System) 통신 모듈) 또는 유선 통신 모듈(1294)(예를 들어, 근거리 통신망(LAN) 통신 모듈 또는 전력선 통신(PLC) 모듈)을 포함할 수 있다. 이들 통신 모듈은 제1 네트워크(1298)(예를 들어, 블루투스, Wi-Fi 다이렉트 또는 IrDA(Infrared Data Association)와 같은 단거리 통신 네트워크) 또는 제2 네트워크(1299)(예를 들어, 셀룰러 네트워크, 인터넷 또는 컴퓨터 네트워크(LAN, WAN)와 같은 장거리 통신 네트워크)를 통해 외부 전자 장치와 통신할 수 있다. 이러한 다양한 유형의 통신 모듈은 단일 구성요소(예를 들어, 단일 IC)로 구현되거나 서로 분리된 복수의 구성요소(예를 들어, 다중 IC)로 구현될 수 있다. 무선 통신 모듈(1292)은 가입자 식별 모듈(1296)에 저장된 가입자 정보(예를 들어, IMSI(International Mobile Subscriber Identity))를 이용하여 제1 네트워크(1298) 또는 제2 네트워크(1299)와 같은 통신 네트워크에서 전자 장치(1201)를 식별하고 인증할 수 있다.
안테나 모듈(1297)은 전자 장치(1201)의 외부(예를 들어, 외부 전자 장치)와 신호 또는 전력을 송수신할 수 있다. 일 실시예에서, 안테나 모듈(1297)은 하나 이상의 안테나를 포함할 수 있고, 그로부터 제1 네트워크(1298) 또는 제2 네트워크(1299)와 같은 통신 네트워크에 사용되는 통신 방식에 적합한 적어도 하나의 안테나가 선택될 수 있다. 그 후, 신호 또는 전력은 선택된 적어도 하나의 안테나를 통해 통신 모듈(1290)과 외부 전자 장치 사이에서 전송 또는 수신될 수 있다.
전술한 구성요소들 중 적어도 일부는 서로 결합되어 주변 장치 사이의 통신 방식(예를 들어, 버스, GPIO(General Purpose Input and Output), SPI(Serial Peripheral Interface), MIPI(Mobile Industry Processor Interface))을 통해 신호(예를 들어, 명령 또는 데이터)를 전달할 수 있다.
일 실시예에서, 명령 또는 데이터는 제2 네트워크(1299)와 연결된 서버(1208)를 통해 전자 장치(1201)와 외부 전자 장치(1204) 사이에서 전송 또는 수신될 수 있다. 전자 장치들(1202, 1204) 각각은 전자 장치(1201)와 동일한 유형 또는 상이한 유형의 장치일 수 있다. 전자 장치(1201)에서 실행될 동작의 전부 또는 일부는 외부 전자 장치(1202, 1204 또는 1208) 중 하나 이상에서 실행될 수 있다. 예를 들어, 전자 장치(1201)가 기능 또는 서비스를 자동으로 수행해야 하거나 사용자 또는 다른 장치의 요청에 응답하여 기능 또는 서비스를 수행해야 하는 경우, 전자 장치(1201)가 직접 수행하는 것에 대신하거나 부가하여, 하나 이상의 외부 전자 장치에게 기능 또는 서비스의 일부를 수행하도록 요청할 수 있다. 요청을 수신한 하나 이상의 외부 전자 장치는 요청된 기능 또는 서비스의 적어도 일부 또는 요청과 관련된 추가 기능 또는 추가 서비스를 수행하고, 수행 결과를 전자 장치(1201)로 전달할 수 있다. 전자 장치(1201)는 요청에 대한 응답의 적어도 일부로서 결과를 추가 처리와 함께 또는 추가 처리 없이 제공할 수 있다. 이를 위해, 예를 들어, 클라우드 컴퓨팅, 분산 컴퓨팅 또는 클라이언트-서버 컴퓨팅 기술이 사용될 수 있다.
일 실시예는 기계(예를 들어, 전자 장치(1201))에 의해 판독 가능한 저장매체(예를 들어, 내장 메모리(1236) 또는 외장 메모리(1238))에 저장된 하나 이상의 명령어를 포함하는 소프트웨어(예를 들어, 프로그램(1240))로서 구현될 수 있다. 예를 들어, 전자 장치(1201)의 프로세서는, 저장매체에 저장된 하나 이상의 명령어 중 적어도 하나를 호출하고, 프로세서의 제어 하에 하나 이상의 다른 구성요소를 사용하거나 다른 구성요소를 사용하지 않고 명령어를 실행할 수 있다. 따라서, 호출된 적어도 하나의 명령에 따라 적어도 하나의 기능을 수행하도록 기계가 작동될 수 있다. 하나 이상의 명령어는 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행 가능한 코드를 포함할 수 있다. 기계 판독 가능한 저장매체는 비일시적 저장매체의 형태로 제공될 수 있다. "비일시적"이라는 용어는 저장매체가 유형의 장치이고 신호(예를 들어, 전자기파)를 포함하지 않는다는 것을 암시하지만, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 것과 데이터가 저장매체에 일시적으로 저장되는 것을 구별하는 것은 아니다.
일 실시예에서, 본 개시의 방법은 컴퓨터 프로그램 제품에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 판매자와 구매자 사이의 제품으로 거래될 수 있다. 컴퓨터 프로그램 제품은 기계 판독 가능한 저장 매체(예를 들어, CD-ROM(Compact Disc Read Only Memory))의 형태로 배포되거나, 애플리케이션 스토어(예를 들어, Play StoreTM)를 통해 온라인으로 배포(예를 들어, 다운로드 또는 업로드)되거나, 두 사용자 기기(예를 들어, 스마트폰) 사이에서 직접 배포될 수 있다. 온라인으로 배포되는 경우, 컴퓨터 프로그램 제품의 적어도 일부는 제조자 서버의 메모리, 애플리케이션 스토어의 서버, 또는 중계 서버와 같은 기계 판독 가능한 저장 매체에 일시적으로 생성되거나 저장될 수 있다.
일 실시예에서, 전술한 구성요소들의 각 구성요소(예를 들어, 모듈 또는 프로그램)는 단일한 본체 또는 다중 본체를 포함할 수 있다. 전술한 구성요소들 중 하나 이상이 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 대안적으로 또는 추가적으로, 복수의 구성요소(예를 들어, 모듈 또는 프로그램)들이 단일한 구성요소에 통합될 수 있다. 이 경우, 통합 구성요소는 통합 이전의 복수의 구성요소 중 대응하는 하나의 구성요소에 의해 수행되는 것과 동일하거나 유사한 방식으로 복수의 구성요소 각각의 기능을 여전히 수행할 수 있다. 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작은 순차적으로, 병렬로, 반복적으로 또는 경험적으로 수행될 수 있고, 하나 이상의 동작이 서로 다른 순서로 실행되거나 생략될 수 있으며, 하나 이상의 다른 동작이 추가될 수도 있다.
이상, 본 개시의 상세한 설명에서 본 개시의 특정 실시예들이 설명되었지만, 본 개시는 본 개시의 범위를 벗어나지 않으면서, 다양한 형태로 변형될 수 있다. 따라서, 본 개시의 범위는 단지 설명된 실시예들에 기초하여 결정되어서는 안되며, 오히려 첨부된 청구 범위 및 그 균등물들에 기초하여 결정된다.
100, 150: 가변-레이트 이미지 압축 모델
102: 조건부 오토인코더
104: 조건부 디코더
106: 조건부 엔트로피 모델
108: 라그랑주 승수
110: 양자화 빈 사이즈
111: 범용 양자화
112: 엔트로피 인코딩
114: 엔트로피 디코딩
152: 제1 조건부 오토인코더
154: 제2 조건부 오토인코더
156: 제1 조건부 엔트로피 모델
158: 제2 조건부 엔트로피 모델
160: 제1 조건부 오토디코더
162: 제2 조건부 오토디코더
164: 제1 범용 양자화 함수
166: 제2 범용 양자화 함수
168: 제1 산술 인코딩/디코딩 함수
170: 제2 산술 인코딩/디코딩 함수
172: 하이퍼 파라미터
300: 조건부 오토인코더
302: 입력
304: 컨볼루션 레이어
306: 라그랑주 승수
308: 원-핫 인코딩 레이어
310: 제1 완전-연결 레이어
312: 제2 완전-연결 레이어
314: 소프트플러스 함수 블록
320: 출력
400: 인코더
402: 디코더
500: RFIC ADC 출력 압축 시스템
502: RFIC
504: 가변-레이트 압축 네트워크
506: 기저 대역 모뎀
508: 룩업 테이블
510: 변조 코딩 방식
600: 제1 조건부 인코더
700: 제2 조건부 인코더
800, 900: 조건부 엔트로피 모델
1000, 1100: 조건부 디코더
1200: 네트워크 환경
1298: 제1 네트워크

Claims (20)

  1. 라그랑주 승수를 사용하여 조건부 오토인코더를 학습시키고,
    혼합 양자화 빈 사이즈들을 이용하여 상기 조건부 오토인코더를 포함하는 신경망을 학습시키는, 압축 방법.
  2. 제1항에 있어서,
    상기 라그랑주 승수의 값은 미리 결정된 값 세트로부터 선택되는, 압축 방법.
  3. 제1항에 있어서,
    상기 신경망은 라그랑주 승수의 컨디셔닝 값에 따라 다양한 압축률 및 왜곡으로 압축 된 압축물을 생성하는, 압축 방법.
  4. 제1항에 있어서,
    상기 조건부 오토인코더는 조건부 컨볼루션을 사용하여 학습되는, 압축 방법.
  5. 제1항에 있어서,
    상기 혼합 양자화 빈 사이즈로 상기 신경망을 학습시키는 것은 양자화 빈 사이즈를 조정하는 것을 더 포함하는, 압축 방법.
  6. 제1항에 있어서,
    상기 혼합 양자화 빈 사이즈로 상기 신경망을 학습시키는 것은 임의의 양자화 빈 사이즈에 대한 다양한 노이즈 레벨에 대해 균일한 노이즈를 인출하는 것을 더 포함하는, 압축 방법.
  7. 제1항에 있어서,
    상기 신경망은 BPG(Better Portable Graphics) 압축을 수행하도록 구성된, 압축 방법.
  8. 제1항에 있어서,
    상기 신경망은 RFIC(Radio Frequency Integrated Circuit)의 아날로그-디지털 변환기 출력의 압축을 수행하도록 구성된, 압축 방법.
  9. 제8항에 있어서,
    MCS(변조 코딩 방식)의 함수로서 라그랑주 승수 및 양자화 빈 사이즈를 더 선택하는, 압축 방법.
  10. 제9항에 있어서,
    상기 신경망은 상기 MCS를 상기 라그랑주 승수 및 상기 양자화 빈 사이즈에 매핑하는 룩업 테이블을 더 포함하는, 압축 방법.
  11. 조건부 오토인코더를 포함하는 신경망; 및
    프로세서를 포함하고,
    상기 프로세서는,
    라그랑주 승수를 사용하여 상기 조건부 오토인코더를 학습시키고,
    혼합 양자화 빈 사이즈들을 이용하여 상기 신경망을 학습시키는, 압축 시스템.
  12. 제11항에 있어서,
    상기 라그랑주 승수의 값은 미리 결정된 값 세트로부터 선택되는, 압축 시스템.
  13. 제11항에 있어서,
    상기 신경망은 라그랑주 승수의 컨디셔닝 값에 따라 다양한 압축률 및 왜곡으로 압축 된 압축물을 생성하는, 압축 시스템.
  14. 제11항에 있어서,
    상기 프로세서는 조건부 컨볼루션을 사용하여 상기 조건부 오토인코더를 학습시키도록 구성된, 압축 시스템.
  15. 제11항에 있어서,
    상기 프로세서는 양자화 빈 사이즈를 조정함으로써 상기 혼합 양자화 빈 사이즈로 상기 신경망을 학습시키도록 추가로 구성된, 압축 시스템.
  16. 제11항에 있어서,
    상기 프로세서는 임의의 양자화 빈 사이즈에 대한 다양한 노이즈 레벨에 대해 균일한 노이즈를 인출함으로써 상기 혼합 양자화 빈 사이즈로 상기 신경망을 학습시키도록 추가로 구성된, 압축 시스템.
  17. 제11항에 있어서,
    상기 신경망은 BPG(Better Portable Graphics) 압축을 수행하도록 구성된, 압축 시스템.
  18. 제11항에 있어서,
    상기 신경망은 RFIC(Radio Frequency Integrated Circuit)의 아날로그-디지털 변환기 출력의 압축을 수행하도록 구성된, 압축 시스템.
  19. 제18항에 있어서,
    상기 프로세서는 MCS(변조 코딩 방식)의 함수로서 라그랑주 승수 및 양자화 빈 사이즈를 선택하도록 추가로 구성된, 압축 시스템.
  20. 제19항에 있어서,
    상기 신경망은 상기 MCS를 상기 라그랑주 승수 및 상기 양자화 빈 사이즈에 매핑하는 룩업 테이블을 더 포함하는, 압축 시스템.
KR1020200000794A 2019-03-18 2020-01-03 조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법 KR102618558B1 (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201962820148P 2019-03-18 2019-03-18
US62/820,148 2019-03-18
US201962860522P 2019-06-12 2019-06-12
US62/860,522 2019-06-12
US16/576,166 US10886943B2 (en) 2019-03-18 2019-09-19 Method and apparatus for variable rate compression with a conditional autoencoder
US16/576,166 2019-09-19

Publications (2)

Publication Number Publication Date
KR20200111093A KR20200111093A (ko) 2020-09-28
KR102618558B1 true KR102618558B1 (ko) 2023-12-27

Family

ID=72514599

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200000794A KR102618558B1 (ko) 2019-03-18 2020-01-03 조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법

Country Status (3)

Country Link
US (3) US10886943B2 (ko)
KR (1) KR102618558B1 (ko)
CN (1) CN111710007A (ko)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11762557B2 (en) 2017-10-30 2023-09-19 AtomBeam Technologies Inc. System and method for data compaction and encryption of anonymized datasets
US11811428B2 (en) 2017-10-30 2023-11-07 AtomBeam Technologies Inc. System and method for data compression using genomic encryption techniques
US11868616B2 (en) 2017-10-30 2024-01-09 AtomBeam Technologies Inc. System and method for low-distortion compaction of floating-point numbers
US11733867B2 (en) 2017-10-30 2023-08-22 AtomBeam Technologies Inc. System and method for multiple pass data compaction utilizing delta encoding
US11375194B2 (en) * 2019-11-16 2022-06-28 Uatc, Llc Conditional entropy coding for efficient video compression
JP7355622B2 (ja) * 2019-11-29 2023-10-03 株式会社日立製作所 エンコーダを有するストレージシステム
EP4144087A1 (en) * 2020-04-29 2023-03-08 Deep Render Ltd Image compression and decoding, video compression and decoding: methods and systems
GB202019531D0 (en) * 2020-12-10 2021-01-27 Deep Render Ltd Bit allocation
US11488329B2 (en) * 2020-06-29 2022-11-01 Tencent America LLC Method and apparatus for multi-rate neural image compression with stackable nested model structures
US11538197B2 (en) * 2020-09-15 2022-12-27 Google Llc Channel-wise autoregressive entropy models for image compression
US11895330B2 (en) * 2021-01-25 2024-02-06 Lemon Inc. Neural network-based video compression with bit allocation
US12008731B2 (en) 2021-01-25 2024-06-11 Qualcomm Incorporated Progressive data compression using artificial neural networks
WO2022159897A1 (en) * 2021-01-25 2022-07-28 Qualcomm Incorporated Progressive data compression using artificial neural networks
CN114037071B (zh) * 2021-09-18 2023-08-08 宁波大学 获取用于图像前处理以抵抗jpge压缩失真的神经网络的方法
WO2023088562A1 (en) * 2021-11-19 2023-05-25 Telefonaktiebolaget Lm Ericsson (Publ) An autoencoder for data compression
WO2023241690A1 (en) * 2022-06-16 2023-12-21 Douyin Vision (Beijing) Co., Ltd. Variable-rate neural network based compression
WO2024120382A1 (en) * 2022-12-05 2024-06-13 Douyin Vision Co., Ltd. Controllable variable-rate from entropy quantization perspective for learned compression model

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6345126B1 (en) 1998-01-29 2002-02-05 Xerox Corporation Method for transmitting data using an embedded bit stream produced in a hierarchical table-lookup vector quantizer
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US7376242B2 (en) * 2001-03-22 2008-05-20 Digimarc Corporation Quantization-based data embedding in mapped data
US7570827B2 (en) 2004-07-14 2009-08-04 Slipstream Data Inc. Method, system and computer program product for optimization of data compression with cost function
US20090225829A2 (en) * 2005-07-06 2009-09-10 Do-Kyoung Kwon Method and apparatus for operational frame-layerrate control in video encoder
US8149909B1 (en) * 2005-10-13 2012-04-03 Maxim Integrated Products, Inc. Video encoding control using non-exclusive content categories
KR20080089633A (ko) * 2006-01-09 2008-10-07 노키아 코포레이션 스케일러블 비디오 부호화에서 에러 회복 모드 결정
JP2008252176A (ja) * 2007-03-29 2008-10-16 Toshiba Corp 動画像符号化装置及び方法
US8175150B1 (en) * 2007-05-18 2012-05-08 Maxim Integrated Products, Inc. Methods and/or apparatus for implementing rate distortion optimization in video compression
US20110052087A1 (en) * 2009-08-27 2011-03-03 Debargha Mukherjee Method and system for coding images
US8817884B2 (en) * 2009-11-20 2014-08-26 Texas Instruments Incorporated Techniques for perceptual encoding of video frames
US20110206132A1 (en) 2010-02-19 2011-08-25 Lazar Bivolarsky Data Compression for Video
US10091529B2 (en) * 2010-07-09 2018-10-02 Samsung Electronics Co., Ltd. Method and apparatus for entropy encoding/decoding a transform coefficient
JP5988071B2 (ja) * 2011-02-07 2016-09-07 ソニー株式会社 画像処理装置および方法、並びに、プログラム
GB2495468B (en) * 2011-09-02 2017-12-13 Skype Video coding
US9781449B2 (en) * 2011-10-06 2017-10-03 Synopsys, Inc. Rate distortion optimization in image and video encoding
WO2013056200A1 (en) 2011-10-14 2013-04-18 Brightsentry, Inc. Method and apparatus for video compression of stationary scenes
CN104704824B (zh) * 2012-10-04 2018-05-11 瑞典爱立信有限公司 分层去块参数适配
US9386317B2 (en) * 2014-09-22 2016-07-05 Sony Interactive Entertainment Inc. Adaptive picture section encoding mode decision control
US9749636B2 (en) 2014-10-24 2017-08-29 Intel Corporation Dynamic on screen display using a compressed video stream
US10165272B2 (en) 2015-01-29 2018-12-25 Arris Enterprises Llc Picture-level QP rate control performance improvements for HEVC encoding
KR20180054693A (ko) * 2015-10-13 2018-05-24 엘지전자 주식회사 비디오 신호의 인코딩, 디코딩 방법 및 그 장치
US20170134732A1 (en) * 2015-11-05 2017-05-11 Broadcom Corporation Systems and methods for digital media communication using syntax planes in hierarchical trees
US10178390B2 (en) * 2016-03-30 2019-01-08 Sony Interactive Entertainment Inc. Advanced picture quality oriented rate control for low-latency streaming applications
TWI593273B (zh) * 2016-04-07 2017-07-21 晨星半導體股份有限公司 位元率控制方法及視訊編碼裝置
US10616583B2 (en) * 2016-06-30 2020-04-07 Sony Interactive Entertainment Inc. Encoding/decoding digital frames by down-sampling/up-sampling with enhancement information
US10999576B2 (en) * 2017-05-03 2021-05-04 Novatek Microelectronics Corp. Video processing method
KR102452312B1 (ko) * 2017-11-30 2022-10-07 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
EP3537346A1 (en) * 2018-03-09 2019-09-11 Tata Consultancy Services Limited Method and system for incorporating regression into stacked auto encoder (sae)
US20190045195A1 (en) 2018-03-30 2019-02-07 Intel Corporation Reduced Partitioning and Mode Decisions Based on Content Analysis and Learning
US11177823B2 (en) * 2018-05-21 2021-11-16 Google Llc Data compression by local entropy encoding
US20200021815A1 (en) * 2018-07-10 2020-01-16 Fastvdo Llc Method and apparatus for applying deep learning techniques in video coding, restoration and video quality analysis (vqa)
US10674152B2 (en) * 2018-09-18 2020-06-02 Google Llc Efficient use of quantization parameters in machine-learning models for video coding
US11645535B2 (en) * 2018-09-24 2023-05-09 Samsung Electronics Co., Ltd. Normalization method for training deep neural networks
EP3834137A1 (en) * 2018-09-27 2021-06-16 DeepMind Technologies Limited Committed information rate variational autoencoders
US11689726B2 (en) * 2018-12-05 2023-06-27 Google Llc Hybrid motion-compensated neural network with side-information based video coding

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Aaron Van den Oord et al, Conditional image generation with PixelCNN decoders. In Advances in Neural Information Processing Systems, pages 4790-4798 (2016)
Antonio Ortega and Kannan Ramchandran. Rate-distortion methods for image and video compression. IEEE Signal Processing Magazine,15(6):23-50, 1998.
Soroosh Khoram et al, ADAPTIVE QUANTIZATION OF NEURAL NETWORKS, Published as a conference paper at ICLR 2018

Also Published As

Publication number Publication date
US10886943B2 (en) 2021-01-05
US20200395955A1 (en) 2020-12-17
US20230006692A1 (en) 2023-01-05
KR20200111093A (ko) 2020-09-28
US11451242B2 (en) 2022-09-20
CN111710007A (zh) 2020-09-25
US11979175B2 (en) 2024-05-07
US20200304147A1 (en) 2020-09-24

Similar Documents

Publication Publication Date Title
KR102618558B1 (ko) 조건부 오토인코더를 이용한 가변-레이트 압축을 위한 장치 및 방법
US11924445B2 (en) Instance-adaptive image and video compression using machine learning systems
US9407915B2 (en) Lossless video coding with sub-frame level optimal quantization values
CN110490296A (zh) 一种构造卷积神经网络(cnn)模型的方法和系统
CN115211115A (zh) 使用基于循环的机器学习系统的视频压缩
US20210035330A1 (en) Image compression with bounded deep neural network perception loss
Chen et al. Learning based facial image compression with semantic fidelity metric
CN103581665A (zh) 转码视频数据
US20220188633A1 (en) Low displacement rank based deep neural network compression
CN113994348A (zh) 对于深度神经网络压缩的线性神经重建
KR20240054975A (ko) 기계 학습 시스템들을 사용하여 네트워크 파라미터 서브공간에서의 인스턴스 적응적 이미지 및 비디오 압축
US11483585B2 (en) Electronic apparatus and controlling method thereof
KR20230105317A (ko) 전역 모델 압축에 의한 통신 효율적인 연합 학습을 위한 방법 및 장치
WO2018120019A1 (zh) 用于神经网络数据的压缩/解压缩的装置和系统
TW202046726A (zh) 用於壓縮的方法及系統
CN117980916A (zh) 用于媒体的变换译码的基于变换器的架构
CN114127746A (zh) 卷积神经网络的压缩
EP3026912A1 (en) Method and device for encoding and decoding a HDR picture and a LDR picture using illumination information
Chen et al. Adaptive VQVAE: a learning-based image compression framework with vector quantization
US20240127835A1 (en) Electronic device, method, and non-transitory computer readable storage device adaptively processing audio bitstream
US20230130288A1 (en) Method for code-level super resolution and method for training super resolution model therefor
WO2023169303A1 (zh) 编解码方法、装置、设备、存储介质及计算机程序产品
WO2024078403A1 (zh) 图像处理方法、装置及设备
US20230171435A1 (en) Image encoding, decoding method and device, coder-decoder
US20240129546A1 (en) Artificial intelligence-based image encoding and decoding apparatus, and image encoding and decoding method thereby

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant