KR100248072B1 - 신경망을 이용한 영상 데이터 압축/복원 장치의 구조 및압축/복원 방법 - Google Patents

신경망을 이용한 영상 데이터 압축/복원 장치의 구조 및압축/복원 방법 Download PDF

Info

Publication number
KR100248072B1
KR100248072B1 KR1019970059299A KR19970059299A KR100248072B1 KR 100248072 B1 KR100248072 B1 KR 100248072B1 KR 1019970059299 A KR1019970059299 A KR 1019970059299A KR 19970059299 A KR19970059299 A KR 19970059299A KR 100248072 B1 KR100248072 B1 KR 100248072B1
Authority
KR
South Korea
Prior art keywords
neural network
vector
karhnen
transform
output
Prior art date
Application number
KR1019970059299A
Other languages
English (en)
Other versions
KR19990039267A (ko
Inventor
이전우
한동원
정하재
하정현
Original Assignee
정선종
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정선종, 한국전자통신연구원 filed Critical 정선종
Priority to KR1019970059299A priority Critical patent/KR100248072B1/ko
Publication of KR19990039267A publication Critical patent/KR19990039267A/ko
Application granted granted Critical
Publication of KR100248072B1 publication Critical patent/KR100248072B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 신경망을 이용한 영상 데이터 압축/복원 장치의 구조 및 압축/복원 방법에 관한 것이다. 일반적으로 하나의 신경망을 이용하여 모든 영상 데이터를 처리할 경우, 영상의 내용이 신경망 훈련에 사용된 샘플과 많이 달라지게 되면 복구 영상의 화질을 보장 할 수 없으므로 영상 데이터를 그 내용에 따라 분류하고 각 종류의 영상 데이터 처리를 담당하는 신경망을 별개로 채용하므로써 여러 개의 신경망을 병렬로 구성하여 사용한다. 그러나 이와 같은 영상 데이터의 압축 및 복원 방법은 영상 데이터에 변환 압축만을 적용한 것으로 영상 데이터의 압축률 및 복구 화질의 고품질화를 얻을 수 없었다. 이러한 문제점을 해결하기 위하여, 본 발명에서는 최적의 변환 부호화 방법으로 알려져 있는 카르흐넨-루베 변환(Karhunen-Loeve Transform ;KLT) 방식을 신경망으로 수행하고 에지 열화의 단점을 보완할 수 있고 신경망 각각의 출력 특성에 따라 특화된 벡터 양자화를 수행하는 분류 벡터 양자화를 결합한 분류 카르흐넨-루베 변환(Karhunen-Loeve Transform ;DKLT) 방식을 이용하여 정확성이 요구되는 영상 데이터를 압축 및 복원할 수 있는 신경망을 이용한 영상 데이터의 압축/복원 장치의 구조 및 압축/복원 방법이 제시된다.

Description

신경망을 이용한 영상 데이터 압축/복원 장치의 구조 및 압축/복원 방법
본 발명은 영상 데이터 압축/복원 장치의 구조 및 압축/복원 방법에 관한 것으로, 특히 선형 부호화 방법인 카르흐넨-루베 변환(Karhunen-Loeve Transform ;이하 KLT라 함) 방식과 복구 화질 및 압축률이 우수한 분류 양자화 방법을 결합한 분류 기능을 갖는 KLT 변환 신경망인 DKLT 신경망을 이용하므로써 높은 압출률을 유지하면서 동시에 복구 화질을 개선시킬 수 있는 신경망을 이용한 영상 데이터의 압축/복원 장치의 구조 및 압축/복원 방법에 관한 것이다.
일반적으로 KLT 방법은 변환 계수의 에너지 집중성과 무상관성의 측면에서 다른 선형 변환 함수보다 우수한 특성을 갖는 부호화 방법이다. 그러나 입력 데이터에 따라 변환을 위한 기저 행렬이 달라지는 신호 의존적 특성과 변환을 위해서는 그 연산량이 방대해지는 문제점이 있다. 이러한 KLT의 문제점 때문에 적정 화질을 유지하면서 빠른 속도가 요구되는 일반적인 영상 데이터의 압축/복원에는 KLT보다 성능은 낮지만 고속의 변환이 가능한 이산 코사인 변환(Discrete Cosine Transform ;DCT) 방법이 사용되고 있다. 그러나 의학 화상 통신 데이터베이스 시스템(Picture Archiving and Communication System ;PACS)과 같이 높은 압축률을 유지하면서 영상 데이터의 손실이 적어야 하는 응용 분야에서는 DCT 방식 역시 적합하지 않은 문제점이 있다. 이에 따라, 종래에는 정확한 복구 영상이 필요한 응용 분야를 위해 DCT와 분류 벡터 양자화를 결합한 혼합 부호화 방법을 사용하거나 여러개의 KLT 신경망을 병렬로 사용하는 변환 부호화 방법을 이용하였다. 영상을 블럭 단위로 분류하고 각 블럭 종류마다 별도의 기저 행렬을 갖는 KLT 신경망을 병렬로 채용하는 변환 부호화 방법을 채용하는 이유는 다음과 같다.
신경망을 이용한 영상 데이터의 압축 및 복원시에는 먼저 데이터를 압축하여 채널로 전송하는 압축기에 입력 뉴런수보다 출력 뉴런수가 적은 압축 신경망을 사용한다. 또한 복원기에는 압축 신경망에 대응되는 복원 신경망으로서 복원 신경망의 입력 뉴런 수는 압축 신경망의 출력 뉴런 수와 같고 복원 신경망의 출력 뉴런 수는 압축 신경망의 입력 뉴런 수와 같다. 복원 신경망은 압축 신경망의 역변환 기능을 수행하며 압축 신경망과 복원 신경망은 사전에 입력 영상 데이터의 샘플로 훈련된다. 그러나 하나의 신경망을 이용하여 모든 영상 데이터를 처리할 경우, 영상의 내용이 신경망 훈련에 사용된 샘플과 달라지게 되면 복구 영상의 화질을 보장할 수 없게 된다. 이러한 이유로 영상 데이터를 내용에 따라 분류하고 각 종류의 영상 데이터 처리를 담당하는 신경망을 별개로 채용하므로써 여러 개의 신경망을 병렬로 구성하여야 한다.
이와 같이 KLT 신경망에 변환 부호화 방법을 적용할 경우에는 입력 블럭을 별도 처리하여 블럭을 구분하는 블럭 분류기 및 압축기 내에서 각 신경망의 출력을 역변환하고 복구하여 최고의 복구 화질을 얻을 수 있는 신경망을 선택하게 하는 출력 선택기가 필요하다. 그러나 이러한 방법에서는 KLT 변환 계수의 에너지 집중성이 최대가 되는 측면에서 여러 개의 변환 신경망 중 해당 블럭에 최적인 신경망을 선택하기 때문에 우수한 혼합 부호화 특성을 제공할 수 없는 문제점이 있다.
따라서, 본 발명은 입력되는 영상 블럭의 종류를 판별하고 최적의 변환 부호화 변환을 위한 DKLT 신경망을 이용하므로써 영상 데이터의 고속 병렬 처리를 가능하게 하고, 각 블럭의 종류에 따라 특화된 벡터 양자화기를 채용하여 압축률과 복구 화면의 화질을 개선할 수 있는 신경망을 이용한 영상 데이터의 압축/복원 장치의 구조 및 압축/복원 방법을 제공하는데 그 목적이 있다.
상술한 목적을 달성하기 위한 본 발명에 따른 신경망을 이용한 영상 데이터의 압축/복원 장치의 구조는 영상 블럭 내의 픽셀 수만큼의 차원으로 벡터화된 영상 블럭 데이터를 입력으로 하여 상기 입력된 영상 블럭 데이터를 압축하기 위한 카르흐넨-루베 변환을 수행하여 카르흐넨-루베 변환 계수 및 분류 카르흐넨-루베 변환 계수를 출력하는 다수의 분류 카르흐넨-루베 변환 신경망과, 상기 다수의 분류 카르흐넨-루베 변환 신경망의 출력단에 하나씩 존재하면서 상기 다수의 분류 카르흐넨-루베 변환 신경망에서 출력되는 카르흐넨-루베 변환 계수를 각각 입력받아 벡터 코드북에 있는 계수 벡터들과 비교하여 입력 벡터와 가장 유사한 값을 갖는 벡터의 코드북 주소를 출력하는 다수의 벡터 양자화기와, 상기 각각의 분류 카르흐넨-루베 변환 신경망에서 출력되는 분류 카르흐넨-루베 변환 계수들을 입력받아 입력된 영상 블럭의 벡터가 어느 분류 카르흐넨-루베 변환 신경망에서 담당해야할 종류의 블럭인지를 판단하여 출력 선택 제어 코드를 생성하는 출력 선택기와, 상기 벡터 양자화기에서 사용하는 것과 동일한 코드북을 그 내용으로 포함하고 있으며 상기 코드북 주소를 입력받아 그 주소에 저장되어있는 카르흐넨-루베 변환 계수를 출력하고 상기 벡터 양자화기에 대응하면서 역 양자화를 담당하는 다수의 벡터 테이블과, 상기 다수의 벡터 테이블과 짝을 이루고 있으며 상기 다수의 벡터 테이블에서 출력되는 KLT 계수를 입력받아서 역변환하여 복구된 영상 블럭 데이터를 출력하는 역 카르흐넨-루베 변환 신경망을 포함하여 구성되는 것을 특징으로 한다.
또한 상술한 목적을 달성하기 위한 본 발명에 따른 신경망을 이용한 영상 데이터의 압축/복원 방법은 분류 카르흐넨-루베 변환 신경망으로 영상 블럭 데이터가 입력되면 상기 입력 데이터를 카르흐넨-루베 변환하고 블럭 종류 판별에 필요한 선형 판별 분석을 수행하여 카르흐넨-루베 변환 계수와 분류 카르흐넨-루베 변환 계수를 출력하는 단계와, 상기 출력된 카르흐넨-루베 변환 계수를 각각의 벡터 양자화기에 입력하고 상기 분류 카르흐넨-루베 변환 계수들을 출력 선택기로 입력하여 입력된 영상 블럭 데이터를 최적으로 변환하여 결과를 출력할 수 있는 분류 카르흐넨-루베 변환 신경망을 결정하는 단계와, 상기 결정된 분류 카르흐넨-루베 변환 신경망의 벡터 양자화기로부터 선택 코드북 주소를 출력하는 단계와, 상기. 출력된 선택 코드북에 의하여 지정된 벡터 양자화기의 주소 및 상기 코드북 주소를 통신 채널을 통해 복원기가 있는 원격지로 전송하는 단계와, 상기 벡터 양자화기 주소를 이용하여 영상 블럭 복구에 사용할 벡터 테이블 및 그에 따른 역 카르흐넨-루베 변환 신경망을 지정하는 단계와, 상기 벡터 테이블에 압축 데이터의 나머지 부분인 벡터 양자화기의 출력을 적용하여 역 양자화된 카르흐넨-루베 변환 계수를 검색하는 단계와, 상기 검색된 카르흐넨-루베 변환 계수를 역 카르흐넨-루베 변환 신경망에 입력하고 역변환한 후 복구된 영상 블럭 데이터를 최종 출력하는 단계를 포함하여 이루어지는 것을 특징으로 한다.
도 1은 본 발명에 따른 영상 데이터 압축/복원 장치의 구조도.
도 2는 본 발명에 적용되는 영상 데이터 압축용 분류 카르흐넨-루베 변환 신경망의 구조도.
도 3은 본 발명에 적용되는 영상 데이터 복원용 역 카르흐넨-루베 변환 신경망의 구조도.
도 4는 카르흐넨-루베 변환 신경망의 훈련 방법을 설명하기 위해 도시한 흐름도.
도 5는 본 발명에 따른 영상 데이터 압축/복원 방법을 설명하기 위해 도시한 흐름도.
〈도면의 주요 부분에 대한 부호 설명〉
11 : 압축기 12 : 복원기
13 : 통신 채널
111-1 내지 111-n : DKLT 신경망 112 : 출력 선택기
113-1 내지 113-n : 벡터 양자화기 121-1 내지 121-n : 벡터 테이블
122-1 내지 122-n : 역 KLT 신경망
이하, 첨부된 도면을 참조하여 본 발명을 상세히 설명하기로 한다.
도 1은 본 발명에 따른 영상 데이터 압축/복원 장치의 구조도이다. 영상 데이터 압축/복원 장치는 크게 압축기(11) 및 복원기(12)로 구성되며 압축기(11)는 입력 영상 블럭의 종류를 판별하면서 KLT 변환을 담당하는 다수의 DKLT 신경망(111-1 내지 111-k), 각 DKLT 신경망(111-1 내지 111-k)의 입력 영상 블럭 판별 결과를 종합하여 최종적인 판별 결과를 결정하는 출력 선택기(112) 및 DKLT 신경망(111-1 내지 111-k)의 출력에 특화된 벡터 양자화기(113-1 내지 113-k)로 이루어지고 복원기(12)는 벡터 양자화의 역변환을 위한 벡터 테이블(121-1 내지 121-k)과 압축기(11)에서 변환된 KLT 계수를 역변환하는 역 KLT 변환 신경망(122-1 내지 122-k)으로 이루어진다. 보다 자세히 설명하면 다음과 같다.
먼저, 압축기(11)의 구성을 살펴보면, DKLT 신경망(111-1 내지 111-k)은 영상 압축을 위한 최적 변환인 KLT변환을 수행하여 KLT 변환계수를 출력하면서 KLT 변환계수를 사전에 훈련된 부공간에 투영하므로써 KLT 변환된 입력 영상 데이터의 종류를 판별할 수 있는 DKLT 계수도 함께 출력하는 기능을 수행한다. 또한 벡터 양자화기(113-1 내지 113-k)는 각각의 영상 블럭 종류에 따라 KLT 변환한 결과를 잘 압축할 수 있도록 특화되어 있으며, 출력 선택기(112)는 각각의 DKLT 신경망에서 출력된 DKLT 계수로부터 입력 영상 블럭 데이터가 최적으로 변환된 출력을 선택하는 기능을 수행한다.
압축기(11)의 출력은 통신채널(13)을 경유하여 복원기(12)에 전달되며, 복원기(12)는 압축기의 각 벡터 양자화기에 대응하면서 역 양자화를 담당하는 벡터 테이블(121-1 내지 121-k)과 벡터 테이블(121-1 내지 121-k)에서 검색된 KLT 계수들의 역 KLT 변환을 수행하는 역 KLT 신경망(122-1 내지 122-k)으로 구성된다.
DKLT 신경망(111-1 내지 111-k)은 영상 블럭 데이터가 벡터화된 n차원의 벡터 X를 입력받아서 KLT 계수와 DKLT 계수를 출력한다. 여기서 n은 영상 블럭내의 픽셀수이다. KLT 계수와 DKLT 계수도 벡터로서 이들 벡터의 차원은 압축성능과 DKLT 신경망(111-1 내지 111-k)의 수에 따라 가변적이다. 벡터 양자화기(113-1 내지 113-k)는 각각의 DKLT 신경망(111-1 내지 111-k)의 출력단에 한 개씩 존재하며, DKLT 신경망(111-1 내지 111-k)에서 출력되는 KLT 계수를 입력받아서 벡터 코드북에 있는 계수 벡터들과 비교하여 입력 벡터와 가장 유사한 값을 갖는 벡터의 코드북 주소를 출력한다. 코드북 주소의 출력 여부는 출력 선택기에서 제공되는 제어 코드에 의하여 결정된다. 출력 선택기(12)는 각각의 DKLT 신경망(111-1 내지 111-k)에서 출력되는 DKLT 계수들을 입력받아 입력된 영상 블럭의 벡터가 어느 DKLT 신경망(111-1 내지 111-k)에서 담당해야할 종류의 블럭인지를 판단하여 출력 선택 제어 코드를 생성한다. 통신채널(13)을 통하여 복원기(12)에 전달되는 압축 데이터는 출력 선택기(13)에서 제공되는 출력 제어 코드와 벡터 양자화기(113-1 내지 113-k)에서 출력되는 코드북 주소로 구성된다. 복원기(12)는 압축 데이터를 받아서 먼저 출력 제어 코드를 확인하여 코드북 주소를 이용하여 검색할 벡터 테이블(121-1 내지 121-k)을 지정한다. 벡터 테이블(121-1 내지 121-k)은 압축기(11)의 벡터 양자화기(113-1 내지 113-k)에서 사용하는 것과 동일한 코드북을 그 내용으로 포함하고 있으며, 코드북 주소를 받아서 그 주소에 저장되어있는 KLT 계수를 출력한다. 각각의 벡터 테이블(121-1 내지 121-k)은 그 테이블이 가지는 계수의 역변환을 담당하는 역 KLT 신경망(122-1 내지 122-k)과 짝을 이루고 있다. 역 KLT 신경망(122-1 내지 122-k)은 벡터 테이블(121-1 내지 121-k)에서 출력되는 KLT 계수를 입력받아서 역변환하여 복구된 영상 블럭 데이터를 출력한다.
도 2는 본 발명에 적용되는 영상 데이터 압축용 분류 카르흐넨-루베 변환(DKLT) 신경망의 구조도이다.
DKLT 신경망은 입력단을 포함하여 4단으로 구성되며, 사전에 각각의 신경망이 변환을 담당할 블럭의 종류에 해당되는 시험 블럭들로 훈련된다. 이렇게 훈련된 DKLT 신경망들은 자체의 변환 결과로부터 입력된 영상 블럭이 자체에서 담당하는 종류의 블럭인지를 판단하여 그에 대한 출력도 함께 한다. 이렇게 하여 블럭의 특성이 훈련시에 사용된 훈련용 데이터와 상이하여 두 가지 이상의 신경망에서 변환 출력을 제공할 경우, 출력 선택기에서 최종적으로 최적의 출력을 결정하게 된다. 이렇게 각각 분류된 블럭 종류 별로 DKLT 신경망이 채용되므로써 각 블럭 종류에 적합한 분류 벡터 양자화를 변환 부호화 다음에 사용할 수 있다. 도면을 참조하여 보다 자세히 설명하면 다음과 같다. 신경망의 뉴런 수는 입력 영상 블럭의 차원인 n(X1 내지 Xn), 첫 번째 은닉층의 뉴런 수를 m이며 두 번째 은닉층과 출력층의 뉴런 수는 l이다. 이때에는 n〉m〉l의 관계가 있으며 변환에 의한 압축은 n〉m인 계수 개수의 감소에 의해 얻어진다. 첫 번째 은닉층에서 출력되는 Y 벡터는 KLT 계수이고 출력층의 Z 벡터는 DKLT 계수이다. 각 뉴런은 단순히 뉴런으로 입력되는 입력과 연결 강도의 곱을 더하여 출력한다. DKLT 신경망에서 첫 번째 층은 KLT 변환을 담당하고 나머지 두 층은 블럭의 종류 판별에 필요한 선형 판별 분석을 담당한다.
도 3은 본 발명에 적용되는 영상 데이터 복원용 역 카르흐넨-루베 변환 신경망의 구조도이다.
m차원의 KLT 계수인 Y 벡터를 입력받아 역변환하여 n〉m인 n차원의 복구영상 블럭 데이터 X'을 출력한다. 역 KLT 신경망의 연결 강도는 별도의 훈련과정이 없이 DKLT 신경망의 훈련 결과에서 입력층과 첫번째 은닉층간의 연결강도를 사용한다.
도 4는 분류 카르흐넨-루베 변환 신경망(DKLT)의 훈련 방법을 설명하기 위해 도시한 흐름도이다.
DKLT 신경망의 훈련은 각 층별로 단계적으로 이루어지며, RLS(Recursive Least Square) 훈련 방법을 사용하여 이루어진다. 먼저 입력층과 첫번째 은닉층간의 첫번째층 연결강도를 작은 값의 랜덤 값으로 초기화하고 RLS 훈련을 위한 훈련 파라메터를 초기화한다(401). 다음에는 훈련하고자하는 DKLT 신경망이 담당할 종류의 대표 영상 블럭 데이터로 구성된 훈련용 영상 블럭 데이터를 입력하여 RLS 훈련 방법에 따른 연결강도 조정으로 첫번째층의 연결강도를 구한다(402). 연결 강도가 구해지면 모든 종류의 영상 블럭 데이터로 구성된 전체 훈련 데이터를 입력하여 첫번째 은닉층에서의 출력을 구한다(403). 이렇게 구한 첫번째 은닉층의 출력을 훈련대상 DKLT 신경망이 담당할 종류의 영상 블럭 데이터에 대한 출력과 다른 종류의 영상 블럭 데이터에 대한 출력을 나누어서 두개의 데이터 세트로 구분하여 두개의 데이터 세트를 합한 전체 데이터 세트의 평균값과 각 데이터 세트의 평균값을 구하여 전체 분산 데이터 세트와 클래스분산 데이터 세트를 만든다(404). 전체분산 데이터 세트는 두개의 데이터 세트에 포함된 각각의 데이터로부터 전체 데이터 세트의 평균값을 뺀 값들을 하나의 데이터 세트로 모은 데이터 세트이고, 클래스분산 데이터 세트는 각각의 데이터 세트에 포함된 데이터에서 각 데이터 세트의 평균값을 뺀 값들을 하나의 데이터 세트로 모은 데이터 세트이다. 이렇게 데이터 세트가 준비되면 먼저 두번째층 연결강도를 작은 값의 랜덤 값으로 초기화하고 RLS 훈련을 위한 훈련 파라메터를 초기화한다(405). 이후 첫번째층의 훈련과정과 동일한 RLS훈련과정에 따라 클래스분산 데이터 세트를 가지고 두번째층의 연결강도를 구한다(406). 두번째층의 연결강도를 얻은 후에 전체 분산 데이터 세트를 첫번째 은닉층에 입력하여 두번째 은닉층에 출력되는 값을 모아서 세번째층의 연결 강도를 구한다(407). 세번째층의 연결강도 훈련과정도 첫번째층의 연결강도 훈련과정과 동일하다. 즉, 세번째층 연결강도를 작은 값의 랜덤 값으로 초기화하고 RLS 훈련을 위한 훈련 파라메터를 초기화(408)하고 두 번째 층에서 출력된 전체 분산 데이터 세트의 출력을 이용하여 RLS 훈련 방법에 따라 세 번째 층 연결 강도를 구한다(409).
이렇게 세 개의 층에 대한 연결 강도가 얻어지면 DKLT 신경망의 훈련은 끝나고, 전체 신경망은 KLT 변환기능과 블럭 종류의 선형 판별 기능을 갖는 DKLT 신경망이 된다.
도 5는 본 발명에 따른 영상 데이터 압축/복원 방법을 설명하기 위해 도시한 흐름도이다.
영상 블럭 데이터가 입력(501)되면 모든 DKLT 신경망에서 입력 데이터를 KLT 변환하고 블럭 종류 판별에 필요한 선형 판별 분석을 수행하여 KLT 계수와 DKLT 계수를 출력(502)한다. 출력된 KLT 계수는 각 DKLT 신경망과 짝을 이루고 있는 벡터 양자화기에 입력되고 DKLT 계수들은 출력 선택기로 입력되어 입력된 영상 블럭 데이터를 가장 잘 변환하여 결과를 출력할 수 있는 DKLT 신경망을 결정(503)하여 출력 선택 코드북을 출력한다(504). 출력된 선택 코드북에 의하여 지정된 벡터 양자화기의 출력만이 압축기 출력으로 출력되어 출력 선택 코드와 함께 통신 채널을 통해 복원기가 있는 원격지로 전송된다(505). 복원기에서는 압축 데이터에서 먼저 출력선택 코드를 분리하여 역 양자화를 위한 벡터 테이블과 그에 따른 역 KLT 신경망을 지정한다(506). 압축 데이터의 나머지 부분인 벡터 양자화기의 출력을 벡터테이블에 적용하여 역 양자화된 KLT계수를 검색하고, 검색된 KLT계수를 역 KLT신경망에 입력(507)하여 역변환한 후 복구 영상 블럭 데이터를 최종 출력한다(508).
상술한 바와 같이 본 발명에 따르면, 입력되는 영상 블럭의 종류를 판별하고 최적의 변환 부호화 변환을 위한 DKLT 신경망을 이용하므로써 영상 데이터의 고속 병렬 처리를 가능하게 하고, 각 블럭의 종류에 따라 특화된 벡터 양자화기를 채용하므로써 압축률과 복구 화면의 화질을 개선할 수 있어 의료 영상의 압축/복원이 필요한 PACS와 같은 시스템뿐만 아니라 기존의 손실 압축보다 높은 압축률과 복구 화면의 우수한 화질을 요구하는 일반적인 영상의 압축/복원에도 활용이 가능한 탁월한 효과가 있다.

Claims (2)

  1. 영상 블럭 내의 픽셀 수만큼의 차원으로 벡터화된 영상 블럭 데이터를 입력으로 하여 상기 입력된 영상 블럭 데이터를 압축하기 위한 카르흐넨-루베 변환을 수행하여 카르흐넨-루베 변환 계수 및 분류 카르흐넨-루베 변환 계수를 출력하는 다수의 분류 카르흐넨-루베 변환 신경망과,
    상기 다수의 분류 카르흐넨-루베 변환 신경망의 출력단에 하나씩 존재하면서 상기 다수의 분류 카르흐넨-루베 변환 신경망에서 출력되는 카르흐넨-루베 변환 계수를 각각 입력받아 벡터 코드북에 있는 계수 벡터들과 비교하여 입력 벡터와 가장 유사한 값을 갖는 벡터의 코드북 주소를 출력하는 다수의 벡터 양자화기와,
    상기 각각의 분류 카르흐넨-루베 변환 신경망에서 출력되는 분류 카르흐넨-루베 변환 계수들을 입력받아 입력된 영상 블럭의 벡터가 어느 분류 카르흐넨-루베 변환 신경망에서 담당해야할 종류의 블럭인지를 판단하여 출력 선택 제어 코드를 생성하는 출력 선택기와,
    상기 벡터 양자화기에서 사용하는 것과 동일한 코드북을 그 내용으로 포함하고 있으며 상기 코드북 주소를 입력받아 그 주소에 저장되어있는 카르흐넨-루베 변환 계수를 출력하고 상기 벡터 양자화기에 대응하면서 역 양자화를 담당하는 다수의 벡터 테이블과,
    상기 다수의 벡터 테이블과 짝을 이루고 있으며 상기 다수의 벡터 테이블에서 출력되는 KLT 계수를 입력받아서 역변환하여 복구된 영상 블럭 데이터를 출력하는 역 카르흐넨-루베 변환 신경망을 포함하여 구성되는 것을 특징으로 하는 신경망을 이용한 영상 데이터의 압축/복원 장치의 구조.
  2. 분류 카르흐넨-루베 변환 신경망으로 영상 블럭 데이터가 입력되면 상기 입력 데이터를 카르흐넨-루베 변환하고 블럭 종류 판별에 필요한 선형 판별 분석을 수행하여 카르흐넨-루베 변환 계수와 분류 카르흐넨-루베 변환 계수를 출력하는 단계와,
    상기 출력된 카르흐넨-루베 변환 계수를 각각의 벡터 양자화기에 입력하고 상기 분류 카르흐넨-루베 변환 계수들을 출력 선택기로 입력하여 입력된 영상 블럭 데이터를 최적으로 변환하여 결과를 출력할 수 있는 분류 카르흐넨-루베 변환 신경망을 결정하는 단계와,
    상기 결정된 분류 카르흐넨-루베 변환 신경망의 벡터 양자화기로부터 선택 코드북 주소를 출력하는 단계와,
    상기. 출력된 선택 코드북에 의하여 지정된 벡터 양자화기의 주소 및 상기 코드북 주소를 통신 채널을 통해 복원기가 있는 원격지로 전송하는 단계와,
    상기 벡터 양자화기 주소를 이용하여 영상 블럭 복구에 사용할 벡터 테이블 및 그에 따른 역 카르흐넨-루베 변환 신경망을 지정하는 단계와,
    상기 벡터 테이블에 압축 데이터의 나머지 부분인 벡터 양자화기의 출력을 적용하여 역 양자화된 카르흐넨-루베 변환 계수를 검색하는 단계와,
    상기 검색된 카르흐넨-루베 변환 계수를 역 카르흐넨-루베 변환 신경망에 입력하고 역변환한 후 복구된 영상 블럭 데이터를 최종 출력하는 단계를 포함하여 이루어지는 것을 특징으로 하는 신경망을 이용한 영상 데이터의 압축/복원 방법.
KR1019970059299A 1997-11-11 1997-11-11 신경망을 이용한 영상 데이터 압축/복원 장치의 구조 및압축/복원 방법 KR100248072B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970059299A KR100248072B1 (ko) 1997-11-11 1997-11-11 신경망을 이용한 영상 데이터 압축/복원 장치의 구조 및압축/복원 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970059299A KR100248072B1 (ko) 1997-11-11 1997-11-11 신경망을 이용한 영상 데이터 압축/복원 장치의 구조 및압축/복원 방법

Publications (2)

Publication Number Publication Date
KR19990039267A KR19990039267A (ko) 1999-06-05
KR100248072B1 true KR100248072B1 (ko) 2000-03-15

Family

ID=19524542

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970059299A KR100248072B1 (ko) 1997-11-11 1997-11-11 신경망을 이용한 영상 데이터 압축/복원 장치의 구조 및압축/복원 방법

Country Status (1)

Country Link
KR (1) KR100248072B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101056462B1 (ko) 2009-07-02 2011-08-11 세종대학교산학협력단 음성신호 양자화 장치 및 방법
KR20180108288A (ko) 2017-03-24 2018-10-04 주식회사 엔씨소프트 영상 압축 장치 및 방법
WO2019216515A1 (ko) * 2018-05-09 2019-11-14 삼성전자주식회사 전자 장치 및 그 제어 방법
US11734577B2 (en) 2019-06-05 2023-08-22 Samsung Electronics Co., Ltd Electronic apparatus and method of performing operations thereof

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030009575A (ko) * 2001-06-26 2003-02-05 박광훈 신경망 분류기를 이용한 동영상 전송률 제어 장치 및 그방법
KR100446630B1 (ko) * 2002-05-08 2004-09-04 삼성전자주식회사 음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법
KR100529311B1 (ko) * 2003-01-21 2005-11-17 삼성전자주식회사 신경 회로망을 이용하여 가변 길이 부호화 비트 스트림의길이를 선택하는 장치 및 방법
CN114745556B (zh) * 2022-02-07 2024-04-02 浙江智慧视频安防创新中心有限公司 编码方法、装置、数字视网膜系统、电子设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101056462B1 (ko) 2009-07-02 2011-08-11 세종대학교산학협력단 음성신호 양자화 장치 및 방법
KR20180108288A (ko) 2017-03-24 2018-10-04 주식회사 엔씨소프트 영상 압축 장치 및 방법
KR101990092B1 (ko) 2017-03-24 2019-06-17 주식회사 엔씨소프트 영상 압축 장치 및 방법
WO2019216515A1 (ko) * 2018-05-09 2019-11-14 삼성전자주식회사 전자 장치 및 그 제어 방법
US11734577B2 (en) 2019-06-05 2023-08-22 Samsung Electronics Co., Ltd Electronic apparatus and method of performing operations thereof

Also Published As

Publication number Publication date
KR19990039267A (ko) 1999-06-05

Similar Documents

Publication Publication Date Title
CN110225341B (zh) 一种任务驱动的码流结构化图像编码方法
Toderici et al. Variable rate image compression with recurrent neural networks
CN1175373C (zh) 有损失/无损失感兴趣区域图像编码的方法和系统
JP3978478B2 (ja) 推定画素値により固定速度のブロック単位の画像圧縮を行うための装置及び方法
KR20010025113A (ko) 이미지 압축
US5598354A (en) Motion video compression system with neural network having winner-take-all function
US5124791A (en) Frame-to-frame compression of vector quantized signals and other post-processing
US20210099731A1 (en) Neural network based image set compression
KR100248072B1 (ko) 신경망을 이용한 영상 데이터 압축/복원 장치의 구조 및압축/복원 방법
CN1327713C (zh) 用于对视频数据流压缩和解压缩的方法和装置
CN110930408A (zh) 基于知识重组的语义图像压缩方法
Li et al. Image compression using transformed vector quantization
EP1324618A2 (en) Encoding method and arrangement
KR20230136121A (ko) 인공 신경망을 사용한 프로그래시브 데이터 압축
JPH02285896A (ja) 符号化装置
Aizawa et al. Adaptive discrete cosine transform coding with vector quantization for color images
CN113450421B (zh) 一种基于增强深度学习的无人机侦察图像压缩与解压方法
Gray et al. Image compression and tree-structured vector quantization
CN110719473B (zh) 基于结构化稀疏的可伸缩压缩视频采集与重构系统
KR100268171B1 (ko) 분류화 최적 변환 영상 데이터 압축을 위한 블록 분류 및부호화 방법
Kountchev et al. Non-linear image representation based on IDP with NN
CN110620927A (zh) 基于结构化稀疏的可伸缩压缩视频张量信号采集与重构系统
Mahajan et al. Memory Optimization Technique Of Map Image (DWT based hybrid Technique)
Galan-Hernandez et al. Advances in image and video compression using wavelet transforms and fovea centralis
kumar Color and multispectral image compression using Enhanced Block Truncation Coding [E-BTC] scheme

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20071115

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee