KR102337966B1 - 데이터를 압축하는 전자 장치 및 그 동작 방법 - Google Patents

데이터를 압축하는 전자 장치 및 그 동작 방법 Download PDF

Info

Publication number
KR102337966B1
KR102337966B1 KR1020170062441A KR20170062441A KR102337966B1 KR 102337966 B1 KR102337966 B1 KR 102337966B1 KR 1020170062441 A KR1020170062441 A KR 1020170062441A KR 20170062441 A KR20170062441 A KR 20170062441A KR 102337966 B1 KR102337966 B1 KR 102337966B1
Authority
KR
South Korea
Prior art keywords
data
block
sub
electronic device
processor
Prior art date
Application number
KR1020170062441A
Other languages
English (en)
Other versions
KR20180127085A (ko
Inventor
박찬식
박찬율
김용철
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020170062441A priority Critical patent/KR102337966B1/ko
Priority to US15/979,904 priority patent/US10469102B2/en
Publication of KR20180127085A publication Critical patent/KR20180127085A/ko
Application granted granted Critical
Publication of KR102337966B1 publication Critical patent/KR102337966B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4031Fixed length to variable length coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6011Encoder aspects
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/42Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6035Handling of unkown probabilities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephone Function (AREA)

Abstract

본 발명의 다양한 실시예에 따른 전자 장치는, 메모리; 및 상기 메모리에 저장된 제1 블록 및 제2 블록을 포함하는 데이터를 압축하여 압축 데이터를 생성하는 프로세서를 포함하고, 상기 프로세서는, 상기 압축 데이터에 상기 제1 블록에 포함된 제1 서브 데이터에 대한 제1 빈도수들의 순위에 적어도 기반하여 생성된, 상기 제1 서브 데이터에 대응하는 제1 대체 데이터 테이블을 포함시키고, 상기 제2 블록에 포함된 제2 서브 데이터 및 상기 제2 서브 데이터에 대한 제2 빈도수들의 순위가 상기 제1 블록에 포함된 상기 제1 서브 데이터 및 상기 제1 빈도수들의 순위와 지정된 조건을 만족할 경우, 상기 제2 블록에 대응하여 상기 제1 대체 데이터 테이블의 참조 정보를 포함시키도록 설정될 수 있다. 또는, 다른 실시예도 가능하다.

Description

데이터를 압축하는 전자 장치 및 그 동작 방법{ELECTRONIC DEVICE FOR COMPRESSING DATA AND METHOD FOR OPERATION THEREOF}
본 발명의 다양한 실시예는, 데이터를 압축하는 전자 장치 및 그 동작 방법에 관한 것이다.
데이터를 압축하는 기술과 관련하여, 엔트로피 코딩은 확률에 기반하여 데이터를 전송이나 저장에 적합한 압축된 비트스트림으로 변환하는 방법이다. 엔트로피 코딩 방법에는 허프만 부호화(Huffman coding), 산술 코딩(arithmetic coding), 컨텍스트 기반 적응적 코딩(context-based adaptive encoding) 등이 있다.
확률 기반 가변 길이 엔트로피 코딩은 부호화할 심볼에 대해서 동일한 길이의 비트를 할당하지 않고, 전체 데이터 내에서 해당 심볼이 발생한 확률 정보에 따라 가변 길이로 비트를 할당하여 데이터를 압축할 수 있다.
예를 들어, 확률 기반 엔트로피 코딩 방식에 따라 압축된 데이터는, 코딩된 데이터와 코딩된 데이터를 디코딩하기 위한 코드북(또는 확률 테이블)을 포함할 수 있다. 확률 기반 엔트로피 코딩 방식에 따르면, 인코더는 동일하거나 또는 유사한 확률 분포를 가지는 블록들 일지라도 서로 다른 코딩 윈도우에서 각각에 대응하는 코드북들을 압축 파일에 포함시킨다. 이에 따라, 동일하거나 또는 유사한 정보를 가지는 코드북들이 중복 송신되어, 데이터 크기가 증가하는 문제가 발생할 수 있다.
다양한 실시예들에 따른 전자 장치는, 데이터에서 동일하거나 유사한 확률 분포를 가지는 블록에 대하여 확률 기반 엔트로피 코딩 방식에 따라 압축된 데이터에 동일하거나 유사한 확률 테이블 또는 코드북이 중복되어 포함되는 것을 방지할 수 있다.
압축된 데이터에서 확률 테이블 또는 코드북이 중복되어 포함되는 것을 방지하기 위하여, 다양한 실시예에 따른 전자 장치는 복수의 블록에 대하여 동일하거나 또는 유사한 확률 테이블 또는 코드북을 재사용할 수 있는 경우, 전체 확률 테이블 또는 코드북을 압축 데이터에 중복하여 포함시키지 않고, 이전의 확률 테이블 또는 코드북을 참조할 수 있는 정보 및 일부 변경된 정보만을 포함시킬 수 있다.
본 발명의 다양한 실시예에 따른 전자 장치는, 메모리; 및 상기 메모리에 저장된 제1 블록 및 제2 블록을 포함하는 데이터를 압축하여 압축 데이터를 생성하는 프로세서를 포함하고, 상기 프로세서는, 상기 압축 데이터에 상기 제1 블록에 포함된 제1 서브 데이터에 대한 제1 빈도수들의 순위에 적어도 기반하여 생성된, 상기 제1 서브 데이터에 대응하는 제1 대체 데이터 테이블을 포함시키고, 상기 제2 블록에 포함된 제2 서브 데이터 및 상기 제2 서브 데이터에 대한 제2 빈도수들의 순위가 상기 제1 블록에 포함된 상기 제1 서브 데이터에 및 상기 제1 빈도수들의 순위와 지정된 조건을 만족할 경우, 상기 제2 블록에 대응하여 상기 제1 대체 데이터 테이블의 참조 정보를 포함시킬 수 있다.
본 발명의 다양한 실시예에 따른 전자 장치는, 통신 회로; 및 프로세서를 포함하고, 상기 프로세서는, 전송 대상 데이터의 송신이 요청되면, 상기 전송 데이터를 인코딩한 제1 인코딩 데이터 및 상기 제1 인코딩 데이터의 디코딩을 위한 제1 추가 데이터를 포함하는, 제1 크기의 제1 데이터를 송신하고, 상기 제1 데이터를 송신한 이후에 상기 전송 대상 데이터의 재송신이 요청되면, 상기 제1 인코딩 데이터 및 상기 제1 인코딩 데이터의 디코딩을 위한 제2 추가 데이터를 포함하는, 제2 크기의 제2 데이터를 송신하고, 상기 제2 크기는 상기 제1 크기보다 작은 것일 수 있다.
본 발명의 다양한 실시예에 따른 프로세서에 의하여 적어도 하나의 동작을 수행하도록 설정된 명령들(instructions)이 저장된 컴퓨터 판독 가능한(computer readable) 기록 매체는, 상기 적어도 하나의 동작으로, 상기 프로세서가 전자 장치와 기능적으로 연결되어 있는 메모리에 저장된 데이터를 압축하여 압축 데이터를 생성하는 동작; 상기 프로세서가 상기 압축 데이터에 상기 데이터 중 제1 블록에 포함된 제1 서브 데이터에 대한 제1 빈도수들의 순위에 적어도 기반하여 생성된, 상기 제1 서브 데이터에 대응하는 제1 대체 데이터 테이블을 포함시키는 동작; 및 상기 프로세서가 상기 데이터 중 제2 블록에 포함된 제2 서브 데이터 및 상기 제2 서브 데이터에 대한 제2 빈도수들의 순위가 상기 제1 블록에 포함된 상기 제1 서브 데이터 및 상기 제1 빈도수들의 순위와 지정된 조건을 만족할 경우, 상기 제2 블록에 대응하여 상기 제1 대체 데이터 테이블의 참조 정보를 포함시키는 동작을 포함시킬 수 있다.
본 발명의 다양한 실시예에 따른 전자 장치는, 확률 분포가 동일하거나 유사한 경우에 확률 테이블 또는 코드북을 재사용하여 압축된 데이터의 크기를 감소시킬 수 있다. 다양한 실시예에 따른 전자 장치는, 서로 다른 블록에서 확률 분포가 동일한 경우에 압축 데이터에 기 포함된 확률 테이블에 대한 참조 정보를 다른 블록에 대한 압축 데이터에 포함시킬 수 있다. 다양한 실시예에 따른 전자 장치는, 서로 다른 블록에서 확률 분포가 유사하여 압축 데이터에 기 포함된 확률 테이블 또는 코드북의 일부 값을 변경시켜 사용할 수 있는 경우에 기 포함된 확률 테이블 또는 코드북을 참조할 수 있는 정보 및 일부 변경된 정보를 다른 블록에 대한 압축 데이터에 포함시킬 수 있다.
도 1은 본 발명의 다양한 실시예에 따른 전자 장치 및 네트워크의 블록도를 도시한다.
도 2는 다양한 실시예에 따른 전자 장치의 블록도이다.
도 3은 다양한 실시예에 따른 프로그램 모듈의 블록도이다.
도 4는 본 발명의 다양한 실시예에 따른 전자 장치의 동작 방법을 설명하기 위한 흐름도이다.
도 5는 다양한 실시예에 따른 다수의 블록을 포함하는 입력 데이터를 나타낸 개념도이다.
도 6a는 다양한 실시예에 따른 입력 데이터에 대한 확률 테이블의 예시이다.
도 6b는 다양한 실시예에 따른 입력 데이터에 대한 블록별 확률 분포의 예시이다.
도 7은 다양한 실시예에 따른 입력 데이터에 대한 대체 데이터 테이블의 예시이다.
도 8은 다양한 실시예에 따른 압축 데이터의 개념도이다.
도 9는 다양한 실시예에 따른 복수의 블록을 포함하는 압축 데이터의 예시이다.
도 10은 본 발명의 다양한 실시예에 따른 전자 장치의 동작 방법을 설명하기 위한 흐름도이다.
도 11은 다양한 실시예에 따른 압축 데이터의 예시이다.
도 12a는 다양한 실시예에 따른 입력 데이터의 예시이다.
도 12b는 다양한 실시예에 따라 고정 블록 확률 테이블에 따라 입력 데이터를 나타낸 개념도이다.
도 12c는 다양한 실시예에 따라 가변 블록 확률 테이블에 따라 입력 데이터를 나타낸 개념도이다.
이하, 본 문서의 다양한 실시예들이 첨부된 도면을 참조하여 기재된다. 실시예 및 이에 사용된 용어들은 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 및/또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 본 문서에서, "A 또는 B" 또는 "A 및/또는 B 중 적어도 하나" 등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. "제 1," "제 2," "첫째," 또는 "둘째," 등의 표현들은 해당 구성요소들을, 순서 또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에 "(기능적으로 또는 통신적으로) 연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제 3 구성요소)를 통하여 연결될 수 있다.
본 문서에서, "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, 하드웨어적 또는 소프트웨어적으로 "~에 적합한," "~하는 능력을 가지는," "~하도록 변경된," "~하도록 만들어진," "~를 할 수 있는," 또는 "~하도록 설계된"과 상호 호환적으로(interchangeably) 사용될 수 있다. 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성된(또는 설정된) 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(예: CPU 또는 application processor)를 의미할 수 있다.
본 문서의 다양한 실시예들에 따른 전자 장치는, 예를 들면, 스마트폰, 태블릿 PC, 이동 전화기, 영상 전화기, 전자책 리더기, 데스크탑 PC, 랩탑 PC, 넷북 컴퓨터, 워크스테이션, 서버, PDA, PMP(portable multimedia player), MP3 플레이어, 의료기기, 카메라, 또는 웨어러블 장치 중 적어도 하나를 포함할 수 있다. 웨어러블 장치는 액세서리형(예: 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체형(예: 전자 의복), 신체 부착형(예: 스킨 패드 또는 문신), 또는 생체 이식형 회로 중 적어도 하나를 포함할 수 있다. 어떤 실시예들에서, 전자 장치는, 예를 들면, 텔레비전, DVD(digital video disk) 플레이어, 오디오, 냉장고, 에어컨, 청소기, 오븐, 전자레인지, 세탁기, 공기 청정기, 셋톱 박스, 홈 오토매이션 컨트롤 패널, 보안 컨트롤 패널, 미디어 박스(예: 삼성 HomeSyncTM, 애플TVTM, 또는 구글 TVTM), 게임 콘솔(예: XboxTM, PlayStationTM), 전자 사전, 전자 키, 캠코더, 또는 전자 액자 중 적어도 하나를 포함할 수 있다.
다른 실시예에서, 전자 장치는, 각종 의료기기(예: 각종 휴대용 의료측정기기(혈당 측정기, 심박 측정기, 혈압 측정기, 또는 체온 측정기 등), MRA(magnetic resonance angiography), MRI(magnetic resonance imaging), CT(computed tomography), 촬영기, 또는 초음파기 등), 네비게이션 장치, 위성 항법 시스템(GNSS(global navigation satellite system)), EDR(event data recorder), FDR(flight data recorder), 자동차 인포테인먼트 장치, 선박용 전자 장비(예: 선박용 항법 장치, 자이로 콤파스 등), 항공 전자기기(avionics), 보안 기기, 차량용 헤드 유닛(head unit), 산업용 또는 가정용 로봇, 드론(drone), 금융 기관의 ATM, 상점의 POS(point of sales), 또는 사물 인터넷 장치 (예: 전구, 각종 센서, 스프링클러 장치, 화재 경보기, 온도조절기, 가로등, 토스터, 운동기구, 온수탱크, 히터, 보일러 등) 중 적어도 하나를 포함할 수 있다. 어떤 실시예에 따르면, 전자 장치는 가구, 건물/구조물 또는 자동차의 일부, 전자 보드(electronic board), 전자 사인 수신 장치(electronic signature receiving device), 프로젝터, 또는 각종 계측 기기(예: 수도, 전기, 가스, 또는 전파 계측 기기 등) 중 적어도 하나를 포함할 수 있다. 다양한 실시예에서, 전자 장치는 플렉서블하거나, 또는 전술한 다양한 장치들 중 둘 이상의 조합일 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다. 본 문서에서, 사용자라는 용어는 전자 장치를 사용하는 사람 또는 전자 장치를 사용하는 장치(예: 인공지능 전자 장치)를 지칭할 수 있다.
도 1을 참조하여, 다양한 실시예에서의, 네트워크 환경(100) 내의 전자 장치(101)가 기재된다. 전자 장치(101)는 버스(110), 프로세서(120), 메모리(130), 입출력 인터페이스(150), 디스플레이(160), 및 통신 인터페이스(170)를 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)는, 구성요소들 중 적어도 하나를 생략하거나 다른 구성요소를 추가적으로 구비할 수 있다. 버스(110)는 구성요소들(110-170)을 서로 연결하고, 구성요소들 간의 통신(예: 제어 메시지 또는 데이터)을 전달하는 회로를 포함할 수 있다. 프로세서(120)는, 중앙처리장치, 어플리케이션 프로세서, 또는 커뮤니케이션 프로세서(communication processor(CP)) 중 하나 또는 그 이상을 포함할 수 있다. 프로세서(120)는, 예를 들면, 전자 장치(101)의 적어도 하나의 다른 구성요소들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 실행할 수 있다.
메모리(130)는, 휘발성 및/또는 비휘발성 메모리를 포함할 수 있다. 메모리(130)는, 예를 들면, 전자 장치(101)의 적어도 하나의 다른 구성요소에 관계된 명령 또는 데이터를 저장할 수 있다. 한 실시예에 따르면, 메모리(130)는 소프트웨어 및/또는 프로그램(140)을 저장할 수 있다. 프로그램(140)은, 예를 들면, 커널(141), 미들웨어(143), 어플리케이션 프로그래밍 인터페이스(API)(145), 및/또는 어플리케이션 프로그램(또는 "어플리케이션")(147) 등을 포함할 수 있다. 커널(141), 미들웨어(143), 또는 API(145)의 적어도 일부는, 운영 시스템으로 지칭될 수 있다. 커널(141)은, 예를 들면, 다른 프로그램들(예: 미들웨어(143), API(145), 또는 어플리케이션 프로그램(147))에 구현된 동작 또는 기능을 실행하는 데 사용되는 시스템 리소스들(예: 버스(110), 프로세서(120), 또는 메모리(130) 등)을 제어 또는 관리할 수 있다. 또한, 커널(141)은 미들웨어(143), API(145), 또는 어플리케이션 프로그램(147)에서 전자 장치(101)의 개별 구성요소에 접근함으로써, 시스템 리소스들을 제어 또는 관리할 수 있는 인터페이스를 제공할 수 있다.
미들웨어(143)는, 예를 들면, API(145) 또는 어플리케이션 프로그램(147)이 커널(141)과 통신하여 데이터를 주고받을 수 있도록 중개 역할을 수행할 수 있다. 또한, 미들웨어(143)는 어플리케이션 프로그램(147)으로부터 수신된 하나 이상의 작업 요청들을 우선 순위에 따라 처리할 수 있다. 예를 들면, 미들웨어(143)는 어플리케이션 프로그램(147) 중 적어도 하나에 전자 장치(101)의 시스템 리소스(예: 버스(110), 프로세서(120), 또는 메모리(130) 등)를 사용할 수 있는 우선 순위를 부여하고, 상기 하나 이상의 작업 요청들을 처리할 수 있다. API(145)는 어플리케이션(147)이 커널(141) 또는 미들웨어(143)에서 제공되는 기능을 제어하기 위한 인터페이스로, 예를 들면, 파일 제어, 창 제어, 영상 처리, 또는 문자 제어 등을 위한 적어도 하나의 인터페이스 또는 함수(예: 명령어)를 포함할 수 있다. 입출력 인터페이스(150)는, 예를 들면, 사용자 또는 다른 외부 기기로부터 입력된 명령 또는 데이터를 전자 장치(101)의 다른 구성요소(들)에 전달하거나, 또는 전자 장치(101)의 다른 구성요소(들)로부터 수신된 명령 또는 데이터를 사용자 또는 다른 외부 기기로 출력할 수 있다.
디스플레이(160)는, 예를 들면, 액정 디스플레이(LCD), 발광 다이오드(LED) 디스플레이, 유기 발광 다이오드(OLED) 디스플레이, 또는 마이크로 전자기계 시스템 (MEMS) 디스플레이, 또는 전자종이(electronic paper) 디스플레이를 포함할 수 있다. 디스플레이(160)는, 예를 들면, 사용자에게 각종 콘텐츠(예: 텍스트, 이미지, 비디오, 아이콘, 및/또는 심볼 등)을 표시할 수 있다. 디스플레이(160)는, 터치 스크린을 포함할 수 있으며, 예를 들면, 전자 펜 또는 사용자의 신체의 일부를 이용한 터치, 제스쳐, 근접, 또는 호버링 입력을 수신할 수 있다. 통신 인터페이스(170)는, 예를 들면, 전자 장치(101)와 외부 장치(예: 제 1 외부 전자 장치(102), 제 2 외부 전자 장치(104), 또는 서버(106)) 간의 통신을 설정할 수 있다. 예를 들면, 통신 인터페이스(170)는 무선 통신 또는 유선 통신을 통해서 네트워크(162)에 연결되어 외부 장치(예: 제 2 외부 전자 장치(104) 또는 서버(106))와 통신할 수 있다.
무선 통신은, 예를 들면, LTE, LTE-A(LTE Advance), CDMA(code division multiple access), WCDMA(wideband CDMA), UMTS(universal mobile telecommunications system), WiBro(Wireless Broadband), 또는 GSM(Global System for Mobile Communications) 등 중 적어도 하나를 사용하는 셀룰러 통신을 포함할 수 있다. 한 실시예에 따르면, 무선 통신은, 예를 들면, WiFi(wireless fidelity), 블루투스, 블루투스 저전력(BLE), 지그비(Zigbee), NFC(near field communication), 자력 시큐어 트랜스미션(Magnetic Secure Transmission), 라디오 프리퀀시(RF), 또는 보디 에어리어 네트워크(BAN) 중 적어도 하나를 포함할 수 있다. 한실시예에 따르면, 무선 통신은 GNSS를 포함할 수 있다. GNSS는, 예를 들면, GPS(Global Positioning System), Glonass(Global Navigation Satellite System), Beidou Navigation Satellite System(이하 "Beidou") 또는 Galileo, the European global satellite-based navigation system일 수 있다. 이하, 본 문서에서는, "GPS"는 "GNSS"와 상호 호환적으로 사용될 수 있다. 유선 통신은, 예를 들면, USB(universal serial bus), HDMI(high definition multimedia interface), RS-232(recommended standard232), 전력선 통신, 또는 POTS(plain old telephone service) 등 중 적어도 하나를 포함할 수 있다. 네트워크(162)는 텔레커뮤니케이션 네트워크, 예를 들면, 컴퓨터 네트워크(예: LAN 또는 WAN), 인터넷, 또는 텔레폰 네트워크 중 적어도 하나를 포함할 수 있다.
제 1 및 제 2 외부 전자 장치(102, 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 다양한 실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 다른 하나 또는 복수의 전자 장치(예: 전자 장치(102,104), 또는 서버(106)에서 실행될 수 있다. 한 실시예에 따르면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로 또는 요청에 의하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 그와 연관된 적어도 일부 기능을 다른 장치(예: 전자 장치(102, 104), 또는 서버(106))에게 요청할 수 있다. 다른 전자 장치(예: 전자 장치(102, 104), 또는 서버(106))는 요청된 기능 또는 추가 기능을 실행하고, 그 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 수신된 결과를 그대로 또는 추가적으로 처리하여 요청된 기능이나 서비스를 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다.
본 발명의 다양한 실시예에서, 전자 장치(101)는, 메모리(130) 및 상기 메모리에 저장된 제1 블록 및 제2 블록을 포함하는 데이터를 압축하여 압축 데이터를 생성하는 프로세서(120)를 포함할 수 있다. 프로세서(120)는, 상기 압축 데이터에 상기 제1 블록에 포함된 제1 서브 데이터(예를 들어, 심볼(symbol)들)에 대한 제1 빈도수들의 순위(또는 확률)에 적어도 기반하여 생성된, 상기 제1 서브 데이터에 대응하는 제1 대체 데이터 테이블을 포함시키고, 상기 제2 블록에 포함된 제2 서브 데이터 및 상기 제2 서브 데이터에 대한 제2 빈도수들의 순위가 상기 제1 블록에 포함된 상기 제1 서브 데이터 및 상기 제1 빈도수들의 순위와 지정된 조건을 만족할 경우, 상기 제2 블록에 대응하여 상기 제1 대체 데이터 테이블의 참조 정보를 포함시키도록 설정할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(120)는, 상기 제2 블록에 포함된 제2 서브 데이터 및 상기 제2 빈도수들의 순위가 상기 제1 블록에 포함된 상기 제1 서브 데이터 및 상기 제1 빈도수들의 순위와 지정된 범위 이상 동일하거나 유사한 경우, 상기 지정된 조건을 만족한 것으로 판단할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(120)는, 상기 압축 데이터 내에서 상기 제1 대체 데이터 테이블이 위치하는 인덱스 정보를 상기 제1 대체 데이터 테이블의 참조 정보로 지정할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(120)는, 상기 제2 블록에 대응하여 상기 제1 대체 데이터 테이블에 대한 적어도 하나의 변경 정보를 더 포함시킬 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(120)는, 상기 변경 정보는, 상기 제2 블록에 포함된 상기 제2 서브 데이터 및 상기 제2 빈도수들의 순위 중에서 상기 제1 블록에 포함된 상기 제1 서브 데이터 및 상기 제1 빈도수들의 순위가 상이한 서브 데이터에 대응하여 지정된 대체 데이터 값에 대한 변경 정보로 설정할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(120)는, 제1 서브 데이터에 대한 상기 제1 빈도수의 순위에 비례하여 상기 제1 서브 데이터에 지정된 대체 데이터의 길이가 결정되도록 설정할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(120)는, 엔트로피 가변 길이 코딩 방식으로 상기 데이터를 압축할 수 있고, 상기 데이터에 포함된 각각의 블록에 포함된 서브 데이터에 대한 빈도수들의 순위를 상기 엔트로피 가변 길이 코딩 방식의 확률 정보로 이용할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(120)는, 무손실 압축 방법을 이용하여 상기 제1 대체 데이터 테이블을 압축할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(120)는, 상기 제2 블록의 크기를 상기 제1 대체 데이터 테이블이 적용되는 범위에 따라 결정할 수 있고, 상기 제2 블록의 크기는 상기 제1 블록의 크기와 상이할 수 있다. 상기 프로세서(120)는, 상기 압축 데이터에 상기 제2 블록의 크기를 식별하기 위한 정보를 더 포함시킬 수 있다.
도 2는 다양한 실시예에 따른 전자 장치(201)의 블록도이다. 전자 장치(201)는, 예를 들면, 도 1에 도시된 전자 장치(101)의 전체 또는 일부를 포함할 수 있다. 전자 장치(201)는 하나 이상의 프로세서(예: AP)(210), 통신 모듈(220), (가입자 식별 모듈(224), 메모리(230), 센서 모듈(240), 입력 장치(250), 디스플레이(260), 인터페이스(270), 오디오 모듈(280), 카메라 모듈(291), 전력 관리 모듈(295), 배터리(296), 인디케이터(297), 및 모터(298) 를 포함할 수 있다. 프로세서(210)는, 예를 들면, 운영 체제 또는 응용 프로그램을 구동하여 프로세서(210)에 연결된 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 각종 데이터 처리 및 연산을 수행할 수 있다. 프로세서(210)는, 예를 들면, SoC(system on chip) 로 구현될 수 있다. 한 실시예에 따르면, 프로세서(210)는 GPU(graphic processing unit) 및/또는 이미지 신호 프로세서를 더 포함할 수 있다. 프로세서(210)는 도 2에 도시된 구성요소들 중 적어도 일부(예: 셀룰러 모듈(221))를 포함할 수도 있다. 프로세서(210) 는 다른 구성요소들(예: 비휘발성 메모리) 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드)하여 처리하고, 결과 데이터를 비휘발성 메모리에 저장할 수 있다.
통신 모듈(220)(예: 통신 인터페이스(170))와 동일 또는 유사한 구성을 가질 수 있다. 통신 모듈(220)은, 예를 들면, 셀룰러 모듈(221), WiFi 모듈(223), 블루투스 모듈(225), GNSS 모듈(227), NFC 모듈(228) 및 RF 모듈(229)를 포함할 수 있다. 셀룰러 모듈(221)은, 예를 들면, 통신망을 통해서 음성 통화, 영상 통화, 문자 서비스, 또는 인터넷 서비스 등을 제공할 수 있다. 한 실시예에 따르면, 셀룰러 모듈(221)은 가입자 식별 모듈(예: SIM 카드)(224)을 이용하여 통신 네트워크 내에서 전자 장치(201)의 구별 및 인증을 수행할 수 있다. 한 실시예에 따르면, 셀룰러 모듈(221)은 프로세서(210)가 제공할 수 있는 기능 중 적어도 일부 기능을 수행할 수 있다. 한 실시예에 따르면, 셀룰러 모듈(221)은 커뮤니케이션 프로세서(CP)를 포함할 수 있다. 어떤 실시예에 따르면, 셀룰러 모듈(221), WiFi 모듈(223), 블루투스 모듈(225), GNSS 모듈(227) 또는 NFC 모듈(228) 중 적어도 일부(예: 두 개 이상)는 하나의 integrated chip(IC) 또는 IC 패키지 내에 포함될 수 있다. RF 모듈(229)은, 예를 들면, 통신 신호(예: RF 신호)를 송수신할 수 있다. RF 모듈(229)은, 예를 들면, 트랜시버, PAM(power amp module), 주파수 필터, LNA(low noise amplifier), 또는 안테나 등을 포함할 수 있다. 다른 실시예에 따르면, 셀룰러 모듈(221), WiFi 모듈(223), 블루투스 모듈(225), GNSS 모듈(227) 또는 NFC 모듈(228) 중 적어도 하나는 별개의 RF 모듈을 통하여 RF 신호를 송수신할 수 있다. 가입자 식별 모듈(224)은, 예를 들면, 가입자 식별 모듈을 포함하는 카드 또는 임베디드 SIM을 포함할 수 있으며, 고유한 식별 정보(예: ICCID(integrated circuit card identifier)) 또는 가입자 정보(예: IMSI(international mobile subscriber identity))를 포함할 수 있다.
메모리(230)(예: 메모리(130))는, 예를 들면, 내장 메모리(232) 또는 외장 메모리(234)를 포함할 수 있다. 내장 메모리(232)는, 예를 들면, 휘발성 메모리(예: DRAM, SRAM, 또는 SDRAM 등), 비휘발성 메모리(예: OTPROM(one time programmable ROM), PROM, EPROM, EEPROM, mask ROM, flash ROM, 플래시 메모리, 하드 드라이브, 또는 솔리드 스테이트 드라이브 (SSD) 중 적어도 하나를 포함할 수 있다. 외장 메모리(234)는 플래시 드라이브(flash drive), 예를 들면, CF(compact flash), SD(secure digital), Micro-SD, Mini-SD, xD(extreme digital), MMC(multi-media card) 또는 메모리 스틱 등을 포함할 수 있다. 외장 메모리(234)는 다양한 인터페이스를 통하여 전자 장치(201)와 기능적으로 또는 물리적으로 연결될 수 있다.
센서 모듈(240)은, 예를 들면, 물리량을 계측하거나 전자 장치(201)의 작동 상태를 감지하여, 계측 또는 감지된 정보를 전기 신호로 변환할 수 있다. 센서 모듈(240)은, 예를 들면, 제스처 센서(240A), 자이로 센서(240B), 기압 센서(240C), 마그네틱 센서(240D), 가속도 센서(240E), 그립 센서(240F), 근접 센서(240G), 컬러(color) 센서(240H)(예: RGB(red, green, blue) 센서), 생체 센서(240I), 온/습도 센서(240J), 조도 센서(240K), 또는 UV(ultra violet) 센서(240M) 중의 적어도 하나를 포함할 수 있다. 추가적으로 또는 대체적으로, 센서 모듈(240)은, 예를 들면, 후각(e-nose) 센서, 일렉트로마이오그라피(EMG) 센서, 일렉트로엔씨팔로그램(EEG) 센서, 일렉트로카디오그램(ECG) 센서, IR(infrared) 센서, 홍채 센서 및/또는 지문 센서를 포함할 수 있다. 센서 모듈(240)은 그 안에 속한 적어도 하나 이상의 센서들을 제어하기 위한 제어 회로를 더 포함할 수 있다. 어떤 실시예에서는, 전자 장치(201)는 프로세서(210)의 일부로서 또는 별도로, 센서 모듈(240)을 제어하도록 구성된 프로세서를 더 포함하여, 프로세서(210)가 슬립(sleep) 상태에 있는 동안, 센서 모듈(240)을 제어할 수 있다.
입력 장치(250)는, 예를 들면, 터치 패널(252), (디지털) 펜 센서(254), 키(256), 또는 초음파 입력 장치(258)를 포함할 수 있다. 터치 패널(252)은, 예를 들면, 정전식, 감압식, 적외선 방식, 또는 초음파 방식 중 적어도 하나의 방식을 사용할 수 있다. 또한, 터치 패널(252)은 제어 회로를 더 포함할 수도 있다. 터치 패널(252)은 택타일 레이어(tactile layer)를 더 포함하여, 사용자에게 촉각 반응을 제공할 수 있다. (디지털) 펜 센서(254)는, 예를 들면, 터치 패널의 일부이거나, 별도의 인식용 쉬트를 포함할 수 있다. 키(256)는, 예를 들면, 하드웨어 버튼, 광학식 키, 또는 키패드를 포함할 수 있다. 초음파 입력 장치(258)는 마이크(예: 마이크(288))를 통해, 입력 도구에서 발생된 초음파를 감지하여, 상기 감지된 초음파에 대응하는 데이터를 확인할 수 있다.
디스플레이(260)(예: 디스플레이(160))는 패널(262), 홀로그램 장치(264), 프로젝터(266), 및/또는 이들을 제어하기 위한 제어 회로를 포함할 수 있다. 패널(262)은, 예를 들면, 유연하게, 투명하게, 또는 착용할 수 있게 구현될 수 있다. 패널(262)은 터치 패널(252)과 하나 이상의 모듈로 구성될 수 있다. 한 실시예에 따르면, 패널(262)은 사용자의 터치에 대한 압력의 세기를 측정할 수 있는 압력 센서(또는 포스 센서)를 포함할 수 있다. 상기 압력 센서는 터치 패널(252)과 일체형으로 구현되거나, 또는 터치 패널(252)과는 별도의 하나 이상의 센서로 구현될 수 있다. 홀로그램 장치(264)는 빛의 간섭을 이용하여 입체 영상을 허공에 보여줄 수 있다. 프로젝터(266)는 스크린에 빛을 투사하여 영상을 표시할 수 있다. 스크린은, 예를 들면, 전자 장치(201)의 내부 또는 외부에 위치할 수 있다. 인터페이스(270)는, 예를 들면, HDMI(272), USB(274), 광 인터페이스(optical interface)(276), 또는 D-sub(D-subminiature)(278)를 포함할 수 있다. 인터페이스(270)는, 예를 들면, 도 1에 도시된 통신 인터페이스(170)에 포함될 수 있다. 추가적으로 또는 대체적으로, 인터페이스(270)는, 예를 들면, MHL(mobile high-definition link) 인터페이스, SD카드/MMC(multi-media card) 인터페이스, 또는 IrDA(infrared data association) 규격 인터페이스를 포함할 수 있다.
오디오 모듈(280)은, 예를 들면, 소리와 전기 신호를 쌍방향으로 변환시킬 수 있다. 오디오 모듈(280)의 적어도 일부 구성요소는, 예를 들면, 도 1 에 도시된 입출력 인터페이스(145)에 포함될 수 있다. 오디오 모듈(280)은, 예를 들면, 스피커(282), 리시버(284), 이어폰(286), 또는 마이크(288) 등을 통해 입력 또는 출력되는 소리 정보를 처리할 수 있다. 카메라 모듈(291)은, 예를 들면, 정지 영상 및 동영상을 촬영할 수 있는 장치로서, 한 실시예에 따르면, 하나 이상의 이미지 센서(예: 전면 센서 또는 후면 센서), 렌즈, 이미지 시그널 프로세서(ISP), 또는 플래시(예: LED 또는 xenon lamp 등)를 포함할 수 있다. 전력 관리 모듈(295)은, 예를 들면, 전자 장치(201)의 전력을 관리할 수 있다. 한 실시예에 따르면, 전력 관리 모듈(295)은 PMIC(power management integrated circuit), 충전 IC, 또는 배터리 또는 연료 게이지를 포함할 수 있다. PMIC는, 유선 및/또는 무선 충전 방식을 가질 수 있다. 무선 충전 방식은, 예를 들면, 자기공명 방식, 자기유도 방식 또는 전자기파 방식 등을 포함하며, 무선 충전을 위한 부가적인 회로, 예를 들면, 코일 루프, 공진 회로, 또는 정류기 등을 더 포함할 수 있다. 배터리 게이지는, 예를 들면, 배터리(296)의 잔량, 충전 중 전압, 전류, 또는 온도를 측정할 수 있다. 배터리(296)는, 예를 들면, 충전식 전지 및/또는 태양 전지를 포함할 수 있다.
인디케이터(297)는 전자 장치(201) 또는 그 일부(예: 프로세서(210))의 특정 상태, 예를 들면, 부팅 상태, 메시지 상태 또는 충전 상태 등을 표시할 수 있다. 모터(298)는 전기적 신호를 기계적 진동으로 변환할 수 있고, 진동, 또는 햅틱 효과 등을 발생시킬 수 있다. 전자 장치(201)는, 예를 들면, DMB(digital multimedia broadcasting), DVB(digital video broadcasting), 또는 미디어플로(mediaFloTM) 등의 규격에 따른 미디어 데이터를 처리할 수 있는 모바일 TV 지원 장치(예: GPU)를 포함할 수 있다. 본 문서에서 기술된 구성요소들 각각은 하나 또는 그 이상의 부품(component)으로 구성될 수 있으며, 해당 구성요소의 명칭은 전자 장치의 종류에 따라서 달라질 수 있다. 다양한 실시예에서, 전자 장치(예: 전자 장치(201))는 일부 구성요소가 생략되거나, 추가적인 구성요소를 더 포함하거나, 또는, 구성요소들 중 일부가 결합되어 하나의 개체로 구성되되, 결합 이전의 해당 구성요소들의 기능을 동일하게 수행할 수 있다.
본 발명의 다양한 실시예에서, 전자 장치(201)(또는, 전자 장치(101))는, 통신 회로(예를 들어, 통신 모듈(220)) 및 상기 메모리에 저장된 제1 블록 및 제2 블록을 포함하는 데이터를 압축하여 압축 데이터를 생성하는 프로세서(210)를 포함할 수 있다. 상기 프로세서(210)는, 상기 압축 데이터에 상기 제1 블록에 포함된 제1 서브 데이터에 대한 제1 빈도수들의 순위에 적어도 기반하여 생성된, 상기 제1 서브 데이터에 대응하는 제1 대체 데이터 테이블을 포함시키고, 상기 제2 블록에 포함된 제2 서브 데이터 및 상기 제2 서브 데이터에 대한 제2 빈도수들의 순위가 상기 제1 블록에 포함된 상기 제1 서브 데이터 및 상기 제1 빈도수들의 순위와 지정된 조건을 만족할 경우, 상기 제2 블록에 대응하여 상기 제1 대체 데이터 테이블의 참조 정보를 포함시킬 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(210)는, 상기 제2 블록에 포함된 제2 서브 데이터 및 상기 제2 빈도수들의 순위가 상기 제1 블록에 포함된 상기 제1 서브 데이터 및 상기 제1 빈도수들의 순위와 지정된 범위 이상 동일하거나 유사할 경우, 상기 지정된 조건을 만족한 것으로 판단할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(210)는, 상기 압축 데이터 내에서 상기 제1 대체 데이터 테이블이 위치하는 인덱스 정보를 상기 제1 대체 데이터 테이블의 참조 정보로 지정할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(210)는, 상기 제2 블록에 대응하여 상기 제1 대체 데이터 테이블에 대한 적어도 하나의 변경 정보를 더 포함시킬 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(210)는, 상기 제2 블록에 포함된 상기 제2 서브 데이터 및 상기 제2 빈도수들의 순위 중에서 상기 제1 블록에 포함된 상기 제1 서브 데이터 및 상기 제1 빈도수들의 순위가 상이한 서브 데이터에 대응하여 지정된 대체 데이터 값에 대한 변경 정보로 상기 변경 정보를 지정할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(210)는, 제1 서브 데이터에 대한 상기 제1 빈도수의 순위에 비례하여 상기 제1 서브 데이터에 지정된 대체 데이터의 길이가 결정되도록 설정할 수 있다. 예를 들어, A 심볼에 대한 빈도수의 순위가 2위이고, B 심볼에 대한 빈도수의 순위가 3위인 경우, A 심볼에 지정된 대체 데이터(예를 들어, 10)의 길이는 2이고, B 심볼에 지정된 대체 데이터(예를 들어, 110)의 길이는 3이 될 수 있다. 여기서 비례는 절대 순위 수치와 대체 데이터 길이 간의 관계를 의미한다.
본 발명의 다양한 실시예에서, 상기 프로세서(210)는, 엔트로피 가변 길이 코딩 방식으로 상기 데이터를 압축할 수 있고, 상기 데이터에 포함된 각각의 블록에 포함된 서브 데이터에 대한 빈도수들의 순위를 상기 엔트로피 가변 길이 코딩 방식의 확률 정보로 이용할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(210)는, 무손실 압축 방법을 이용하여 상기 제1 대체 데이터 테이블을 압축할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(210)는, 상기 제1 대체 데이터 테이블이 적용되는 범위에 따라 상기 제2 블록의 크기를 결정할 수 있고, 상기 제2 블록의 크기는 상기 제1 블록의 크기와 상이할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(210)는, 상기 압축 데이터에 상기 제2 블록의 크기를 식별하기 위한 정보를 포함시킬 수 있다.
본 발명의 다양한 실시예에서, 전자 장치(201)(또는, 전자 장치(101))는, 통신 회로(예를 들어, 통신 모듈(220)); 및 프로세서(210)를 포함할 수 있다. 상기 프로세서(210)는, 전송 대상 데이터의 송신이 요청되면, 상기 전송 데이터를 인코딩한 제1 인코딩 데이터 및 상기 제1 인코딩 데이터의 디코딩을 위한 제1 추가 데이터를 포함하는, 제1 크기의 제1 데이터를 송신하고, 상기 제1 데이터를 송신한 이후에 상기 전송 대상 데이터의 재송신이 요청되면, 상기 제1 인코딩 데이터 및 상기 제1 인코딩 데이터의 디코딩을 위한 제2 추가 데이터를 포함하는, 제2 크기의 제2 데이터를 송신하고, 상기 제2 크기는 상기 제1 크기보다 작은 것일 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서(210)는, 상기 제1 추가 데이터에 상기 전송 데이터에 포함된 제1 서브 데이터에 대한 제1 빈도수들의 순위에 적어도 기반하여 생성된, 상기 제1 서브 데이터에 대응하는 제1 대체 데이터 테이블을 포함시키고, 상기 제2 추가 데이터에 상기 제1 대체 데이터 테이블의 참조 정보를 포함시킬 수 있다.
도 3은 다양한 실시예에 따른 프로그램 모듈의 블록도이다. 한 실시예에 따르면, 프로그램 모듈(310)(예: 프로그램(140))은 전자 장치(예: 전자 장치(101))에 관련된 자원을 제어하는 운영 체제 및/또는 운영 체제 상에서 구동되는 다양한 어플리케이션(예: 어플리케이션 프로그램(147))을 포함할 수 있다. 운영 체제는, 예를 들면, AndroidTM, iOSTM, WindowsTM, SymbianTM, TizenTM, 또는 BadaTM를 포함할 수 있다. 도 3을 참조하면, 프로그램 모듈(310)은 커널(320)(예: 커널(141)), 미들웨어(330)(예: 미들웨어(143)), (API(360)(예: API(145)), 및/또는 어플리케이션(370)(예: 어플리케이션 프로그램(147))을 포함할 수 있다. 프로그램 모듈(310)의 적어도 일부는 전자 장치 상에 프리로드 되거나, 외부 전자 장치(예: 전자 장치(102, 104), 서버(106) 등)로부터 다운로드 가능하다.
커널(320)은, 예를 들면, 시스템 리소스 매니저(321) 및/또는 디바이스 드라이버(323)를 포함할 수 있다. 시스템 리소스 매니저(321)는 시스템 리소스의 제어, 할당, 또는 회수를 수행할 수 있다. 한 실시예에 따르면, 시스템 리소스 매니저(321)는 프로세스 관리부, 메모리 관리부, 또는 파일 시스템 관리부를 포함할 수 있다. 디바이스 드라이버(323)는, 예를 들면, 디스플레이 드라이버, 카메라 드라이버, 블루투스 드라이버, 공유 메모리 드라이버, USB 드라이버, 키패드 드라이버, WiFi 드라이버, 오디오 드라이버, 또는 IPC(inter-process communication) 드라이버를 포함할 수 있다. 미들웨어(330)는, 예를 들면, 어플리케이션(370)이 공통적으로 필요로 하는 기능을 제공하거나, 어플리케이션(370)이 전자 장치 내부의 제한된 시스템 자원을 사용할 수 있도록 API(360)를 통해 다양한 기능들을 어플리케이션(370)으로 제공할 수 있다. 한 실시예에 따르면, 미들웨어(330) 는 런타임 라이브러리(335), 어플리케이션 매니저(341), 윈도우 매니저(342), 멀티미디어 매니저(343), 리소스 매니저(344), 파워 매니저(345), 데이터베이스 매니저(346), 패키지 매니저(347), 커넥티비티 매니저(348), 노티피케이션 매니저(349), 로케이션 매니저(350), 그래픽 매니저(351), 또는 시큐리티 매니저(352) 중 적어도 하나를 포함할 수 있다.
런타임 라이브러리(335)는, 예를 들면, 어플리케이션(370)이 실행되는 동안에 프로그래밍 언어를 통해 새로운 기능을 추가하기 위해 컴파일러가 사용하는 라이브러리 모듈을 포함할 수 있다. 런타임 라이브러리(335)는 입출력 관리, 메모리 관리, 또는 산술 함수 처리를 수행할 수 있다. 어플리케이션 매니저(341)는, 예를 들면, 어플리케이션(370)의 생명 주기를 관리할 수 있다. 윈도우 매니저(342)는 화면에서 사용되는 GUI 자원을 관리할 수 있다. 멀티미디어 매니저(343)는 미디어 파일들의 재생에 필요한 포맷을 파악하고, 해당 포맷에 맞는 코덱을 이용하여 미디어 파일의 인코딩 또는 디코딩을 수행할 수 있다. 리소스 매니저(344)는 어플리케이션(370)의 소스 코드 또는 메모리의 공간을 관리할 수 있다. 파워 매니저(345)는, 예를 들면, 배터리의 용량 또는 전원을 관리하고, 전자 장치의 동작에 필요한 전력 정보를 제공할 수 있다. 한 실시예에 따르면, 파워 매니저(345)는 바이오스(BIOS: basic input/output system)와 연동할 수 있다. 데이터베이스 매니저(346)는, 예를 들면, 어플리케이션(370)에서 사용될 데이터베이스를 생성, 검색, 또는 변경할 수 있다. 패키지 매니저(347)는 패키지 파일의 형태로 배포되는 어플리케이션의 설치 또는 갱신을 관리할 수 있다.
커넥티비티 매니저(348)는, 예를 들면, 무선 연결을 관리할 수 있다. 노티피케이션 매니저(349)는, 예를 들면, 도착 메시지, 약속, 근접성 알림 등의 이벤트를 사용자에게 제공할 수 있다. 로케이션 매니저(350)는, 예를 들면, 전자 장치의 위치 정보를 관리할 수 있다. 그래픽 매니저(351)는, 예를 들면, 사용자에게 제공될 그래픽 효과 또는 이와 관련된 사용자 인터페이스를 관리할 수 있다. 보안 매니저(352)는, 예를 들면, 시스템 보안 또는 사용자 인증을 제공할 수 있다. 한 실시예에 따르면, 미들웨어(330)는 전자 장치의 음성 또는 영상 통화 기능을 관리하기 위한 통화(telephony) 매니저 또는 전술된 구성요소들의 기능들의 조합을 형성할 수 있는 하는 미들웨어 모듈을 포함할 수 있다. 한 실시예에 따르면, 미들웨어(330)는 운영 체제의 종류 별로 특화된 모듈을 제공할 수 있다. 미들웨어(330)는 동적으로 기존의 구성요소를 일부 삭제하거나 새로운 구성요소들을 추가할 수 있다. API(360)는, 예를 들면, API 프로그래밍 함수들의 집합으로, 운영 체제에 따라 다른 구성으로 제공될 수 있다. 예를 들면, 안드로이드 또는 iOS의 경우, 플랫폼 별로 하나의 API 셋을 제공할 수 있으며, 타이젠의 경우, 플랫폼 별로 두 개 이상의 API 셋을 제공할 수 있다.
어플리케이션(370)은, 예를 들면, 홈(371), 다이얼러(372), SMS/MMS(373), IM(instant message)(374), 브라우저(375), 카메라(376), 알람(377), 컨택트(378), 음성 다이얼(379), 이메일(380), 달력(381), 미디어 플레이어(382), 앨범(383), 와치(384), 헬스 케어(예: 운동량 또는 혈당 등을 측정), 또는 환경 정보(예: 기압, 습도, 또는 온도 정보) 제공 어플리케이션을 포함할 수 있다. 한 실시예에 따르면, 어플리케이션(370)은 전자 장치와 외부 전자 장치 사이의 정보 교환을 지원할 수 있는 정보 교환 어플리케이션을 포함할 수 있다. 정보 교환 어플리케이션은, 예를 들면, 외부 전자 장치에 특정 정보를 전달하기 위한 노티피케이션 릴레이 어플리케이션, 또는 외부 전자 장치를 관리하기 위한 장치 관리 어플리케이션을 포함할 수 있다. 예를 들면, 알림 전달 어플리케이션은 전자 장치의 다른 어플리케이션에서 발생된 알림 정보를 외부 전자 장치로 전달하거나, 또는 외부 전자 장치로부터 알림 정보를 수신하여 사용자에게 제공할 수 있다. 장치 관리 어플리케이션은, 예를 들면, 전자 장치와 통신하는 외부 전자 장치의 기능(예: 외부 전자 장치 자체(또는, 일부 구성 부품)의 턴-온/턴-오프 또는 디스플레이의 밝기(또는, 해상도) 조절), 또는 외부 전자 장치에서 동작하는 어플리케이션을 설치, 삭제, 또는 갱신할 수 있다. 한 실시예에 따르면, 어플리케이션(370)은 외부 전자 장치의 속성에 따라 지정된 어플리케이션(예: 모바일 의료 기기의 건강 관리 어플리케이션)을 포함할 수 있다. 한 실시예에 따르면, 어플리케이션(370)은 외부 전자 장치로부터 수신된 어플리케이션을 포함할 수 있다. 프로그램 모듈(310)의 적어도 일부는 소프트웨어, 펌웨어, 하드웨어(예: 프로세서(210)), 또는 이들 중 적어도 둘 이상의 조합으로 구현(예: 실행)될 수 있으며, 하나 이상의 기능을 수행하기 위한 모듈, 프로그램, 루틴, 명령어 세트 또는 프로세스를 포함할 수 있다.
본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구성된 유닛을 포함하며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. "모듈"은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수 있다. "모듈"은 기계적으로 또는 전자적으로 구현될 수 있으며, 예를 들면, 어떤 동작들을 수행하는, 알려졌거나 앞으로 개발될, ASIC(application-specific integrated circuit) 칩, FPGAs(field-programmable gate arrays), 또는 프로그램 가능 논리 장치를 포함할 수 있다. 다양한 실시예에 따른 장치(예: 모듈들 또는 그 기능들) 또는 방법(예: 동작들)의 적어도 일부는 프로그램 모듈의 형태로 컴퓨터로 판독 가능한 저장 매체(예: 메모리(130))에 저장된 명령어로 구현될 수 있다. 상기 명령어가 프로세서(예: 프로세서(120))에 의해 실행될 경우, 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다. 컴퓨터로 판독 가능한 기록 매체는, 하드디스크, 플로피디스크, 마그네틱 매체(예: 자기테이프), 광기록 매체(예: CD-ROM, DVD, 자기-광 매체 (예: 플롭티컬 디스크), 내장 메모리 등을 포함할 수 있다. 명령어는 컴파일러에 의해 만들어지는 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 다양한 실시예에 따른 모듈 또는 프로그램 모듈은 전술한 구성요소들 중 적어도 하나 이상을 포함하거나, 일부가 생략되거나, 또는 다른 구성요소를 더 포함할 수 있다. 다양한 실시예에 따른, 모듈, 프로그램 모듈 또는 다른 구성요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱하게 실행되거나, 적어도 일부 동작이 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.
도 4는 본 발명의 다양한 실시예에 따른 전자 장치(101)의 동작 방법을 설명하기 위한 흐름도이다. 전자 장치(101)는 메모리(130) 및 프로세서(120)를 포함할 수 있고, 메모리(130)는 다수의 블록(예를 들어, 제1 블록, 제2 블록 등)을 포함한 데이터를 저장할 수 있으며, 프로세서(120)는 상기 메모리에 저장된 데이터를 압축하여 압축 데이터를 생성할 수 있다. 다양한 실시예에 따른 프로세서(120)는 블록 단위로 데이터를 처리할 수 있으며, 예를 들어 확률 기반 엔트로피 코딩 시 블록 단위로 확률 정보를 확인할 수 있고, 블록 단위로 코드북 또는 확률 테이블을 업데이트할 수도 있으며, 블록 단위로 데이터를 압축할 수도 있다. 도 4에서 동일한 용어인 '블록' 단위로 확률 정보 확인 또는 데이터 압축을 설명하고 있으나, 확률 정보를 확인하기 위한 데이터 처리 단위와 데이터를 압축하기 위한 데이터 처리 단위가 동일할 필요는 없고, 다양한 실시예에서 제한 없이 다르게 구현될 수 있다. 구현 예시에 따라, 코딩 윈도우(window)라고 명명될 수도 있고, 다양하게 정의 및 표현될 수 있다.
410 동작에서, 전자 장치(101)(또는, 프로세서(120) 또는 프로세서(210))는, 제1 블록에 포함된 제1 서브 데이터에 대한 제1 빈도수들을 확인할 수 있다. 제1 서브 데이터는 제1 블록에 포함된 데이터를 식별하기 위한 최소 단위 또는 문맥상 단위로 구분된 데이터일 수 있다. 예를 들어, 제1 블록에 포함된 심볼(symbol)들이 제1 서브 데이터를 구성할 수 있다. 심볼(symbol)은 공백, 숫자, 영문자, 한글자, 도형 등을 포함하는 식별 데이터를 의미할 수 있다. 이하에서는, 제1 서브 데이터 또는 제2 서브 데이터를 '심볼'이라 지칭할 수도 있다. 다양한 실시예에 따른 전자 장치(101)는, 해당 블록에서 각각의 심볼이 발생하는 횟수(count)를 확인하여 각각의 빈도수(frequency)들을 산출하여, 제1 블록에 포함된 제1 서브 데이터에 대한 제1 빈도수들을 확인할 수 있다. 전자 장치(101)는 예시적으로 각 심볼 및 각 심볼에 대한 빈도수를 확률 테이블로 표현할 수도 있고, 후술할 도 6a에서 상세히 설명하고자 한다.
420 동작에서, 전자 장치(101)는, 상기 제1 빈도수들의 순위에 적어도 기반하여, 상기 제1 서브 데이터에 대응하는 대체 데이터를 지정한 제1 대체 데이터 테이블을 생성할 수 있다. 각 빈도수의 순위는 각 서브 데이터가 해당 블록에서 발생할 확률을 의미할 수 있다. 예를 들어, 제1 블록에서 심볼 'A'에 대한 빈도수의 순위가 1위이고, 심볼 'B'에 대한 빈도수의 순위가 4위로 확인된 경우, 제1 블록에서 심볼 'A'가 발생할 확률이 심볼 'B'가 발생할 확률보다 크다는 것을 의미할 수 있다. 나아가, 상기 예시에 따라 제1 블록을 가변 길이 엔트로피 코딩에 따라 부호화하는 경우, 심볼 'A'에 지정되는 대체 데이터의 길이는 심볼 'B'에에 지정되는 대체 데이터의 길이보다 짧은 것으로 지정될 수 있다. 다양한 실시예에 따른 전자 장치(101)는, 심볼에 대한 확률을 기반으로 해당 심볼에 대응하는 대체 데이터 예를 들어, 이진 코드(binary data)를 지정할 수 있다. 대체 데이터 테이블은, 해당 블록에 포함된 심볼 및 각 심볼에 지정된 대체 데이터들의 관계를 나타낼 수 있다. 전자 장치(101)는, 제1 블록에 포함된 모든 심볼들에 대하여, 즉 제1 서브 데이터에 대하여 해당 서브 데이터의 빈도수 순위에 근거하여 각각의 대체 데이터를 지정하여 제1 대체 데이터 테이블을 생성할 수 있다.
430 동작에서, 전자 장치(101)는, 상기 제1 블록에 대하여 상기 압축 데이터에 상기 제1 대체 데이터 테이블을 포함시킬 수 있다. 대체 데이터 테이블은, 구현에 따라, 코드북(codebook)이라 명명될 수도 있다. 데이터를 압축한 압축 데이터는 해당 데이터를 부호화한 데이터와 함께 해당 데이터를 복호화할 때 필요한 정보를 더 포함할 수 있다. 예를 들어, 대체 데이터 테이블 정보는 복호화시에 요구되는 정보일 수 있으며, 대체 데이터 테이블 정보는 압축 데이터에 포함될 수 있다.
440 동작에서, 전자 장치(101)는, 제2 블록에 포함된 제2 서브 데이터에 대한 제2 빈도수들을 확인할 수 있다. 제2 블록에 포함된 제2 서브 데이터는 제1 블록에 포함된 제1 서브 데이터와 동일한 종류의 심볼일 수 있으며, 제1 블록에 포함된 제1 서브 데이터의 빈도수들을 확인한 것과 마찬가지로, 제2 서브 데이터를 구성하는 심볼마다 발생 횟수를 확인하여 제2 빈도수들을 확인할 수 있다. 예를 들어, 도 6a와 같이 제2 블록에 대하여 확률 테이블을 생성할 수 있다.
450 동작에서, 전자 장치(101)는, 상기 제2 블록에 포함된 제2 서브 데이터 및 상기 제2 빈도수들의 순위가 상기 제1 블록에 포함된 제1 서브 데이터 및 상기 제1 빈도수들의 순위와 지정된 조건을 만족하는지 판단할 수 있다. 후술할 도 6a와 같이, 제1 블록에 대하여 제1 확률 테이블을 생성하고, 제2 블록에 대하여 제2 확률 테이블을 생성하여, 제1 확률 테이블 및 제2 확률 테이블을 비교함으로써 심볼의 종류가 동일한지, 심볼의 종류가 일부 동일한지, 또는 심볼의 종류가 상이한지를 판단할 수 있고, 동일 심볼에 대하여 확률에 따른 빈도수의 순위가 동일한지 또는 상이한지를 판단할 수 있다. 예를 들어, 제1 블록에 포함된 심볼이 {A, B, C, D}이고, 각 심볼에 대한 빈도수들의 순위가 순서대로 A,B,D,C 인 경우에, 제2 블록에 포함된 심볼이 {A, B, C, D}이고, 각 심볼에 대한 빈도수들의 순위가 순서대로 A, B, D, C라면, 제1 블록과 제2 블록은 심볼 및 심볼에 대한 빈도수들의 순위가 동일하다고 판단할 수 있고, 두 개의 블록 내에 발생 심볼 및 심볼에 대한 확률의 순위가 동일하다고 판단할 수 있다. 전체 발생 심볼 중 상이한 심볼의 개수가 압축 효율상 무시해도 좋은 통계적인 수치에 따라 정해진 임계값 이내인 경우 발생 심볼이 '유사하다' 및 심볼에 대한 빈도수들의 순위가 '유사하다'고 표현할 수 있다. 예를 들어, 제3 블록에 포함된 심볼이 {A, B, C, F}이고, 각 심볼에 대한 빈도수들의 순위가 순서대로 A, B, F, C인 경우에는, 제1 블록과 제3 블록은 발생 심볼 및 심볼에 대한 확률이 유사하다고 판단할 수 있다. 이러한 경우 F의 확률 값의 정도에 따라 제3 블록의 대체 데이터 테이블 대신 제1 블록의 인덱스 정보만을 보내고 F를 D로 디코딩할 수 있으며, 이는 F의 낮은 확률로 인해 전체 결과값에 영향을 적게 미칠 수 있다. 하지만, 이 경우엔 손실 압축이 된다. 만일 F의 확률 조차 크다고 하면 이때는 제일 블록의 인덱스 및 D와 F간의 변경 정보만으로 제3 블록의 대체 데이터를 만들 수 있다. 또 다른 예를 들어, 제4 블록에 포함된 심볼이 {A, B, C, F}이고, 각 심볼에 대한 빈도수들의 순위가 순서대로 F, C, A, B 인 경우 제1 블록과 제4 블록은 발생 심볼은 유사하나, 심볼에 대한 확률이 상이하다고 판단할 수 있다. 제5 블록에 포함된 심볼이 {A, *, X, Y}이고, 각 심볼에 대한 빈도수들의 순위가 순서대로 *, X, Y, A 인 경우 제1 블록과 제5 블록은 발생 심볼이 상이하고, 심볼에 대한 확률도 상이하다고 판단할 수 있다. 이러한 경우, 제5 블록에 대하여 제1 블록 내지 제4 블록의 대체 데이터 테이블을 재사용하지 않고, 제5 블록에 대한 새로운 대체 데이터 테이블을 생성할 수 있다.
제6 블록에 포함된 심볼의 종류가 27개이고, 제7 블록에 포함된 심볼의 종류가 26개인데, 제7 블록에 포함된 심볼은 제6 블록에 포함된 심볼 중 하나를 제외한 경우에는, 제6 블록과 제7 블록의 발생 심볼이 동일한 것으로 간주할 수 있다. 또한 제6 블록에 포함된 심볼의 빈도수들의 순위와 제7 블록에 포함된 심볼의 빈도수들의 순위가 제6 블록에만 포함된 심볼만 제외하고 동일한 경우에는 제6 블록에 대한 빈도수들의 순위와 제7 블록에 대한 빈도수들의 순위가 동일한 것으로 간주할 수 있다. 서로 다른 블록에 대해서 확률 테이블을 확인하고, 발생 심볼 및 심볼에 대한 빈도수들의 순위가 동일하거나, 동일하다고 간주된 경우, 및 지정된 범위 이상 유사한 경우에는 동일한 확률 테이블을 서로 다른 블록이 사용하여 부호화/복호화 할 수 있는 것으로, 압축 효율상 서로 다른 블록에 대하여 다른 확률 데이터를 포함시키는 것보다 서로 다른 블록에 대하여 동일 확률 테이블로 압축하는 것이 더 효율적인 것을 의미할 수 있다.
450 동작의 판단 결과, 제2 블록에 포함된 제2 서브 데이터와 상기 제2 서브 데이터에 대응하는 빈도수들의 순위가 제1 블록에 포함된 제1 서브 데이터와 상기 제1 서브 데이터에 대응하는 빈도수들의 순위가 지정된 조건을 만족할 경우 460 동작에서, 전자 장치(101)는, 상기 제2 블록에 대하여 상기 압축 데이터에 상기 제1 대체 데이터 테이블의 참조 정보를 포함시킬 수 있다. 다양한 실시예에 따른 전자 장치(101)는, 제2 블록에 포함된 제2 서브 데이터와 제1 블록에 포함된 제1 서브 데이터가 지정된 범위 이상 동일하거나 유사하며, 제2 블록에 포함된 제2 빈도수들의 순위가 제1 블록에 포함된 제1 빈도수들의 순위와 지정된 범위 이상 동일하거나 유사한 경우, 지정된 조건을 만족한 것으로 판단할 수 있다. 440 동작의 예로 설명하자면, 제1 블록과 제2 블록은 지정된 조건을 만족한 것에 해당하고, 제1 블록과 제3 블록도 지정된 조건을 만족한 것으로 판단할 수 있다. 제1 블록과 제4 블록은 지정된 조건을 만족하지 않은 것으로 판단할 수 있으며, 제1 블록과 제5 블록도 지정된 조건을 만족하지 않은 것으로 판단할 수 있다.
제2 블록에 포함된 제2 서브 데이터와 제1 블록에 포함된 제1 서브 데이터가 지정된 범위 이상 동일하거나 유사하고, 제2 블록에 포함된 제2 서브 데이터에 대응하는 빈도수들의 순위가 제1 블록에 포함된 제1 서브 데이터에 대응하는 빈도수들의 순위와 지정된 범위 이상 동일하거나 유사할 경우, 제1 블록에 대한 코드북을 제2 블록에서 재사용함으로써 제2 블록에 대한 압축 데이터 상에서 코드북으로 인한 불필요한 데이터 중복을 제거할 수 있다. 다양한 실시예에 따른 전자 장치(101)는, 압축 데이터 효율에 따라 지정된 범위를 설정할 수 있으며, 예를 들어, 95%이상 유사한 경우로 설정하거나, 97%이상 유사한 경우로 설정할 수도 있다.
코드북을 재사용하기 위한 예시로써, 다양한 실시예에 따른 전자 장치(101)는, 참조 정보는 제1 블록에 대하여 압축 데이터에 기 포함된 제1 대체 데이터 테이블의 위치를 나타내는 인덱스 정보로 설정할 수 있으며, 인덱스 정보는 제1 대체 데이터 테이블을 식별할 수 있는 정보라면 제한이 없음을 당업자는 용이하게 이해할 수 있을 것이다.
450 동작의 판단 결과, 제2 블록에 포함된 제2 서브 데이터와 상기 제2 서브 데이터에 대응하는 빈도수들의 순위가 제1 블록에 포함된 제1 서브 데이터와 상기 제1 서브 데이터에 대응하는 빈도수들의 순위가 지정된 조건을 만족하지 않는 경우, 470 동작에서, 전자 장치(101)는, 제2 블록에 포함된 제2 서브 데이터에 대한 제2 빈도수들의 순위에 적어도 기반하여, 상기 제2 서브 데이터에 대응하는 대체 데이터를 지정한 제2 대체 데이터 테이블을 생성할 수 있다. 제1 블록에서 사용했던 코드북을 제2 코드북에서 재사용할 수 없는 경우로써, 제2 블록에서 사용하기 위한 코드북을 생성하여 압축 데이터 상에 포함시킬 수 있다. 460 동작 및, 470 동작에서 제1 블록, 및 제2 블록을 대상으로 실시예를 설명하였으나, 제1 블록에 대한 코드북과 제2 블록에 대한 코드북은 차후에 처리되는 블록에서 또 다시 재사용될 수도 있다.
480 동작에서, 전자 장치(101)는, 상기 제2 블록에 대응하여 상기 압축 데이터에 상기 제2 대체 데이터 테이블을 포함시킬 수 있다. 이 경우에는, 압축 데이터는, 제 1 블록에 대응하는 제 1 대체 데이터 테이블, 제 2 블록에 대응하는 제 2 대체 데이터 테이블, 제 1 블록이 부호화된 데이터, 제 2 블록이 부호화된 데이터를 포함할 수 있다. 한편, 460 동작에 의하여 생성된 압축 데이터는, 제 1 블록에 대응하는 제 1 대체 데이터 테이블, 제 1 대체 데이터 테이블에 대한 참조 정보, 제 1 블록이 부호화된 데이터, 제 2 블록이 부호화된 데이터를 포함할 수 있다. 제 1 대체 데이터 테이블에 대한 참조 정보는, 제 2 대체 데이터 테이블보다 크기가 작을 수 있으므로, 이에 따라 전체 압축 데이터의 크기가 감소할 수 있다.
도 5는 다양한 실시예에 따른 다수의 블록을 포함하는 입력 데이터를 나타낸 개념도이다. 도 5를 참조하면, 입력 데이터는 동일한 크기의 블록 1(510), 블록 2(520), 블록 3(530), 블록 4(540), 블록 5(550), 블록 6(560), 및 블록 N(570)을 포함할 수 있다. 각 블록의 크기는 동일할 수 있으며, 다양한 실시예에 따른 전자 장치(101)는, 블록 마다 포함된 심볼, 해당 심볼에 대한 빈도수를 확인할 수 있으며, 각 블록 단위로 심볼 및 각 심볼에 대응하는 빈도수들의 순위를 비교할 수도 있다. 또는, 도 5와 달리, 입력 데이터를 구성하는 블록의 크기는 서로 다를 수 있으며, 후술할 도 11 및 도 12c에서 상세히 설명하고자 한다.
도 6a는 다양한 실시예에 따른 입력 데이터에 대한 확률 테이블의 예시이다. 예를 들어, 다양한 실시예에 따른 전자 장치(101)는, 도 5의 입력 데이터 중 한 블록에 대하여 도 6a와 같이 심볼(symbol), 빈도수(count), 확률(probability)을 포함하는 확률 테이블을 생성할 수 있다. 확률 테이블은 심볼의 값, 각 심볼의 발생 횟수, 해당 블록에서의 심볼의 발생 횟수에 대한 확률을 포함할 수 있다. 본 발명의 다양한 실시예에 따른 전자 장치(101)는, 한 블록 내에 전체 심볼의 종류는 6가지이고, 전체 심볼의 개수는 28개인 경우, 도 6a와 같이, 확률 테이블을 생성할 수 있다. 공백 심볼이 블록 내에 9번 확인되고, A 심볼이 블록 내에 5번 확인되고, @ 심볼이 블록 내에 3번 확인된 것을 알 수 있으며, 공백 심볼의 경우 0.321429 확률 값을 가지고, A 심볼의 경우 0.178571 확률 값을 가지고, @ 심볼의 경우 0.107143 확률 값을 가질 수 있다. 도 6a의 확률 테이블에서 발생 심볼은 {공백, A, B, 1, *, @}이고, 심볼에 대한 빈도수들의 순위는 순서대로 공백, *, A, 1, @, B (또는 공백, *, A, @, 1, B일 수 있으며, 1, @와 같이 빈도수의 순위가 동일한 경우 알파벳의 순서(심볼의 순서)에 따라 먼저 위치한 심볼을 높은 순위로 간주할 수 있다)를 확인할 수 있다.
본 발명의 다양한 실시예에 따른 전자 장치(101)는, 특정 블록의 심볼, 빈도수, 확률 등을 다른 블록의 심볼, 빈도수, 확률과 비교할 수 있다. 예를 들어, 도 6a의 확률 테이블을 기준으로 다른 블록에 대하여 산출된 확률 테이블을 비교함으로써, 각 블록에 대한 서브 데이터 및 서브 데이터에 대한 빈도수들의 순위를 비교할 수 있다. 제2 블록이 발생 심볼이 {공백, A, B, 1, *}이고, 심볼에 대한 빈도수들의 순위가 공백, * A, 1, B 인 경우 도 6a의 확률 테이블과 동일한 것으로 간주할 수 있다. 즉, 압축 효율상 도 6a의 확률 테이블(또는 코드북)을 제2블록에서 재사용하는 것이 효과적인 경우를 의미할 수 있다. 본 발명의 다양한 실시예에 따른 전자 장치(101)는, 블록 별로 확률 테이블을 기준으로 비교할 수도 있으며, 확률 테이블에 따라 지정된 대체 데이터 테이블을 기준으로 비교할 수도 있다. 대체 데이터 테이블은 후술할 도 7에서 상세하게 설명하도록 한다.
도 6b는 다양한 실시예에 따른 입력 데이터에 대한 블록별 확률 분포의 예시이다. 다양한 실시예에 따른 전자 장치(101)는, 6개의 블록(610, 620, 630, 640, 650, 660)을 포함하는 입력 데이터에 대하여, 확률 분포를 의미하는 기호를 블록 내에 도 6b와 같이 표현할 수 있다. 예를 들어, 도 5의 입력 데이터 중 510 블록 내지 560 블록에 대하여 블록 단위로 확률 분포를 산출한 것이 될 수 있다.
도 6b를 참고하면, 610 블록 및 630 블록은 동일한 기호로 블록이 표시되어 있고, 이것은 두 개의 블록이 발생 심볼 및 심볼에 대한 빈도수들의 순위가 지정된 조건을 만족하는 것을 의미할 수 있다. 그리고, 610 블록과 630 블록은 동일 또는 유사한 확률 분포를 가진다고 볼 수 있다. 다양한 실시예에 따른 전자 장치(101)는, 610 블록에 포함된 발생 심볼과 630 블록에 포함된 발생 심볼이 지정된 범위 이상 동일하거나 유사하고, 610 블록에 포함된 심볼에 대한 빈도수들의 순위와 630 블록에 포함된 심볼에 대한 빈도수들의 순위가 지정된 범위 이상 동일하거나 유사한 경우에 해당하여 지정된 조건을 만족하는 것을 예시한다. 따라서, 610 블록과 630 블록은 동일한 확률 테이블(또는 코드북)을 사용하여 가변 길이 엔트로피 코딩 방식에 따라 블록에 포함된 데이터를 압축할 수 있다. 동일한 확률 테이블을 이용하는 서로 다른 블록에 대해서, 압축 데이터 상에 확률 데이터를 중복하여 기재하지 않고, 다양한 실시예에 따른 전자 장치(101)는, 610 블록에 대하여 먼저 포함된 확률 테이블(또는 코드북)에 대한 참조 정보를 630 블록에 포함시킬 수 있다. 다시 말해, 본 발명의 다양한 실시예에 따른 전자 장치(101)는, 610 블록에 대하여 생성한 확률 테이블을 630 블록에 대하여 재사용하기 위해서, 610 블록에 대한 압축 데이터 상에 확률 테이블에 대한 참조 정보를 630 블록에 대한 압축 데이터 상에 포함시킬 수 있다. 확률 테이블 자체의 크기를 고려할 때, 610 블록 및 630 블록에서 동일한 확률 테이블을 이용하므로 610 블록에 대한 압축 데이터 상에서만 확률 테이블을 포함시킴으로써, 전체 압축 데이터 크기를 줄이는 효과를 가질 수 있다.
한편, 650 블록과 660 블록은 동일한 기호로 표시되어 있으므로, 확률 분포가 동일 또는 유사한 경우에 해당한다고 해석할 수 있다. 따라서, 다양한 실시예에 따른 전자 장치(101)는 650 블록에 대한 압축 데이터 상에 확률 테이블에 대한 참조 정보를 660 블록에 대한 압축 데이터 상에 포함시킬 수 있다. 나아가, 다양한 실시예에 따른 전자 장치(101)는 660 블록의 발생 심볼과 심볼에 대한 빈도수들의 순위가 650 블록의 발생 심볼과 심볼에 대한 빈도수들의 순위가 상이한 심볼에 대하여 변경 정보를 660 블록에 대한 압축 데이터 상에 더 포함시킬 수 있다. 다양한 실시예에 따른 전자 장치(101)는 두 개의 블록에 대해서 동일한 확률 분포를 가진다고 간주하고 동일한 확률 테이블을 생성할 수도 있다. 도 4를 참고하여 설명하자면, 450 동작에서 650 블록에 대한 서브 데이터 및 각 서브 데이터에 대한 빈도수들의 순위가 660 블록에 대한 서브 데이터 및 각 서브 데이터에 대한 빈도수들의 순위와 지정된 범위 이상 유사한 경우로서, 460 동작에서 660 블록에 대하여 압축 데이터 상에 650 블록에 포함된 대체 데이터 테이블에 대한 참조 정보를 포함시키고, 대체 데이터 테이블에서 일부 변경이 필요한 값에 대하여 변경 정보를 660 블록에 대한 압축 데이터 상에 더 포함시킬 수 있다. 즉, 전자 장치(101)는, 일부 확률 값이 다른 심볼에 대해서 변경 값을 지정함으로써 동일한 확률 테이블에 대하여 일부 값을 변경한 후 서로 다른 블록에서 동일한 확률 테이블을 재사용할 수 있다.
본 발명의 다양한 실시예에 따른 전자 장치(101)는, 도 6의 6개의 서로 다른 블록에 대하여, 확률 분포가 지정된 조건을 만족하는 경우 610 블록과 630 블록에서 확률 테이블을 재사용하고, 확률 분포가 지정된 조건을 만족하는 경우 650 블록과 660 블록에서 확률 테이블의 일부 값을 변경하여 재사용함으로써, 6개 블록 각각에 대하여 확률 테이블을 압축 데이터 상에 포함시킨 경우와 비교할 때, 압축 데이터 자체의 크기가 줄어드는 효과를 가질 수 있다.
도 7은 다양한 실시예에 따른 데이터에 대한 대체 데이터 테이블의 예시이다. 다양한 실시예에 따른 전자 장치(101)는, 블록에 포함된 심볼에 대응하는 빈도수들의 순위에 근거하여, 해당 심볼을 부호화 또는 복호화하기 위한 대체 데이터를 지정할 수 있다. 확률 기반 엔트로피 가변 길이 코딩 방식을 적용하여, 빈도수의 순위가 높은 경우 짧은 길이의 코드를 지정할 수 있고, 상대적으로 빈도수의 순위가 낮은 경우 긴 길이의 코드를 지정할 수 있다. 전자 장치(101)는, 가변 길이의 코드를 부여함으로써, 전체 부호화된 데이터량을 줄일 수 있다. 다양한 실시예에 따른 전자 장치(101)는, 블록 별로 도 7과 같은 대체 데이터 테이블을 생성할 수 있다. 예를 들어, 전자 장치(101)는, 제 1 블록에 대하여 제 1 대체 데이터 테이블을 생성할 수 있으며, 제 2 블록에 대하여 제 2 대체 데이터 테이블을 생성할 수 있다. 전자 장치(101)는, 제 1 대체 데이터 테이블을 제 2 대체 데이터 테이블과 비교할 수 있다. 전자 장치(101)는, 제 1 대체 데이터 테이블과 제 2 대체 데이터 테이블이 동일한 경우에는, 압축 데이터에 제 1 대체 데이터 테이블과, 제 1 대체 데이터 테이블에 대한 참조 정보만을 포함시킬 수 있다. 전자 장치(101)는, 제 1 대체 데이터 테이블과 제 2 대체 데이터 테이블이 유사한 경우에는, 압축 데이터에 제 1 대체 데이터 테이블과, 제 1 대체 데이터 테이블과 제 2 대체 데이터 테이블과의 차이에 대한 정보를 포함시킬 수도 있다. 예시적으로, 제1 대체 데이터 테이블이 도 7과 같고, 제2 대체 데이터 테이블 역시 도 7과 같은 경우 압축 데이터 상에 제1 블록에 대응하여 제1 대체 데이터 테이블을 포함시키고, 제2 블록에 대응해서는 제1 대체 데이터 테이블의 참조 정보 예를 들어 압축 데이터 상의 인덱스 값을 포함시킬 수 있다. 또는, 제1 대체 데이터 테이블이 도 7과 같고, 제2 대체 데이터 테이블은 도 7에서 'A' 심볼에 대한 대체 데이터 값(코드 값)이 110이고, 'B' 심볼에 대한 대체 데이터 값이 10인 경우, 제1 대체 데이터 테이블에서 'A' 심볼과 'B' 심볼의 값만을 변경하여 재사용할 수 있으므로, 본 발명의 다양한 실시예에 따른 전자 장치(101)는, 제1 블록에 대응하여 압축 데이터 상에 제1 대체 데이터 테이블을 포함시키고, 제2 블록에 대응하여 압축 데이터 상에 제1 대체 데이터 테이블에 대한 참조 정보 및 'A' 심볼과 'B' 심볼에 대한 변경된 코드 값을 지정한 변경 정보를 포함시킬 수 있다. 또는, 제 1 대체 데이터 테이블과 제 2 대체 데이터 테이블이 상이한 경우에는, 전자 장치(101)는, 제 1 대체 데이터 테이블 및 제 2 대체 데이터 테이블을 모두 압축 데이터상의 각 블록에 대응하여 포함시킬 수도 있다.
도 8은 다양한 실시예에 따른 압축 데이터의 개념도이다. 압축 데이터는 압축하기 이전 데이터를 전송하기 적합한 예를 들어 비트스트림의 형태로 변환하여 포함할 수 있고, 복호화를 위한 정보를 더 포함할 수 있다. 도 8을 참조하면, 압축 데이터(800)는 데이터를 부호화한 데이터 영역(820)과 데이터를 복호화할 때 필요한 정보를 포함하는 헤더 영역(810)을 포함할 수 있다. 헤더 영역(810)은 블록의 크기 정보, 부호화(또는 복호화)에 사용되는 대체 데이터 테이블 정보를 포함할 수 있다. 동일한 입력 데이터에 대하여 압축 기법에 따라 부호화 영역의 크기가 달라질 수 있다. 헤더 영역은 압축 기법의 효율성과 무관하게 크기가 결정될 수 있는데, 다양한 실시예에 따라 동일하거나 유사한 확률 분포를 가지는 블록에 대하여, 기 포함된 대체 데이터 테이블 정보를 참고하는 인덱스 정보만을 포함할 수 있다. 각 블록마다 대체 데이터 테이블을 모두 포함하는 것과 비교하면, 대체 데이터 테이블을 다수의 블록에서 재사용하고, 헤더 영역에 기 포함된 대체 데이터 테이블에 대한 참조 정보를 포함하고 있으므로 전체 압축 데이터 측면에서 데이터량의 크기가 작아질 수 있다.
다양한 실시예에 따라, 전자 장치(101)는, 헤더 영역에 포함된 확률 테이블 자체 또는 확률 정보에 기반하여 지정된 대체 데이터 테이블을 무손실 압축 방법에 따라 압축할 수 있다. 또는 현재 블록의 코드북이 이전 블록의 코드북과 거의 유사하고 심볼 중 적어도 한개가 낮은 확률의 특정 심볼로 대체가 된 경우엔 사용자의 선택에 따라서 이전 블록의 코드북을 그대로 사용하여 해당 특정 심볼을 이전 블록의 심볼 값으로 그냥 사용하여 압축 효율을 더 높일 수도 있다. 이 경우엔 엔트로피 코딩 자체에서 손실 압축이 발생한 경우이다.
도 9는 다양한 실시예에 따른 복수의 블록을 포함하는 압축 데이터의 예시이다. 압축 데이터는 910 블록 영역, 920 블록 영역, 930 블록 영역을 포함할 수 있고, 910 블록 영역은 헤더 영역(911) 및 데이터 영역(912)을 포함할 수 있다.
910 블록 영역에서 엔트로피 코딩 기술에 적용된 확률 분포가 920 블록 영역에서 동일하게 적용되는 경우, 920 블록 영역의 헤더 영역(921)에서 대체 데이터 테이블에 대한 정보를 직접 포함하지 않고, 910 블록 영역의 헤더 영역(911)에 기 포함된 대체 데이터 테이블을 참조하는 정보 즉, 인덱스 정보만을 포함할 수 있다. 대체 데이터 테이블을 직접 포함하지 않기 때문에 920 블록 영역의 헤더 영역(921)의 크기와 910 블록 영역의 헤더 영역(911)의 크기는 상대적으로 920 블록 영역의 헤더 영역(921)이 더 작다.
910 블록 영역에서 엔트로피 코딩 기술에 적용된 확률 분포가 930 블록 영역에서 지정된 범위 이상 동일하거나 유사한 경우, 910 블록 영역의 헤더 영역(911)에 저장된 대체 데이터 테이블에 대하여 일부 값만을 변경하여 사용할 수 있다. 또는 대체 데이터 테이블을 변경하지 않고 그대로 사용하여도 전체 압축 효율에 미미한 영향을 가져온다고 판단되며 손실 압축을 허용하는 경우엔 위에서처럼 인덱스만으로 대체 데이터 테이블을 참조 할 수도 있다. 930 블록 영역의 헤더 영역(931)에는 910 블록 영역의 헤더 영역(911)에 저장된 대체 데이터 테이블의 참조 정보를 포함하고, 930 블록 영역에서 변경하여 사용할 심볼 및 해당 심볼에 대한 대체 데이터 값을 추가로 포함할 수 있다. 930 블록 영역의 헤더 영역(931)의 크기와 910 블록 영역의 헤더 영역(911)의 크기는 상대적으로 930 블록 영역의 헤더 영역(931)이 작다.
압축 데이터에서 대체 데이터 테이블의 재사용률이 높을수록 전체 데이터량 측면에서 헤더 영역의 크기가 감소하기 때문에 궁극적으로 압축 효율이 커지는 효과를 가질 수 있다. 이는 대체 데이터 테이블(또는 확률 테이블)로 인한 불필요한 데이터 중복을 최소화한 것으로, 비용 측면에서도 데이터 전송량이 감소할수록 비용이 절감되어 효과적이다.
도 10은 본 발명의 다양한 실시예에 따른 전자 장치의 동작 방법을 설명하기 위한 흐름도이다.
1010 동작에서, 전자 장치(101)(또는, 프로세서(120) 또는 프로세서(210))는, 제1 블록에 포함된 제1 서브 데이터에 대한 제1 빈도수들을 확인할 수 있다.
1020 동작에서, 전자 장치(101)는, 제1 빈도수들의 순위에 적어도 기반하여, 상기 제1 서브 데이터에 대응하는 대체 데이터를 지정한 제1 대체 데이터 테이블을 생성할 수 있다.
1030 동작에서, 전자 장치(101)는, 제1 블록에 대하여 상기 압축 데이터에 상기 제1 대체 데이터 테이블을 포함할 수 있다. 예시적으로, 압축 데이터 내에 제1 블록을 부호화한 데이터 영역과 제1 블록을 복호화할 때 필요한 제1 대체 데이터 테이블을 포함한 헤더 영역을 포함할 수 있다.
1040 동작에서, 전자 장치(101)는, 제2 블록에 포함된 제2 서브 데이터에 대한 제2 빈도수들을 확인할 수 있다.
1050 동작에서, 전자 장치(101)는, 제2 블록에 포함된 제2 서브 데이터 및 상기 제2 빈도수들의 순위가 상기 제1 블록에 포함된 제1 서브 데이터 및 상기 제1 빈도수들의 순위와 지정된 조건을 만족하는지 판단할 수 있다. 미리 지정된 조건이란, 심볼 및 심볼에 대응하는 확률을 포함하는 확률 테이블을 기준으로 제1 블록에 대한 것과 제2 블록에 대한 것을 비교하여 임계 갯수 이상의 심볼에 대해서 확률이 동일한 경우 지정된 조건을 만족한 것으로 볼 수 있다. 다양한 실시예에서, 지정된 조건은 확률 정보를 기준으로 비교 판단하기 위해 기준이 다르게 지정될 수도 있다.
1050 동작의 판단 결과, 제2 블록에 포함된 제2 서브 데이터 및 제2 빈도수들의 순위가 제1 블록에 포함된 제1 서브 데이터 및 제1 빈도수들의 순위와 지정된 조건을 만족하는 경우에, 1060 동작에서, 제2 블록의 크기를 증가시킬 수 있다. 제2 블록의 크기를 가변함으로써 동일하거나 유사한 확률 분포를 가지는 블록에 대한 확률 테이블(또는 대체 데이터 테이블)을 재사용하는 범위를 확장할 수 있다. 이것은 동일하거나 유사한 확률 분포를 가지는 범위에 따라 블록의 크기가 결정되는 것을 의미할 수 있다. 여기서 블록의 크기는 확률 기반 엔트로피 코딩을 적용할 때 확률 정보를 이용하기 위한 단위를 의미하는 것으로, 데이터를 압축하기 위한 단위와 항상 동일한 것은 아니다.
1061 동작에서, 제2 블록에 포함된 제2 서브 데이터에 대한 제2 빈도수들을 확인한다. 즉, 크기가 증가된 부분에 대한 서브 데이터 및 빈도수를 확인하여 확률 테이블을 업데이트 할 수 있다. 상기 동작에서 업데이트된 확률 테이블을 기준으로 1062 동작에서 제1 블록의 확률 테이블과 지정된 조건을 만족하는지 판단할 수 있다.
1062 동작의 판단 결과, 제2 블록에 포함된 제2 서브 데이터 및 제2 빈도수들의 순위가 제1 블록에 포함된 제1 서브 데이터 및 제1 빈도수들의 순위와 지정된 조건을 만족하는 경우에, 다시 1060 동작에 따라 제2 블록의 크기를 증가시킬 수 있다. 확률 분포가 동일한 범위에 따라 제2 블록의 크기가 커지는 것을 나타낼 수 있다.
1062 동작의 판단 결과, 제2 블록에 포함된 제2 서브 데이터 및 제2 빈도수들의 순위가 제1 블록에 포함된 제1 서브 데이터 및 제1 빈도수들의 순위와 지정된 조건을 만족하지 않는 경우에는, 제2 블록의 크기를 증가시키지 않고, 제2 블록에 대하여 1050 동작에서 제1 블록에 포함된 제1 서브 데이터 및 제1 빈도수들과 지정된 조건을 만족하는 범위 내에서 제1 블록에 대응하여 압축 데이터에 기 포함된 제1 대체 데이터 테이블을 제2 블록에 대응해서도 재사용할 수 있다. 1063 동작에서, 제2 블록에 대하여 상기 압축 데이터에 상기 제1 대체 데이터 테이블의 참조 정보를 포함할 수 있다. 참조 정보는 제1 대체 데이터 테이블의 인덱스 정보 또는 제1 블록의 확률 테이블과 동일하다는 값이 될 수 있다. 제2 블록이 제1 블록에 연속되어 처리되는 경우 이전에 사용한 확률 테이블을 그대로 이용한다는 정보일 수도 있다.
1050 동작의 판단 결과, 제2 블록에 포함된 제2 서브 데이터 및 제2 빈도수들의 순위가 제1 블록에 포함된 제2 서브 데이터 및 제1 빈도수들의 순위와 지정된 조건을 만족하지 않는 경우에는, 상기 제2 빈도수들의 순위에 적어도 기반하여, 상기 제2 서브 데이터에 대응하는 대체 데이터를 지정한 제2 대체 데이터 테이블을 생성할 수 있다. 제1 대체 데이터 테이블과 제2 대체 데이터 테이블은 상이한 것으로, 제1 대체 데이터 테이블을 제2 블록에서 재사용하지 않은 경우를 의미할 수 있다. 나아가, 제1 대체 데이터 테이블 및 제2 대체 데이터 테이블은 이후에 다른 블록에서 다시 재사용될 수 있다. 재사용되는 경우, 제1 대체 데이터 테이블 또는 제2 대체 데이터 테이블의 참조 정보만을 해당 블록에 대한 압축 데이터의 헤더 영역에 포함할 수 있다.
도 11은 다양한 실시예에 따른 압축 데이터의 예시이다. 도 11은 고정된 크기를 가지는 블록들로 구성된 도 5의 실시예와 달리, 확률 분포가 지정된 범위 이상 동일하거나 유사한 정도에 따라 블록을 구분함으로써, 가변 크기의 블록들로 구성될 수 있는 실시예를 예시한 것이다. 압축 데이터(1100)는 크기가 서로 상이한 네 개의 블록(1110, 1120, 1130, 1140)을 포함할 수 있다. 동일한 기호로 표시된 블록은 확률 분포가 동일 또는 유사한 경우를 나타낼 수 있고, 반면에 상이한 기호로 표시된 블록은 확률 분포가 상이한 경우를 나타낼 수 있다. 나아가, 확률 분포가 지정된 범위 이상 동일하거나 유사한 경우 확률 테이블을 재사용할 수 있는 것을 의미할 수 있다. 예를 들어, 1110 블록과 1130 블록은 각 블록에 포함된 발생 심볼 및 심볼에 대응되는 빈도수의 순위가 동일한 경우를 나타낼 수 있다. 확률 기반 엔트로피 코딩 기술에 따라 부호화/복호화하는 경우에 동일한 확률 정보를 활용할 수 있는 경우로, 헤더 영역에 포함되는 확률 정보(예를 들어, 확률 테이블 또는 대체 데이터 테이블 등)의 중복 기재를 방지하고, 1110 블록에 이미 포함된 확률 정보에 대한 인덱스 정보를 1130 블록에서 포함함으로써 동일한 확률 정보에 기초하여 부호화/복호화될 수 있는 것을 나타낼 수 있다.
1110 블록과 1120 블록은 각 블록에 포함된 심볼 및 심볼에 대응되는 빈도수의 순위가 동일하지 않은 경우를 나타낼 수 있다. 확률 기반 엔트로피 코딩 기술에 따라 부호화/복호화하는 경우 확률 정보가 다르기 때문에 각 확률 정보에 기반한 확률 테이블 또는 대체 데이터 테이블을 이용하는 경우를 나타낼 수 있다.
1110 블록 내지 1140 블록은, 크기가 서로 상이하고 서로 다른 데이터에 해당하지만 1110 블록과 1130 블록, 1120 블록과 1140 블록은 각각 동일한 확률 분포를 가지고 있기 때문에, 확률 기반 엔트로피 기술에 따라 부호화/복호화하는 경우에 확률 정보를 재사용할 수 있다.
도 12a는 다양한 실시예에 따른 입력 데이터의 예시이고, 다양한 실시예에 따라 입력 데이터에 대하여 고정된 크기를 가지는 블록 단위로 확률 테이블을 확인하는 경우 또는 가변 크기를 가지는 블록 단위로 확률 테이블을 확인하는 경우로 다양하게 실시될 수 있다.
압축하고자 하는 데이터를 가장 최소한의 크기로 압축하기 위해서, 다양한 실시예에 따라 확률 테이블을 확인한 후, 가장 확률 테이블의 재사용률이 높은 경우의 실시예를 선택하여 데이터를 압축하는 방법으로 결정할 수 있다. 반대로, 실시간 처리가 요구되는 경우에는 미리 지정된 크기의 블록 단위로 확률 테이블을 확인하여, 해당 확률 테이블에 대한 재사용률에 따라 압축 데이터 내에서 확률 정보를 포함하는 부분의 중복을 최소화하여 데이터를 압축할 수도 있다.
도 12b는 다양한 실시예에 따라 입력 데이터에 대한 고정 블록 확률 테이블을 나타낸 개념도이다. 다양한 실시예에 따른 전자 장치(101)는, 도 12a의 입력 데이터를 고정된 크기의 블록 예를 들어, 8 bit 크기로 처리하여 포함된 서브 데이터 및 서브 데이터들에 대한 빈도수들의 순위를 확인할 수 있다. 예를 들어, 1210 영역에 포함된 심볼(서브 데이터)에 대하여 발생 횟수를 확인할 수 있다. 구체적으로 1210 영역에 대한 확률 테이블은 아래 표 1과 같이 산출할 수 있다.
심볼 발생 횟수 확률 값
A 4 1/2
B 2 1/4
C 2 1/4
1220 영역에 포함된 심볼에 대하여 발생 횟수를 확인하여, 아래 표 2와 같이 확률 테이블을 산출할 수 있다.
심볼 발생 횟수 확률 값
A 2 1/4
B 4 1/2
C 2 1/4
1210 영역과 1220 영역은 동일한 종류의 심볼을 포함하고 있으나, 심볼에 대응하는 빈도수의 순위 즉 확률 값이 상이한 것을 확인할 수 있다. A 심볼의 경우 표 1에서 발생 횟수가 4회이고, 확률 값은 1/2 이지만, 표 2에서 발생 횟수가 2회이고, 확률 값은 1/4 이다. 확률 기반 가변 길이 엔트로피 코딩에 따라 1210 영역과 1220 영역을 부호화하는 경우, 1210 영역에서 A는 확률 값이 크기 때문에 상대적으로 길이가 짧은 대체 데이터를 지정할 수 있고, 1220 영역에서 A는 확률 값이 작기 때문에 상대적으로 길이가 짧은 대체 데이터를 지정할 수 있다.
1230 영역에 대하여 심볼 및 해당 심볼에 대한 발생 횟수 및 확률 값을 확인하면 이하 표 3과 같다.
심볼 발생 횟수 확률 값
A 2 1/4
B 4 1/2
C 2 1/4
표 3은 표 2와 동일한 심볼 및 심볼에 대한 확률 분포를 가지고 있으며, 1220 영역에서 사용한 확률 테이블을 1230 영역에서 사용한 확률 테이블에서 재사용할 수 있다. 따라서, 1230 영역에서는 확률 테이블 또는 확률 정보에 기반한 각 심볼에 대하여 대체 데이터를 지정한 대체 데이터 테이블을 압축 데이터 상에 포함하는 대신에, 1210 영역에서 기 포함된 확률 테이블 또는 대체 데이터 테이블에 대한 참조 정보(예를 들어, 인덱스 정보)만을 압축 데이터에 포함할 수 있다.
본 발명의 다양한 실시예에 따른 전자 장치(101)는, 1210 영역 내지 1230 영역에 대하여 표 1 내지 표 3을 산출한 방법과 마찬가지로, 1240 영역 내지 1260 영역에 대하여 확률 분포를 산출하고, 확률 테이블의 재사용 여부를 산출할 수 있다. 결과적으로, 1220 영역 및 1230 영역에 대한 확률 테이블을 재사용할 수 있고, 1240 영역 및 1260 영역에 대한 확률 테이블을 재사용할 수 있다.
도 12c는 다양한 실시예에 따라 입력 데이터에 대한 가변 블록에 대한 확률 테이블을 나타낸 개념도이다. 확률 테이블의 재사용률을 최대화하기 위해서, 가변 크기의 블록 단위로 확률 테이블의 재사용 여부를 판단할 수 있다. 따라서, 본 발명의 다양한 실시예에 따른 전자 장치(101)는, 도 12b와 같이 고정된 크기의 블록에 대하여 확률 분포가 동일 또는 유사한지 판단할 수 있고 이하에서 설명할 도 12c와 같이 확률 분포가 동일 또는 유사한 범위에 대응하여 확률 테이블을 공유할 블록의 크기를 결정할 수도 있다.
도 12c은 도 12a의 입력 데이터에 대하여 확률 분포가 동일한 범위에 대응하여 구분된 1201 영역, 1203 영역, 1205 영역, 1207 영역에 대하여 확률 테이블을 산출하면 아래 표 4와 같다.
1201 1203 1205 1207
심볼 A,B,C A,B,C A,B,C A,B,C
발생 횟수 count(A)=2, count(B)=2, count(C)=2 count(A)=4,
count(B)=3, count(C)=1
count(A)=2, count(B)=2, count(C)=2 count(A)=12, count(B)=9, count(C)=3
확률 값 p(A)=1/3, p(B)=1/3, p(C)=1/3 p(A)=1/2, p(B)=3/8, p(C)=1/8 p(A)=1/3, p(B)=1/3, p(C)=1/3 p(A)=1/2, p(B)=3/8, p(C)=1/8
1201 블록 및 1205 블록은 동일한 확률 테이블 p1을 사용할 수 있다. 1203 블록 및 1207 블록은 동일한 확률 테이블 p2를 사용할 수 있다. 다양한 실시예에서는 1201 블록과 1205 블록과 같이 완전히 동일한 확률 값을 가지는 경우에 동일한 확률 테이블을 사용할 수 있으며 나아가, 심볼의 발생 횟수 순서만 동일하다면 각 확률 값이 조금 상이한 경우에도 동일한 확률 테이블을 사용할 수 있음은 물론이다. 예를 들어, 1207 블록에서 count(C) = 4이고, 확률 값이 4/25 인 경우에도 1203 블록과 동일한 확률 테이블(또는 코드북)을 사용할 수 있다. 이는 심볼의 확률 순위 또는 발생 횟수의 순위가 여전히 1203 블록과 여전히 동일하기 때문이다.
동일한 입력 데이터 도 12a에 대하여, 도 12b와 같이 고정된 크기의 블록에 대응하여 확률 분포를 산출하여 확률 테이블의 재사용을 결정할 수도 있고, 도 12c와 같이 확률 분포가 동일한 범위에 대응하여 가변의 블록 영역을 구분하여, 확률 테이블의 재사용을 결정할 수도 있다.
본 발명의 다양한 실시예에서, 프로세서에 의하여 적어도 하나의 동작을 수행하도록 설정된 명령들(instructions)이 저장된 컴퓨터 판독 가능한(computer readable) 기록 매체에 있어서, 상기 적어도 하나의 동작은, 상기 프로세서가 전자 장치와 기능적으로 연결되어 있는 메모리에 저장된 데이터를 압축하여 압축 데이터를 생성하는 동작; 상기 프로세서가 상기 압축 데이터에 상기 데이터 중 제1 블록에 포함된 제1 서브 데이터에 대한 제1 빈도수들의 순위에 적어도 기반하여 생성된, 상기 제1 서브 데이터에 대응하는 제1 대체 데이터 테이블을 포함시키는 동작; 및 상기 프로세서가 상기 데이터 중 제2 블록에 포함된 제2 서브 데이터 및 상기 제2 서브 데이터에 대한 제2 빈도수들의 순위가 상기 제1 블록에 포함된 상기 제1 서브 데이터 및 상기 제1 빈도수들의 순위와 지정된 조건을 만족할 경우, 상기 제2 블록에 대응하여 상기 제1 대체 데이터 테이블의 참조 정보를 포함시키는 동작을 포함시킬 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서는, 상기 제2 블록에 포함된 제2 서브 데이터 및 상기 제2 빈도수들의 순위가 상기 제1 블록에 포함된 상기 제1 서브 데이터 및 상기 제1 빈도수들의 순위와 지정된 범위 이상 동일하거나 유사한 경우, 상기 지정된 조건을 만족한 것으로 판단할 수 있다.
본 발명의 다양한 실시예에서, 상기 제2 블록에 대응하여 상기 제1 대체 데이터 테이블의 참조 정보를 포함시키는 동작은, 상기 압축 데이터 내에서 상기 제1 대체 데이터 테이블이 위치하는 인덱스 정보를 상기 제1 대체 데이터 테이블의 참조 정보로 지정할 수 있다.
본 발명의 다양한 실시예에서, 상기 프로세서가, 상기 제2 블록에 대응하여 상기 제1 대체 데이터 테이블에 대한 적어도 하나의 변경 정보를 더 포함시키는 동작을 포함시킬 수 있다. 상기 변경 정보는, 상기 제2 블록에 포함된 상기 제2 서브 데이터 및 상기 제2 빈도수들의 순위 중에서 상기 제1 블록에 포함된 상기 제1 서브 데이터 및 상기 제1 빈도수들의 순위가 상이한 서브 데이터에 대응하여 지정된 대체 데이터 값에 대한 변경 정보일 수 있다.
본 발명의 다양한 실시예에서, 제1 서브 데이터에 대한 상기 제1 빈도수의 순위에 비례하여 상기 제1 서브 데이터에 지정된 대체 데이터의 길이가 결정될 수 있다.
그리고 본 문서에 개시된 실시예는 개시된, 기술 내용의 설명 및 이해를 위해 제시된 것이며, 본 개시의 범위를 한정하는 것은 아니다. 따라서, 본 개시의 범위는, 본 개시의 기술적 사상에 근거한 모든 변경 또는 다양한 다른 실시예를 포함하는 것으로 해석되어야 한다.

Claims (20)

  1. 전자 장치에 있어서,
    메모리; 및
    상기 메모리에 저장된 제1 블록 및 제2 블록을 포함하는 데이터를 압축하여 압축 데이터를 생성하는 프로세서를 포함하고, 상기 프로세서는,
    상기 압축 데이터에, 상기 제1 블록에 포함된 복수의 제1 서브 데이터들 별 빈도수에 대한 제1 순위에 적어도 기반하여 생성된 상기 복수의 제1 서브 데이터들과 연관된 제1 대체 데이터 테이블을 포함시키고,
    상기 제2 블록에 포함된 복수의 제2 서브 데이터들 별 상기 빈도수에 대한 제2 순위가 상기 제1 블록에 포함된 상기 복수의 제1 서브 데이터들 별 상기 빈도수에 대한 상기 제1 순위와 연관된 지정된 조건을 만족할 경우, 상기 압축 데이터에, 상기 복수의 제2 서브 데이터들과 연관된 상기 제1 대체 데이터 테이블에 대한 참조 정보를 포함시키도록 설정된 전자 장치.
  2. 제1항에 있어서,
    상기 프로세서는,
    상기 제2 블록에 포함된 상기 복수의 제2 서브 데이터들 중 상기 제1 블록에 포함된 상기 복수의 제1 서브 데이터들의 적어도 일부에 대응하는 제3 서브 데이터들 별 상기 빈도수에 대한 상기 제2 순위가 상기 복수의 제1 서브 데이터들의 상기 적어도 일부 별 상기 빈도수에 대한 상기 제1 순위와 동일하고, 상기 제3 서브 데이터들의 수가 지정된 수 이상인 경우, 상기 지정된 조건을 만족한 것으로 판단하도록 설정된, 전자 장치.
  3. 제1항에 있어서,
    상기 프로세서는, 상기 압축 데이터 내에서 상기 제1 대체 데이터 테이블이 위치하는 인덱스 정보를 상기 제1 대체 데이터 테이블에 대한 상기 참조 정보로 지정하도록 설정된, 전자 장치.
  4. 제1항에 있어서,
    상기 프로세서는, 상기 복수의 제2 서브 데이터들과 연관된 상기 제1 대체 데이터 테이블에 대한 적어도 하나의 변경 정보를 더 포함시키도록 설정된 전자 장치.
  5. 제4항에 있어서,
    상기 프로세서는,
    상기 복수의 제1 서브 데이터들 중 상기 빈도수에 대한 특정 순위의 제4 서브 데이터와 상기 복수의 제2 서브 데이터들 중 상기 빈도수에 대한 상기 특정 순위의 제5 서브 데이터가 상이한 경우, 상기 적어도 하나의 변경 정보를 더 포함시키도록 설정된, 전자 장치.
  6. 제1항에 있어서,
    상기 프로세서는,
    상기 복수의 제1 서브 데이터들 별 상기 빈도수에 대한 상기 제1 순위에 비례하여, 상기 복수의 제1 서브 데이터들 별로 지정된 대체 데이터의 길이를 결정하도록 설정된 전자 장치.
  7. 제1항에 있어서,
    상기 프로세서는,
    엔트로피 가변 길이 코딩 방식으로 상기 데이터를 압축하도록 설정된, 전자 장치.
  8. 제7항에 있어서,
    상기 프로세서는,
    상기 데이터에 포함된 각각의 블록에 포함된 서브 데이터의 상기 빈도수에 대한 순위를 상기 엔트로피 가변 길이 코딩 방식의 확률 정보로 이용하도록 설정된, 전자 장치.
  9. 제1항에 있어서,
    상기 프로세서는,
    무손실 압축 방법을 이용하여 상기 제1 대체 데이터 테이블을 압축하도록 설정된, 전자 장치.
  10. 제1항에 있어서,
    상기 프로세서는, 상기 압축 데이터 중 상기 제1 대체 데이터 테이블에 기반하여 부호화 가능한 범위에 따라서, 상기 제2 블록의 크기를 결정하도록 설정된, 전자 장치.
  11. 제10항에 있어서,
    상기 제2 블록의 크기는 상기 제1 블록의 크기와 상이한 전자 장치.
  12. 제11항에 있어서,
    상기 프로세서는, 상기 압축 데이터에 상기 제2 블록의 크기를 식별하기 위한 정보를 포함시키도록 설정된 전자 장치.
  13. 삭제
  14. 삭제
  15. 프로세서에 의하여 적어도 하나의 동작을 수행하도록 설정된 명령들(instructions)이 저장된 컴퓨터 판독 가능한(computer readable) 기록 매체에 있어서,
    상기 적어도 하나의 동작은,
    상기 프로세서가 전자 장치와 기능적으로 연결되어 있는 메모리에 저장된 데이터를 압축하여 압축 데이터를 생성하는 동작;
    상기 프로세서가 상기 압축 데이터에 상기 데이터 중 제1 블록에 포함된 복수의 제1 서브 데이터들 별 빈도수에 대한 제1 순위에 적어도 기반하여 생성된, 상기 복수의 제1 서브 데이터들과 연관된 제1 대체 데이터 테이블을 포함시키는 동작; 및
    상기 프로세서가 상기 데이터 중 제2 블록에 포함된 복수의 제2 서브 데이터들 별 상기 빈도수에 대한 제2 순위가 상기 제1 블록에 포함된 상기 복수의 제1 서브 데이터들 별 상기 빈도수에 대한 제1 순위와 연관된 지정된 조건을 만족할 경우, 상기 압축 데이터에 상기 복수의 제2 서브 데이터들과 연관된 상기 제1 대체 데이터 테이블의 참조 정보를 포함시키는 동작;을 포함하는, 컴퓨터 판독 가능한 기록 매체.
  16. 제15항에 있어서,
    상기 적어도 하나의 동작은,
    상기 제2 블록에 포함된 상기 복수의 제2 서브 데이터들 중 상기 제1 블록에 포함된 상기 복수의 제1 서브 데이터들의 적어도 일부에 대응하는 제3 서브 데이터들 별 상기 빈도수에 대한 상기 제2 순위가 상기 복수의 제1 서브 데이터들의 상기 적어도 일부 별 상기 빈도수에 대한 상기 제1 순위와 동일하고, 상기 제3 서브 데이터들의 수가 지정된 수 이상인 경우, 상기 지정된 조건을 만족한 것으로 판단하는 동작;을 포함하는, 컴퓨터 판독 가능한 기록 매체.
  17. 제15항에 있어서,
    상기 복수의 제2 서브 데이터들과 연관된 상기 제1 대체 데이터 테이블의 참조 정보를 포함시키는 동작은,
    상기 압축 데이터 내에서 상기 제1 대체 데이터 테이블이 위치하는 인덱스 정보를 상기 제1 대체 데이터 테이블에 대한 상기 참조 정보로 지정하는 컴퓨터 판독 가능한 기록 매체.
  18. 제15항에 있어서,
    상기 적어도 하나의 동작은,
    상기 복수의 제2 서브 데이터들과 연관된 상기 제1 대체 데이터 테이블에 대한 적어도 하나의 변경 정보를 더 포함시키는 동작을 포함하는 컴퓨터 판독 가능한 기록 매체.
  19. 제18항에 있어서,
    상기 적어도 하나의 동작은,
    상기 복수의 제1 서브 데이터들 중 상기 빈도수에 대한 특정 순위의 제4 서브 데이터와 상기 복수의 제2 서브 데이터들 중 상기 빈도수에 대한 상기 특정 순위의 제5 서브 데이터가 상이한 경우, 상기 적어도 하나의 변경 정보를 더 포함시키는 동작;을 포함하는 컴퓨터 판독 가능한 기록 매체.
  20. 제15항에 있어서,
    상기 복수의 제1 서브 데이터들 별 상기 빈도수에 대한 상기 제1 순위에 비례하여 상기 복수의 제1 서브 데이터들 별로 지정된 대체 데이터의 길이가 결정되는 컴퓨터 판독 가능한 기록 매체.
KR1020170062441A 2017-05-19 2017-05-19 데이터를 압축하는 전자 장치 및 그 동작 방법 KR102337966B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020170062441A KR102337966B1 (ko) 2017-05-19 2017-05-19 데이터를 압축하는 전자 장치 및 그 동작 방법
US15/979,904 US10469102B2 (en) 2017-05-19 2018-05-15 Electronic device for compressing data and method for operating the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170062441A KR102337966B1 (ko) 2017-05-19 2017-05-19 데이터를 압축하는 전자 장치 및 그 동작 방법

Publications (2)

Publication Number Publication Date
KR20180127085A KR20180127085A (ko) 2018-11-28
KR102337966B1 true KR102337966B1 (ko) 2021-12-13

Family

ID=64272164

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170062441A KR102337966B1 (ko) 2017-05-19 2017-05-19 데이터를 압축하는 전자 장치 및 그 동작 방법

Country Status (2)

Country Link
US (1) US10469102B2 (ko)
KR (1) KR102337966B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112203083B (zh) * 2020-09-30 2021-11-09 清华大学 一种视频数据的质量等级确定方法和装置
CN113885787B (zh) * 2021-06-08 2022-12-13 荣耀终端有限公司 一种存储器管理方法及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010136417A (ja) 2004-12-28 2010-06-17 Casio Electronics Co Ltd データ圧縮装置、及びデータ復元装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6100931A (en) * 1996-03-19 2000-08-08 Sony Corporation Method and apparatus for controlling a target amount of code and for compressing video data
US6339804B1 (en) * 1998-01-21 2002-01-15 Kabushiki Kaisha Seiko Sho. Fast-forward/fast-backward intermittent reproduction of compressed digital data frame using compression parameter value calculated from parameter-calculation-target frame not previously reproduced
US7400277B2 (en) 2004-04-06 2008-07-15 International Business Machines Corporation Method and system for the compression of probability tables
US8160137B2 (en) * 2010-03-03 2012-04-17 Mediatek Inc. Image data compression apparatus for referring to at least one characteristic value threshold to select target compression result from candidate compression results of one block and related method thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010136417A (ja) 2004-12-28 2010-06-17 Casio Electronics Co Ltd データ圧縮装置、及びデータ復元装置

Also Published As

Publication number Publication date
US20180337690A1 (en) 2018-11-22
KR20180127085A (ko) 2018-11-28
US10469102B2 (en) 2019-11-05

Similar Documents

Publication Publication Date Title
KR102456541B1 (ko) Sar 저감을 위한 안테나 스위칭 방법 및 이를 지원하는 전자 장치
KR102340127B1 (ko) 복수의 외부 장치들로 오디오 데이터를 전송하는 방법 및 전자 장치
CN107257954B (zh) 用于提供屏幕镜像服务的设备和方法
CN105824772B (zh) 用于使用多个处理器来管理数据的方法和装置
KR102237373B1 (ko) 전자 장치의 태스크 스케줄링 방법 및 이를 사용하는 전자 장치
KR102630526B1 (ko) 배터리를 충전하는 전자 장치 및 그 동작 방법
US11303882B2 (en) Image data compression considering visual characteristic
US20160055082A1 (en) Memory allocating method and electronic device supporting the same
KR102657052B1 (ko) 배터리 충전 방법 및 전자 장치
KR20170105213A (ko) 전자 장치 및 전자 장치의 디스플레이 구동 방법
US20150301587A1 (en) Apparatus and method for controlling power of electronic device
KR20180044081A (ko) 송신 전력을 제어하기 위한 전자장치 및 방법
KR102482067B1 (ko) 전자 장치 및 그의 동작 방법
KR102431962B1 (ko) 전자 장치 및 그의 안테나 성능 개선 방법
EP3287924A1 (en) Electronic device and method for measuring heart rate based on infrared rays sensor using the same
CN108388334B (zh) 电子设备及防止电子设备消耗电流的方法
US20160029027A1 (en) Device and method for processing image
US10319341B2 (en) Electronic device and method for displaying content thereof
KR102337966B1 (ko) 데이터를 압축하는 전자 장치 및 그 동작 방법
KR102312316B1 (ko) 외부 장치 인식 방법 및 그 방법을 처리하는 전자 장치
KR102323797B1 (ko) 전자 장치 및 그의 정보 공유 방법
KR20170119948A (ko) 전자 장치 및 그 제어 방법
KR102590347B1 (ko) 서버, 전자 장치 및 데이터 관리 방법
US10602001B2 (en) Method for identifying data usage and electronic device implementing the same
KR20160095762A (ko) 전자장치 및 전자장치의 영상데이터 처리 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant