KR101123708B1 - 텍스트 이미지 코딩 및 디코딩 시스템에서 사전 관리를위해 심볼을 다이나믹하게 캐슁하는 장치 및 방법 - Google Patents

텍스트 이미지 코딩 및 디코딩 시스템에서 사전 관리를위해 심볼을 다이나믹하게 캐슁하는 장치 및 방법 Download PDF

Info

Publication number
KR101123708B1
KR101123708B1 KR1020070025727A KR20070025727A KR101123708B1 KR 101123708 B1 KR101123708 B1 KR 101123708B1 KR 1020070025727 A KR1020070025727 A KR 1020070025727A KR 20070025727 A KR20070025727 A KR 20070025727A KR 101123708 B1 KR101123708 B1 KR 101123708B1
Authority
KR
South Korea
Prior art keywords
symbols
symbol
dictionary
updated
symbol dictionary
Prior art date
Application number
KR1020070025727A
Other languages
English (en)
Other versions
KR20080069885A (ko
Inventor
옥형수
이종현
찰스 에이 보우만
메리벨 피규에라
Original Assignee
퍼듀 리서치 파운데이션
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퍼듀 리서치 파운데이션, 삼성전자주식회사 filed Critical 퍼듀 리서치 파운데이션
Publication of KR20080069885A publication Critical patent/KR20080069885A/ko
Application granted granted Critical
Publication of KR101123708B1 publication Critical patent/KR101123708B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/4115Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치에 관한 것으로서, 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와; 상기 스트라이프 이미지상의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키기 위한 매칭 유니트와; 상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하고, 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼을 제거하여, 심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록 하는 다이나믹 심볼 캐슁 유니트를 포함한다. 이에 의하여, 효과적인 압축 알고리즘을 획득하기 위한 사전의 디자인과 고압축률을 제공하고, 사전의 한정된 메모리를 충분히 활용하기 위한 메모리 관리를 위한 캐슁 알고리즘을 제공할 수 있다.
텍스트, 이미지, 코딩, 디코딩, 사전, 관리, 심볼, 캐슁

Description

텍스트 이미지 코딩 및 디코딩 시스템에서 사전 관리를 위해 심볼을 다이나믹하게 캐슁하는 장치 및 방법{Apparatus and method of dynamically caching symbols to manage a dictionary in a text image coding and decoding system}
도 1은 종래 이미지 엔코딩 및 디코딩 시스템에서 입력 이미지가 세 개의 영역으로 분할된 것을 보여주는 도면.
도 2는 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치의 구성을 보여주는 도면.
도 3은 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 방법을 보여주는 흐름도.
도 4는 본 발명의 다른 실시예에 따른 텍스트 이미지 코딩 및 디코딩 방법을 보여주는 흐름도.
도 5는 종래 이미지 엔코딩 및 디코딩 시스템 및 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템의 압축률을 보여주는 도면.
도 6은 종래 이미지 엔코딩 및 디코딩 시스템 및 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서의 사전 메모리 크기와 경과 시간과의 관계를 보여주는 도면.
* 도면의 주요 부분에 대한 부호의 설명 *
210 : 스캐너 220 : 엔코딩 유니트
221 : 디컴포우저(decomposer) 222 : 매칭 유니트
223 : 엔코더 224 : 메모리
225 : 컨트롤 유니트 230 : 디코딩 유니트
240 : 프린팅 유니트 250 : 전송 유니트
260 : 수신 유니트 270 : 회로, 유선 또는 무선 네트워크
본 발명은 텍스트 이미지 코딩 및 디코딩 시스템에서 다른 심볼들로 구성된 사전을 관리하는 장치 및 방법에 관한 것으로서, 특히 패턴 매칭 기반의 코딩 및 디코딩 시스템에서 사전 메모리를 관리하기 위해 심볼을 다이나믹하게 캐슁하는 장치 및 방법에 관한 것이다.
일반적으로, ITU-T(International Telecommunications Union - Telecommunication Standardization Sector) T.88에 기술되어 있는 JBIG2 표준은 2-레벨 이미지, 즉 각 화소가 2개의 가능한 색상 중 하나의 색상을 띠고 있는 하나의 직사각형 비트 평면으로 구성된 이미지에 대한 압축 방법을 정의한다. JBIG2 표준은 오직 이미지에 따른 유연한 비트 스트림을 디코딩하기 위한 요구사항(조건)을 규정하고, 엔코더 설계의 특정한 특징을 규정하지 않으며, 엔코더 설계의 품질, 압축, 또는 속도를 개선할 수 있는 많은 최적화 요인들에 대하여 적응성이 있다.
더욱이, JBIG2 표준은 2-레벨 이미지에 관한 손실이 많은, 손실이 없는, 그리고 다손실에서 무손실로의 압축을 제공하고, 멀티-페이지 이미지와 텍스트 및 반색조(halftone)에 대한 모델 기반의 코딩을 지원하는 최초의 국제 표준이다. 또한 JBIG2 표준은 이전의 표준들, 예를 들면, G3, G4 및 JBIG1보다 더 좋은 3~8배의 압축률을 허용한다.
2-레벨 문서는 하나 이상의 페이지를 포함할 수 있고, 각 페이지는 텍스트 데이터, 하프톤 데이터, 그리고 라인 기술이나 노이즈와 같은 다른 데이터를 입력 2-레벨 이미지로서 포함할 수 있다. JBIG2 엔코더는 입력 2-레벨 이미지를 보통 3개의 다른 영역으로 분할하여, 각 영역을 각기 다른 코딩 방법을 사용하여 개별적으로 코딩하는 것으로 예상된다.
도 1은 입력 이미지로서의 하나의 복합 이미지가 JBIG2에서 3개의 영역(텍스트 영역, 하프톤 영역, 일반 영역)으로 분할되는 것을 보여준다.
JBIG2 표준은 심볼 사전을 이용하여 입력 이미지의 텍스트 영역을 엔코딩하는 것을 포함한다. 입력 이미지는 수평 스트라이프들로 쪼개진다. 각 스트라이프는 래스터(raster) 순서로 주사되어 연결된 성분들(심볼들)이 추출된다. 추출된 각 심볼은 심볼 사전에 있는 기준 심볼들과 비교된다. 만일 입력 페이지의 심볼과 심볼 사전의 기준 심볼 사이에 하나의 매치(match)가 발견되면, 입력 이미지의 심볼은 다음의 정보를 이용하여 엔코딩된다: 선행 심볼과 관련된 심볼의 위치 오프셋, 심볼 사전에 있는 기준 심볼과의 최상의 매치에 대한 사전 인덱스 포인팅, 그리고 입력 이미지의 심볼에 관한 엔코딩된 비트맵의 정련. 만일 어떤 매치가 발견되지 않 으면, 입력 이미지의 비매칭 심볼에 상응하는 새로운 심볼이 심볼 사전에 추가된다. 이러한 패턴 매칭 기반의 코딩 시스템은"Pattern Matching and Substitution (PM&S)"로 알려져 있다.
심볼 사전의 설계를 위한 다양한 방법이 존재한다. 가장 간단한 방법은, 이전의 스트라이프를 엔코딩하기 위해 사용된 심볼들을 고려함 없이, 엔코딩된 각 스트라이프에 대하여 완전히 다른 사전을 만들어내는 방법이다. 이러한 방법은 "Independent Dictionary"라고 지칭된다. 이러한 방법은 각 스트라이프에서 새로운 사전이 엔코딩되어야 하기 때문에 빈약한 압축률을 제공한다. 심볼들이 하나의 스트라이프에서 다른 스트라이프로 반복될 수 있음을 주목하는 것이 중요하다. 그러므로, 다른 스트라이프들을 넘나들며 반복하는 심볼들은 두 가지의 불리한 점을 갖는다. 첫째, 이러한 추가 심볼들은 그들을 엔코딩하기 위해 걸리는 시간으로 인해 계산을 증가시킨다. 둘째, 이러한 Independent Dictionary의 잉여 심볼들의 재전송은 엔코딩 시스템의 전체 비트 비율을 증가시킨다.
심볼 사전의 설계를 위한 두 번째 방법은 심볼들이 반복된다는 사실을 이용하는"Global Dictionary"방법이다. 이 방법은 멀티-페이지 전체 문서를 엔코딩하기 위해 한 개의 사전을 사용한다. 그러므로, "Global Dictionary"방법은 문서에 있는 모든 스트라이프를 엔코딩하기 위해 필요한 모든 심볼을 포함한다. 이 방법은 높은 압축률을 낳는다. 하지만, 엔코더나 디코더 상에 메모리 제한이 있을 때 적당하지 않다. 더욱이 이"Global Dictionary"방법은 심볼 매칭 프로세스가 훨씬 더 큰 사전을 통하여 리니어 서치를 요구하기 때문에 계산 시간을 증가시킨다.
심볼 사전의 설계를 위한 세 번째 방법은 물리학 박사 논문"Text Image Compression Based on Pattern Matching"에서 Ye와 Cosman에 의해 제안된"Local Dictionary" 방법이다. "Local Dictionary" 방법은 심볼들이 연속적인 스트라이프 내에서 반복될 수 있다는 사실을 이용하고 있으며, 다음과 같이 논한다. 각 스트라이프에서, 현재의 스트라이프를 엔코딩하기 위해 사용되지 않을 이전의 사전으로부터의 심볼들은 제거되고, 현재의 스트라이프에는 나타나지만 이전의 사전에서 매치를 발견하지 않은 심볼들은 추가된다. 이러한"Local Dictionary" 방법은 사전에 이미 저장되어 다음 스트라이프를 처리하는 과정에 사용될지도 모를 심볼들은 버려진다는 점에서 결점을 갖는다. 일반적으로, "Local Dictionary" 방법에 대한 압축률은"Independent Dictionary" 방법보다는 높지만,"Global Dictionary"방법보다는 훨씬 낮다.
본 발명은 이상과 같은 사항을 감안하여 창출된 것으로서, 텍스트 이미지 코딩 및 디코딩 시스템에서 다른 심볼들로 구성된 사전을 관리하는 다이나믹 심볼 캐슁 장치 및 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 패턴 매칭 기반의 코딩 및 디코딩 시스템에서 사전 메모리를 관리하기 위해 심볼을 다이나믹하게 캐슁하는 장치 및 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 메모리 한계를 초과하지 않고 "Local Dictionary" 방법의 계산 속도를 유지하면서"Global Dictionary" 방법의 압축률과 비교될 수 있는 높은 압축률을 획득하는 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 제한된 메모리 공간을 갖는 사전에 저장된 심볼들을 관리하고, 사전이 꽉 찼을 때, 사전에 새로운 심볼들을 위한 공간을 마련하기 위하여 유지할 아이템과 버릴 아이템을 결정하기 위한 캐슁 알고리즘을 제공하는 것을 목적으로 한다.
상기의 목적을 달성하기 위하여, 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치는,
한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저(decomposer)와;
상기 스트라이프 이미지상의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키기 위한 매칭 유니트(matching unit)와;
상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하고, 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼을 제거하여, 심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록 하는 다이나믹 심볼 캐슁 유니트(dynamic symbol caching unit)를 포함하는 것을 특징으로 한다.
여기서, 바람직하게는 상기 장치는 상기 심볼 사전의 심볼들을 저장하기 위한 메모리를 더 포함할 수 있고, 상기 다이나믹 심볼 캐슁 유니트는 상기 메모리의 크기와 갱신된 심볼 사전의 용적에 따라 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼을 제거할 수 있다.
또한, 상기 메모리는 가장 적게 사용된 기준 심볼을 결정하도록 심볼 사전의 기준 심볼들의 접속 결과를 저장할 수 있다.
또한, 상기 다이나믹 심볼 캐슁 유니트는 가장 적게 사용된 기준 심볼을 결정하기 위하여 심볼 사전의 기준 심볼들 각각의 접속 결과에 따라 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼을 제거할 수 있다.
또한, 상기 다이나믹 심볼 캐슁 유니트는 제2의 심볼 사전을 생성하기 위하여 한 개 이상의 새로운 심볼을 심볼 사전에 추가할 수 있고, 갱신된 심볼 사전을 생성하기 위하여 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼을 제거할 수 있다.
또한, 바람직하게는 상기 본 발명의 장치는 갱신된 심볼 사전 상의 인덱스 정보와 스트라이프 이미지의 각 심볼에 대한 위치 정보에 따라 심볼들을 코딩하기 위한 코딩 유니트를 더 포함할 수 있다.
또한, 상기 본 발명의 장치는 코딩된 심볼을 유/무선 네트워크를 이용하여 전송하기 위한 전송 유니트를 더 포함할 수 있다.
또한, 상기 본 발명의 장치는 코딩된 심볼들을 수신하여 갱신된 심볼 사전 상의 인덱스 정보와 스트라이프 이미지의 각 심볼에 대한 위치 정보에 따라 스트라이프 이미지를 형성하기 위한 디코딩 장치를 더 포함할 수 있다.
또한, 상기 본 발명의 장치는 상기 형성된 스트라이프 이미지를 프린팅 매체 위에 프린팅하기 위한 프린팅 유니트를 더 포함할 수 있다.
또한, 상기 스트라이프 이미지는 이전의 스트라이프 이미지와 현재의 스트라이프 이미지를 포함할 수 있다. 그리고, 상기 매칭 유니트는 현재의 스트라이프 이미지의 심볼들을 이전의 스트라이프 이미지의 심볼 사전과 매칭시킬 수 있다. 또한, 상기 다이나믹 심볼 캐슁 유니트는 현재의 스트라이프 이미지의 심볼들 중에서 한 개 이상의 새로운 심볼이 이전의 스트라이프 이미지의 심볼 사전의 기준 심볼들에 포함되어 있지 않을 때 현재의 스트라이프 이미지의 심볼들 중에서 한 개 이상의 새로운 심볼을 생성할 수 있고, 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록 할 수 있다.
또한, 상기 스트라이프 이미지는 다음(next) 스트라이프 이미지를 포함할 수 있고, 매칭 유니트는 다음(next) 스트라이프 이미지의 심볼들과 현재 스트라이프 이미지의 갱신된 심볼 사전의 기준 심볼들을 매칭시키며, 다이나믹 심볼 캐슁 유니트는 다음 스트라이프 이미지의 심볼들 중에서 한 개 이상의 새로운 심볼이 현재 스트라이프 이미지의 갱신된 심볼 사전의 기준 심볼들에 포함되어 있지 않을 때 다음 스트라이프 이미지의 심볼들 중에서 한 개 이상의 새로운 심볼을 생성하고, 현재 스트라이프 이미지의 갱신된 심볼 사전의 기준 심볼들로부터 기준 심볼들 중 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 갱신된 심볼 사전이 갱신된 심볼 사전의 가장 적게 사용된 한 개 이상의 기준 심볼 없이 다음 스트라이프 이미지의 한 개 이상의 새로운 심볼을 갖는 또 하나의 갱신된 심볼 사전으로 갱신되도 록 할 수 있다.
또한, 상기 본 발명의 장치는 이미지 데이터를 생성하기 위하여 이미지를 스캔하기 위한 스캐너를 더 포함할 수 있다.
또한, 상기 디컴포우저는 이미지 데이터를 복수의 스트라이프 이미지로 분해할 수 있고, 상기 매칭 유니트는 상기 복수의 스트라이프 이미지들 중의 하나의 스트라이프 이미지의 심볼들을 심볼 사전의 기준 심볼들과 매칭시킬 수 있으며, 상기 다이나믹 심볼 캐슁 유니트는 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 상기 하나의 스트라이프 이미지의 한 개 이상의 새로운 심볼을 생성할 수 있고, 또한 심볼 사전이 스트라이프 이미지들 중의 하나의 다음(next) 스트라이프 이미지를 위해 사용될 갱신된 심볼 사전으로 갱신되도록, 기준 심볼들 중 가장 적게 사용된 한 개 이상의 기준 심볼을 제거할 수 있다.
상기 스트라이프 이미지는 복수의 스트라이프 이미지를 포함할 수 있고, 상기 갱신된 심볼 사전은 각 갱신된 심볼 사전들에 대응하는 복수의 갱신된 심볼 사전들을 포함할 수 있다.
또한, 본 발명의 장치는 각각의 갱신된 심볼 사전들 상의 인덱스 정보와 각각의 스트라이프 이미지의 각각의 심볼에 대한 위치 정보에 따라 각각의 스트라이프 이미지의 심볼들을 코딩하기 위한 코딩 유니트를 더 포함할 수 있다.
또한, 본 발명의 장치는 코딩된 심볼들을 유/무선 네트워크를 이용하여 전송하기 위한 전송 유니트를 더 포함할 수 있다.
또한, 본 발명의 장치는 코딩된 심볼들을 수신하여 각각의 갱신된 심볼 사전 들 상의 각각의 인덱스 정보와 각각의 스트라이프 이미지의 각 심볼들에 대한 위치 정보에 따라 스트라이프 이미지를 형성하기 위한 디코딩 장치를 더 포함할 수 있다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치는,
기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼이 대응하는 갱신된 사전들로부터 제거된 각 갱신된 심볼 사전들 상의 각 인덱스 정보 및 각각의 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보와 함께 각 스트라이프 이미지에 대응하는 코딩된 심볼을 수신하여, 상기 각 갱신된 심볼 사전들 상의 각 인덱스 정보 및 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보에 따라 각각의 스트라이프 이미지를 형성하기 위한 디코딩 장치를 포함하는 것을 특징으로 한다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 코딩 및 디코딩 시스템은,
이미지 데이터를 분해하여 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하고, 상기 심볼들을 심볼 사전의 기준 심볼들과 매칭시키며, 상기 심볼들 중에서 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 한 개 이상의 새로운 심볼을 생성하고, 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록 하는 엔코딩 장치와;
기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼이 제거된 갱신된 심볼 사전 상의 인덱스 정보와, 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보를 수신하여, 상기 갱신된 심볼 사전 상의 인덱스 정보 및 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보에 따라 스트라이프 이미지를 형성하는 디코딩 장치를 포함하는 것을 특징으로 한다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 패턴 매칭 방법을 이용한 텍스트 이미지 코딩 장치는,
각각의 심볼들에 대응하는 접속 결과에 대한 정보를 갖는 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
상기 스트라이프 이미지상의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키기 위한 패턴 매칭 유니트와;
상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 한 개 이상의 새로운 심볼을 생성하고, 가장 적은 접속 결과를 갖는 한 개 이상의 기준 심볼을 제거하여, 심볼 사전이 가장 적은 접속 결과를 갖는 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록 하는 다이나믹 심볼 캐슁 유니트를 포함하는 것을 특징으로 한다.
여기서, 상기 가장 적은 접속 결과를 갖는 한 개 이상의 기준 심볼은 가장 적게 사용된 심볼을 갖는 한 개 이상의 기준 심볼을 포함할 수 있다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 패턴 매칭 방법을 이용한 텍스트 이미지 코딩 장치는,
한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
상기 스트라이프 이미지상의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키기 위한 매칭 유니트와;
상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 한 개 이상의 새로운 심볼을 생성하고, 상기 심볼 사전을 한 개 이상의 새로운 심볼을 갖는 제2 심볼 사전으로 갱신하며, 상기 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 그 제거된 가장 적게 사용된 한 개 이상의 기준 심볼이 없는 제3 심볼 사전을 생성하기 위한 다이나믹 심볼 캐슁 유니트를 포함하는 것을 특징으로 한다.
여기서, 바람직하게는 상기 장치는 심볼 사전, 제2 심볼 사전 및 제3 심볼 사전 중의 적어도 하나를 저장하기 위한 메모리를 포함할 수 있고, 상기 다이나믹 심볼 캐슁 유니트는 메모리 용량을 상기 제2 심볼 사전의 용적과 비교할 수 있고, 상기 메모리 용량보다 더 적은 또 하나의 용량을 갖는 제3 심볼 사전을 생성하기 위하여 상기 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거할 수 있다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 방법은,
한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 한 개 이상의 새로운 심볼을 생성하는 단계와;
심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록, 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하는 단계를 포함하는 것을 특징으로 한다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 방법은,
한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와;
심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록, 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하는 단계와;
가장 적게 사용된 한 개 이상의 기준 심볼이 제거된 갱신된 심볼 사전 상의 인덱스 정보와, 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보를 수신하는 단계와;
상기 갱신된 심볼 사전 상의 인덱스 정보 및 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보에 따라 스트라이프 이미지를 형성하는 단계를 포함하는 것을 특징으로 한다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 패턴 매칭 방법을 이용한 텍스트 이미지 방법은,
한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와;
상기 심볼 사전을 한 개 이상의 새로운 심볼을 갖는 제2 심볼 사전으로 갱신하는 단계와;
상기 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 그 제거된 가장 적게 사용된 한 개 이상의 기준 심볼이 없는 제3 심볼 사전을 생성하는 단계를 포함하는 것을 특징으로 한다.
또한, 상기 본 발명의 목적은 텍스트 이미지 코딩 및 디코딩 시스템에서의 하나의 방법을 실행하기 위한 프로그램으로서의 컴퓨터 독출 가능한 코드를 포함하는 컴퓨터 독출 가능한 기록 매체의 제공에 의해서도 성취될 수 있다. 여기서, 상기 방법은, 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와;
심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록, 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하는 단계를 포함한다.
또한, 상기 본 발명의 목적은 텍스트 이미지 코딩 및 디코딩 시스템에서의 다른 방법을 실행하기 위한 프로그램으로서의 컴퓨터 독출 가능한 코드를 포함하는 컴퓨터 독출 가능한 기록 매체의 제공에 의해서도 성취될 수 있다. 여기서, 상기 다른 방법은, 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사 전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와;
심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록, 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하는 단계와;
가장 적게 사용된 한 개 이상의 기준 심볼이 제거된 갱신된 심볼 사전 상의 인덱스 정보와 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보를 수신하는 단계와;
상기 갱신된 심볼 사전 상의 인덱스 정보 및 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보에 따라 스트라이프 이미지를 형성하는 단계를 포함한다.
또한, 상기 본 발명의 목적은 텍스트 이미지 코딩 및 디코딩 시스템에서의 또 다른 방법을 실행하기 위한 프로그램으로서의 컴퓨터 독출 가능한 코드를 포함하는 컴퓨터 독출 가능한 기록 매체의 제공에 의해서도 성취될 수 있다. 여기서, 상기 또 다른 방법은, 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와;
상기 심볼 사전을 한 개 이상의 새로운 심볼을 갖는 제2 심볼 사전으로 갱신하는 단계와;
상기 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 그 제거된 가장 적게 사용된 한 개 이상의 기준 심볼이 없는 제3 심볼 사전을 생성하는 단계를 포함한다.
또한, 상기 본 발명의 목적은 텍스트 이미지 코딩 및 디코딩 시스템에서 사용 가능한 장치의 제공에 의해서도 성취될 수 있다. 여기서 이 장치는, 각각 한 개 이상의 심볼을 갖는 복수의 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
상기 각 스트라이프 이미지의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키기 위한 매칭 유니트와;
상기 심볼 사전을 각 스트라이프 이미지의 심볼을 포함하는 갱신된 심볼 사전으로 갱신하고, 갱신된 심볼 사전으로부터 가장 적게 사용된 기준 심볼을 제거하여, 갱신된 심볼 사전의 용적을 감축시키는 다이나믹 심볼 캐슁 유니트를 포함하는 것을 특징으로 한다.
또한, 상기 본 발명의 목적은 텍스트 이미지 코딩 및 디코딩 시스템에서 사용 가능한 다른 장치의 제공에 의해서도 성취될 수 있다. 여기서 이 다른 장치는, 각각 한 개 이상의 심볼을 갖는 복수의 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
상기 각 스트라이프 이미지의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키기 위한 매칭 유니트와;
상기 심볼 사전을 각 스트라이프 이미지의 심볼을 포함하는 갱신된 심볼 사 전으로 갱신하고, 갱신된 심볼 사전의 용적에 따라 갱신된 심볼 사전으로부터 가장 적게 접속된 기준 심볼을 제거하는 다이나믹 심볼 캐슁 유니트를 포함하는 것을 특징으로 한다.
또한, 상기 본 발명의 목적은 텍스트 이미지 코딩 및 디코딩 시스템에서 사용 가능한 또 다른 장치의 제공에 의해서도 성취될 수 있다. 여기서 이 또 다른 장치는, 각각 한 개 이상의 심볼과 각 심볼에 대응하는 액세스 정보를 갖는 복수의 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
상기 각 스트라이프 이미지의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키는 매칭 유니트와;
상기 각 스트라이프 이미지의 심볼들을 캐슁하여, 상기 심볼 사전을, 상기 각 스트라이프 이미지의 심볼을 갱신된 심볼 사전의 기준 심볼로서 포함하는 갱신된 심볼 사전으로 갱신하고, 그 갱신된 심볼 사전으로부터 가장 적게 접속된 기준 심볼을 제거하며, 각 스트라이프 이미지의 심볼들과 심볼 사전의 기준 심볼들과의 오버랩(overlap)에 따라 갱신된 심볼 사전의 심볼들에 대한 접속 정보를 갱신하여, 갱신된 접속 정보가 가장 적게 접속된 기준 심볼을 제거하기 위해 사용되도록 하는 다이나믹 심볼 캐슁 유니트를 포함하는 것을 특징으로 한다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 관하여 상세히 설명한다.
텍스트 이미지 코딩 및 디코딩 시스템에서 사용될 수 있는 캐슁 알고리즘은 이후부터 설명된다. 캐슁 알고리즘은 심볼이 사용될 때를 예측하는 방법을 제공한 다. 캐싱 알고리즘의 예는 최근에 가장 적게 사용된 아이템을 우선 버리는 LRU(Least Recently Used) 알고리즘, Pseudo-LRU 알고리즘 또는 주어진 일련의 아이템들 및 그 아이템들에 대한 연속적인 접속 결과에 있어서, 아주 최근에 가장 접속되지 않았을 것 같은 아이템을 찾아내는 데에 효과적인 Three-LRU 알고리즘일 수 있다.
또 하나의 캐슁 알고리즘은 LFU(Least Frequently Used) 알고리즘일 수 있으며, 이 알고리즘은 어떤 아이템이 얼마나 자주 필요하였는지를 산출하고, 가장 적은 빈도로 사용된 아이템들이 우선적으로 버려진다. 여기서, LRU 알고리즘은 텍스트 이미지 코딩 및 디코딩 시스템에서 하나의 예로서 사용될 수 있다. 그렇지만, 본 발명의 개념은 그것에 한정되지 않는다. 예를 들면, 위에서 언급된 어떠한 캐슁 알고리즘의 어떠한 변형도 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 사용될 수 있는 캐슁 알고리즘으로서 또한 사용된다.
도 2는 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템으로 사용될 수 있는 장치를 보여주는 도면이다.
도 2를 참조하면, 본 발명의 장치는 스캐너(210)와, 엔코딩 유니트(220)와, 디코딩 유니트(230)와, 프린팅 유니트(240)를 포함한다. 본 발명의 장치는 엔코딩 유니트(220)와 디코딩 유니트(230) 사이에서 회로, 유/무선 네트워크(270)를 통하여 엔코딩 신호(데이터)를 전송하는 전송 유니트(250)와 엔코딩된 신호(데이터)를 수신하는 수신 유니트(260)를 더 포함할 수 있다.
엔코딩 유니트(220)는 디컴포우저(221), 매칭 유니트(222), 코더 또는 엔코 더(223), 메모리(224), 컨트롤 유니트(225)를 포함한다. 컨트롤 유니트(225)는 예컨대, 상기 메모리(224)의 메모리 공간을 관리하기 위하여 심볼을 다이나믹하게 캐쉬하는 다이나믹 심볼 캐슁(DSC) 유니트로 구성될 수 있다. 컨트롤 유니트(225), 메모리(224) 및/또는 엔코딩 유니트(220)의 다른 구성요소들이 DSC 유니트를 구성할 수도 있다. 디컴포우저(221) 및 엔코딩 유니트(220)는 하나의 엔코딩 장치를 구성할 수 있다. 엔코딩 유니트(220)는 스캐너(210)를 포함할 수 있다. 디코딩 유니트(230) 및 프린팅 유니트(240)는 디코딩 장치를 구성할 수 있다. 텍스트 이미지 코딩 및 디코딩 시스템은 엔코딩 장치와 디코딩 장치를 포함할 수 있고, 팩시밀리, 멀티-기능의 장치 등과 같은 이미지 형성 장치일 수 있다.
스캐너(210)는 광을 문서쪽으로 주사하고, 문서로부터 반사광을 수신하여, 하나의 입력 이미지(또는 이미지 데이터)로서 수신된 광으로부터 스캔된 이미지에 대응하는 입력신호를 발생하는 스캐닝 유니트를 포함할 수 있다. 종래 스캐너가 상기 스캐너(210)로 사용될 수 있다.
디컴포우저(221)는 입력신호를 세 개의 다른 영역, 즉 텍스트 영역, 하프톤 영역, 일반 영역을 나타내는 이진 이미지 신호(2-레벨 이미지 신호)로 분해한다. 여기서, 디컴포우저(221)는 텍스트 영역을 한 개 이상의 스트라이프로 나누거나 쪼개는 디바이더를 포함할 수 있고, 또한 각 스트라이프(또는 스트라이프 이미지)로부터 한 개 이상의 심볼을 추출하기 위한 추출기를 포함할 수 있다. 각 스트라이프는 심볼로 연결된 성분들을 추출하기 위하여 래스터 순서로 스캔된 테스트 영역의 일 부분일 수 있다.
매칭 유니트(222)는 각 심볼들(스트라이프 이미지상의 심볼들)이 메모리(224)의 사전의 기준 심볼들과 일치하는지의 여부를 결정하기 위하여 심볼들(스트라이프 이미지상의 심볼들)을 메모리(224)에 저장된 사전(심볼 사전)의 기준 심볼들과 비교한다.
엔코더(코더)(223)는 각 영역을 서로 다른 코딩 방법을 사용하여 개별적으로 코딩한다. 즉, 엔코더(223)는 텍스트 영역을 심볼 사전 및 매칭 유니트(222)의 결과를 이용하여 엔코딩한다. 예를 들면, 엔코더(223)는 선행 심볼, 그 심볼과 심볼 사전에 있는 기준 심볼 사이의 최상의 매칭에 대한 사전 인덱스 정보와 관련한 심볼의 위치 정보와, 엔코딩된 신호로서 입력 이미지에 대한 심볼의 엔코딩된 비트맵 상의 정련 정보에 따라 심볼들을 엔코딩한다. PM&S(Pattern Matching and Substitution)에 따라, 매칭이 발견되지 않으면, 비매칭 심볼에 대응하는 새로운 심볼이 심볼 사전에 추가된다. 엔코더(223)는 또한 위에서 설명된 바와 같은 텍스트 영역, 하프톤 영역 및 일반 영역을 엔코드 신호에 따라 엔코딩한다.
컨트롤 유니트(225)는 심볼들 중에서 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하고, 이전의 매칭 프로세스에서 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 심볼 사전이 그 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록 디컴포우저(221), 매칭 유니트(222), 엔코더(223) 및 메모리(224)를 제어한다.
메모리(224)가 기준 심볼들에 대응하는 접속 결과에 대한 정보를 포함할 때, 컨트롤 유니트(225)는 심볼들 중에서 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 한 개 이상의 새로운 심볼을 생성하고, 가장 적은 접속 결과를 갖는 한 개 이상의 기준 심볼을 제거할 수 있다. 그 결과, 심볼 사전은 그 가장 적은 접속 결과를 갖는 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신된다.
컨트롤 유니트(225)는 심볼들 중에서 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 한 개 이상의 새로운 심볼을 생성하여, 심볼 사전을 그 한 개 이상의 새로운 심볼을 갖는 제2 심볼 사전으로 갱신하며, 그 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 그 제거된 가장 적게 사용된 한 개 이상의 기준 심볼이 없는 제3 심볼 사전을 생성할 수 있다.
컨트롤 유니트(225)는 심볼 사전을 각 스트라이프 이미지의 심볼을 포함하고, 갱신된 심볼 사전으로부터 가장 적게 사용된 기준 심볼을 제거하여 갱신된 심볼 사전의 메모리를 감축한 갱신된 심볼 사전으로 갱신할 수 있다.
컨트롤 유니트(225)는 심볼 사전을 각 스트라이프 이미지의 심볼을 포함하고, 갱신된 심볼 사전 메모리에 따라 갱신된 심볼 사전으로부터 가장 적게 접속된 기준 심볼을 제거한 갱신된 심볼 사전으로 갱신할 수 있다.
컨트롤 유니트(225)는 갱신된 심볼 사전의 기준 심볼로 각 스트라이프 이미지의 심볼을 포함하는 갱신된 심볼 사전으로 심볼 사전을 갱신하기 위하여 심볼들을 캐쉬하고, 갱신된 심볼 사전으로부터 가장 적게 접속된 기준 심볼을 제거하며, 각 스트라이프 이미지와 심볼 사전의 기준 심볼과의 오버랩에 따른 갱신된 심볼 사 전의 심볼들에 관한 접속 정보를 갱신하여, 그러한 갱신된 접속정보가 가장 적게 접속된 기준 심볼을 제거하는데에 사용되도록 할 수 있다.
디코딩 유니트(230)는 가장 적게 사용된 한 개 이상의 기준 심볼이 대응하는 갱신된 사전으로부터 제거된 각 갱신된 심볼 사전 상의 각 인덱스 정보와, 각 스트라이프 이미지의 각 심볼에 대한 위치 정보와 함께 각 스트라이프 이미지에 대응하는 코딩된 심볼을 수신하여, 각 갱신된 심볼 사전 상의 각 인덱스 정보와, 스트라이프 이미지의 각 심볼에 대한 위치 정보에 따라 각 스트라이프 이미지를 형성 또는 재생할 수 있다.
디코딩 유니트(230)는 가장 적게 사용된 한 개 이상의 기준 심볼이 제거된갱신된 심볼 사전 상의 인덱스 정보와 스트라이프 이미지의 각 심볼에 대한 위치 정보를 수신하여, 갱신된 심볼 사전 상의 각 인덱스 정보와 스트라이프 이미지의 각 심볼에 대한 위치 정보에 따라 스트라이프 이미지를 형성할 수 있다.
디코딩 유니트(230)는 그것으로부터 디코딩된 데이터를 출력하고, 프린팅 유니트(240)는 심볼을 포함하여 형성된 스트립(strip)을 포함하는 출력 데이터를 프린팅 매체 위에 프린팅할 수 있다. 디코딩 유니트(230)는 디코딩된 데이터 또는 텍스트 이미지 데이터를 회로, 유/무선 네트워크(270)를 통하여 외부 장치로 출력할 수 있다. 프린팅 유니트(240)는 한 개 이상의 잉크 노즐을 갖는 한 개 이상의 잉크젯 헤드를 사용하여 프린팅 매체 위에 잉크 방울을 분사하는 잉크젯 프린트 유니트나, 레이저 빔을 이용하여 잠상을 형성하고 토너와 같은 현상제로 그 잠상을 현상하는 레이저 빔 프린팅 유니트일 수 있다.
본 실시예에 따라, 텍스트 이미지 코딩 및 디코딩 시스템은 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하고, 스트라이프 이미지의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키며, 그 심볼들 중에 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 한 개 이상의 새로운 심볼을 생성하고, 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록 하는 엔코딩 장치를 포함한다.
본 실시예에 따라, 텍스트 이미지 코딩 및 디코딩 시스템은 또한 가장 적게 사용된 한 개 이상의 기준 심볼이 제거된 갱신된 심볼 사전 상의 인덱스 정보와 스트라이프 이미지의 각 심볼들에 대한 위치 정보를 수신하여, 갱신된 심볼 사전 상의 인덱스 정보와 스트라이프 이미지의 각 심볼들에 대한 위치 정보에 따라 스트라이프 이미지를 형성하기 위한 디코딩 장치를 포함할 수 있다.
도 3은 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 방법을 보여주는 흐름도이다. 도 2 및 도 3을 참조하면, 본 발명의 방법은 심볼 관리에 관한DSC(dynamic symbol caching) 방법을 수행한다.
시간 k에서, 이전의 사전 Dk-1은 메모리(224)에 저장되고, 엔코딩될 새로운 이미지(또는 스트라이프 이미지)는 stripe_imgk이다. 단계 S310에서, 새로운 이미지 stripe_imgk에 있는 한 개 이상의 새로운 심볼이 사전 Dk-1에 있는 기준 심볼들과 하나의 매칭을 찾아내지 못할 때, 새로운 사전 Dk를 생성하기 위하여 한 개 이상의 새 로운 심볼이 이전의 사전 Dk-1에 추가된다.
단계 S320에서, 새로운 사전 Dk의 추가된 한 개 이상의 심볼과 이전의 사전 Dk-1의 기준 심볼에 대한 정보는 정보가 캐슁 알고리즘에 의존하여 변하기 때문에 캐슁 알고리즘에 따라 갱신되어 메모리(224)에 저장된다. 즉, 캐쉬 통계(표)가 새로운 사전 Dk의 추가된 한 개 이상의 심볼과 이전의 사전 Dk-1의 기준 심볼에 대응하도록 갱신된다. 만일 LRU(least recently used) 알고리즘이 캐슁 알고리즘으로 사용되면, 컨트롤 유니트(225)는 어떤 심볼이 사전에 있는 모든 심볼들에 대한 스트라이프 상에 나타난 마지막 시간을 갱신한다. 만일 LFU(least frequently used) 알고리즘이 캐슁 알고리즘으로 사용되면, 컨트롤 유니트(225)는 사전에 있는 각 심볼이 지금까지 사용된 횟수를 갱신한다. 본 발명의 개념은 위의 캐슁 알고리즘에 한정되는 것은 아니며, 다른 캐슁 알고리즘들이 캐슁 방법으로 사용될 수도 있다.
단계 S330에서, 일단 새로운 사전 Dk가 생성되면, 컨트롤 유니트(225)는 새로운 사전 Dk에 의해 사용된 메모리(224)가 임계치(threshold) M보다 더 큰지의 여부를 체크한다.
단계 S340에서, 만일 새로운 사전 Dk에 의해 사용된 메모리(224)가 임계치 M보다 더 크면, 컨트롤 유니트(225)는 그 새로운 사전 Dk에 의해 사용된 메모리(224)가 임계치 M보다 더 크지 않을 때까지 그 새로운 사전 Dk에 있는 한 개 이상의 기준 심볼을 버리거나 제거하기 위하여 캐슁 알고리즘을 사용한다. 제거된 한 개 이상의 기준 심볼은 캐슁 알고리즘, 예컨대, LRU 또는 LFU 알고리즘에 따라 선택된다.
본 실시예에 따르면, DSC 방법은 사전을 저장하기 위한 메모리 장치의 한정된 메모리 공간을 효율적으로 활용하고 관리한다. 이 방법은 미래에 가장 사용될 것 같지만 사전을 위한 유효한 한정된 메모리 공간을 초과하지는 않는 이전의 사전Dk-1에 있는 심볼을 보유하는 것을 허용한다. 이 방법은 가장 가능성 있게 사용된 심볼들을 보유하기 때문에, 이 방법은 그들을 다시 엔코딩할 필요성을 느끼지 않으며, 그러한 것은 압축률의 주요 증가로 환언된다. 그러므로, 본 실시예는 DSC 유니트가 압축률을 크게 증가시키는 반면 계산 시간은 감소시키는 기능을 갖도록 할 수 있다.
도 4는 본 발명의 다른 실시예에 따른 텍스트 이미지 코딩 및 디코딩 방법을 보여주는 흐름도이다. 도 3 및 도 4를 참조하면, 도 4의 단계 S410 및 S430은 도 3의 단계 S310 및 S330과 유사하여, 대응하는 설명은 생략하기로 한다.
단계 S420에서, 컨트롤 유니트(225)는 마지막으로 사용된 심볼을 가지고 새로운 사전 Dk를 갱신하고, 단계 S440에서 최근에 가장 적게 사용된 심볼이 그 새로운 사전 Dk로부터 제거된다. 그 최근에 가장 적게 사용된 심볼은 이전의 사전 Dk-1에 포함되어 있었다.
본 실시예에 따라, 텍스트 이미지 코딩 및 디코딩 방법은 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와; 상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와; 상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와; 심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록, 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하는 단계와; 가장 적게 사용된 한 개 이상의 기준 심볼이 제거된 갱신된 심볼 사전 상의 인덱스 정보와, 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보를 수신하는 단계와; 상기 갱신된 심볼 사전 상의 인덱스 정보 및 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보에 따라 스트라이프 이미지를 형성하는 단계를 포함한다.
23 개의 이진 이미지를 포함하는 2-레벨 문서를 엔코딩하기 위해 위에서 설명된 방법을 JBIG2에 적용하였다. 이 경우에, DSC 방법이 사전에 저장된 심볼들을 관리하기 위해 사용되었다. 어느 심볼이 버려질 필요가 있는지, 그리고 어느 것이 사전에 보관될 필요가 있는지를 결정하기 위하여 LRU 캐슁 알고리즘이 사용되었다. 이 알고리즘은 가장 최근에 사용된 심볼들을 적합하게 확인하여 캐슁한다.
3개의 알고리즘(Independent Dictionary, Local Dictionary, Dynamic Symbol Cashing)을 사용하여 23 페이지의 문서를 엔코딩했다. 각 페이지는 다음의 특징들을 갖는 2-레벨 이미지이다.
* Dimension: 2560×3280
* Resolution: 300dpi
* Size: 1,049,662 bytes
* Skew
도 5는 종래 이미지 엔코딩 및 디코딩 시스템 및 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템의 압축률을 보여주는 도면이고, 도 6은 종래 이미지 엔코딩 및 디코딩 시스템 및 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서의 사전 메모리 크기와 경과 시간과의 관계를 보여주는 도면이다.
도 5를 참조하면, DSC 방법의 본 발명의 실시예는 종래 "Independent Dictionary" 방법에 비해서는 89%의 압축률 증가와, 종래 "Local Dictionary" 방법에 비해서는 43%의 압축률 증가를 제공하는 반면, DSC 방법의 알고리즘의 속도는 도 6에 도시된 바와 같이 유지된다.
본 발명은 컴퓨터 독출 가능의 기록 매체상의 프로그램으로서의 컴퓨터 독출가능의 코드로 구현될 수도 있다. 컴퓨터 독출가능의 기록 매체는 컴퓨터 시스템에 의해 나중에 읽혀질 수 있는 데이터를 저장할 수 있는 어떤 데이터 저장 장치이다. 컴퓨터 독출가능의 기록 매체의 예로는 ROM(read-only memory), RAM (random-access memory), CD-ROMs, 마그네틱 테이프, 플로피 디스크, 광학적 데이터 저장 장치, 인터넷을 통한 데이터 전송과 같은 캐리어 웨이브(carrier wave)를 들 수 있다. 컴퓨터 독출가능의 기록 매체는 또한 컴퓨터 독출 가능의 코드가 저장되어 분산 방식으로 실행되도록 하는 네트워크 결합의 컴퓨터 시스템을 망라하여 분산될 수 있다.
또한, 본 발명을 달성하기 위하여 기능적 프로그램, 코드 및 코드 세그먼트들이 본 발명이 속하는 기술분야에서 숙련된 프로그래머들에 의해 용이하게 짜맞추어질 수 있다.
비록 본 발명의 몇 가지 실시예가 보여지고 설명되었다 할지라도, 변경물들이 본 발명의 원리나 사상을 벗어나지 않고 그러한 실시예들에서 만들어질 수 있음이 당 기술분야에서 숙력된 사람들에 의해 인식될 것이다. 본 발명의 범위는 청구항들 및 그들의 균등물로 정의된다.
전술한 바와 같이, 본 발명은 다른 심볼들로 구성된 사전을 관리하는 DSC 장치 및 방법을 제공한다. 텍스트 이미지들은 그들이 많은 반복되는 텍스트 문자들을 포함하고 있어, 문자 레벨에 있어서 매우 과다하기 때문에 이진 이미지의 특별한 형태이다. JBIG2와 같은 이미지 압축 방법은 패턴 매칭 기술에 기초하여 텍스트를 코딩함으로써 이러한 과다성을 이용할 수 있다. 화소 단위의 입력 이미지 화소에서의 모든 문자 비트맵(심볼)을 코딩한다기 보다는, 패턴 매칭 기반의 코딩 시스템에 있어서, 엔코더는 먼저 모든 심볼들로부터 대표 서브세트 심볼을 선택하고 그들을 사전으로 전송한다.
또한, 본 발명은 효과적인 압축 알고리즘을 획득하기 위한 사전의 디자인과 고압축률을 제공한다. 본 발명은 또한 사전의 한정된 메모리를 충분히 활용하기 위한 메모리 관리를 위한 캐슁 알고리즘을 제공한다. 더 나아가, 본 발명은 심볼 사전을 사용하고 그리하여 모든 다른 심볼들을 저장하기 위한 장소로서의 캐쉬를 필 요로 하는 어떠한 코딩 방법에도 유용한 메모리 관리를 위한 "Dynamic Symbol Caching"을 제공한다. 이러한 새로운 기술은, 종래의 방법과 비교해 볼 때, 엔코더의 성능을 보존하면서 압축률을 크게 개선한다.

Claims (32)

  1. 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
    상기 스트라이프 이미지상의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키기 위한 매칭 유니트와;
    상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하고, 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼을 제거하여, 심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록 하는 다이나믹 심볼 캐슁 유니트를 포함하며,
    상기 갱신된 심볼 사전을 사용하여 상기 스트라이프 이미지 상의 심볼들을 엔코딩하며,
    심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖도록 하는 상기 심볼 사전의 갱신은, 상기 스트라이프 이미지에 대응하여 갱신되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  2. 제1항에 있어서,
    상기 심볼 사전의 심볼들을 저장하기 위한 메모리를 더 포함하며, 상기 다이나믹 심볼 캐슁 유니트는 상기 메모리의 크기와 갱신된 심볼 사전의 용적에 따라 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼을 제거하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  3. 제2항에 있어서,
    상기 메모리는 가장 적게 사용된 기준 심볼을 결정하도록 심볼 사전의 기준 심볼들의 접속 결과를 저장하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  4. 제1항에 있어서,
    상기 다이나믹 심볼 캐슁 유니트는 가장 적게 사용된 기준 심볼을 결정하기 위하여 심볼 사전의 기준 심볼들 각각의 접속 결과에 따라 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼을 제거하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  5. 제1항에 있어서,
    상기 다이나믹 심볼 캐슁 유니트는 제2의 심볼 사전을 생성하기 위하여 한 개 이상의 새로운 심볼을 심볼 사전에 추가하고, 갱신된 심볼 사전을 생성하기 위하여 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼을 제거하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  6. 제1항에 있어서,
    상기 갱신된 심볼 사전 상의 인덱스 정보와 스트라이프 이미지의 각 심볼에 대한 위치 정보에 따라 심볼들을 코딩하기 위한 코딩 유니트를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  7. 제6항에 있어서,
    상기 코딩된 심볼을 유/무선 네트워크를 이용하여 전송하기 위한 전송 유니트를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  8. 제6항에 있어서,
    상기 코딩된 심볼들을 수신하여 상기 갱신된 심볼 사전 상의 인덱스 정보와 스트라이프 이미지의 각 심볼에 대한 위치 정보에 따라 스트라이프 이미지를 형성하기 위한 디코딩 장치를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  9. 제8항에 있어서,
    상기 형성된 스트라이프 이미지를 프린팅 매체 위에 프린팅하기 위한 프린팅 유니트를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  10. 제1항에 있어서,
    상기 스트라이프 이미지는 이전의 스트라이프 이미지와 현재의 스트라이프 이미지를 포함하고;
    상기 매칭 유니트는 현재의 스트라이프 이미지의 심볼들을 이전의 스트라이프 이미지의 심볼 사전과 매칭시키며;
    상기 다이나믹 심볼 캐슁 유니트는 현재의 스트라이프 이미지의 심볼들 중에서 한 개 이상의 새로운 심볼이 이전의 스트라이프 이미지의 심볼 사전의 기준 심볼들에 포함되어 있지 않을 때 현재의 스트라이프 이미지의 심볼들 중에서 한 개 이상의 새로운 심볼을 생성하고, 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록 하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  11. 제10항에 있어서,
    상기 스트라이프 이미지는 다음 스트라이프 이미지를 포함하고;
    상기 매칭 유니트는 상기 다음 스트라이프 이미지의 심볼들과 현재 스트라이프 이미지의 갱신된 심볼 사전의 기준 심볼들을 매칭시키며;
    상기 다이나믹 심볼 캐슁 유니트는 다음 스트라이프 이미지의 심볼들 중에서 한 개 이상의 새로운 심볼이 현재 스트라이프 이미지의 갱신된 심볼 사전의 기준 심볼들에 포함되어 있지 않을 때 다음 스트라이프 이미지의 심볼들 중에서 한 개 이상의 새로운 심볼을 생성하고, 현재 스트라이프 이미지의 갱신된 심볼 사전의 기준 심볼들로부터 기준 심볼들 중 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 갱신된 심볼 사전이 갱신된 심볼 사전의 가장 적게 사용된 한 개 이상의 기 준 심볼 없이 다음 스트라이프 이미지의 한 개 이상의 새로운 심볼을 갖는 또 하나의 갱신된 심볼 사전으로 갱신되도록 하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  12. 제1항에 있어서,
    상기 이미지 데이터를 생성하기 위하여 이미지를 스캔하기 위한 스캐너를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  13. 제12항에 있어서,
    상기 디컴포우저는 이미지 데이터를 복수의 스트라이프 이미지로 분해하고;
    상기 매칭 유니트는 상기 복수의 스트라이프 이미지들 중의 하나의 스트라이프 이미지의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키며;
    상기 다이나믹 심볼 캐슁 유니트는 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 상기 하나의 스트라이프 이미지의 한 개 이상의 새로운 심볼을 생성하고, 기준 심볼들 중 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 심볼 사전이 스트라이프 이미지들 중의 하나의 다음 스트라이프 이미지를 위해 사용될 갱신된 심볼 사전으로 갱신되도록 하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  14. 제1항에 있어서,
    상기 스트라이프 이미지는 복수의 스트라이프 이미지를 포함하고;
    상기 갱신된 심볼 사전은 각 갱신된 심볼 사전들에 대응하는 복수의 갱신된 심볼 사전들을 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  15. 제14항에 있어서,
    상기 각각의 갱신된 심볼 사전들 상의 인덱스 정보와 각각의 스트라이프 이미지의 각각의 심볼에 대한 위치 정보에 따라 각각의 스트라이프 이미지의 심볼들을 코딩하기 위한 코딩 유니트를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  16. 제15항에 있어서,
    상기 코딩된 심볼들을 유/무선 네트워크를 이용하여 전송하기 위한 전송 유니트를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  17. 제16항에 있어서,
    상기 코딩된 심볼들을 수신하여 각각의 갱신된 심볼 사전들 상의 각각의 인덱스 정보와 각각의 스트라이프 이미지의 각 심볼들에 대한 위치 정보에 따라 스트 라이프 이미지를 형성하기 위한 디코딩 장치를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  18. 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼이 대응하는 갱신된 사전들로부터 제거된 각 갱신된 심볼 사전들 상의 각 인덱스 정보 및 각각의 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보와 함께 각 스트라이프 이미지에 대응하는 코딩된 심볼을 수신하여, 상기 각 갱신된 심볼 사전들 상의 각 인덱스 정보 및 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보에 따라 각각의 스트라이프 이미지를 형성하기 위한 디코딩 장치를 포함하며,
    기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼이 대응하는 갱신된 사전들로부터 제거된 각 갱신된 심볼 사전들은, 상기 각각의 대응하는 스트라이프 이미지 마다 갱신되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  19. 이미지 데이터를 분해하여 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하고, 상기 심볼들을 심볼 사전의 기준 심볼들과 매칭시키며, 상기 심볼들 중에서 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 한 개 이상의 새로운 심볼을 생성하고, 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록 하며, 상기 갱신된 심볼 사전을 사용하여 상기 추출되는 스트라이프 이미지 상의 심볼들을 엔코딩하는 엔코딩 장치와;
    기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 심볼이 제거된 갱신된 심볼 사전 상의 인덱스 정보와, 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보를 수신하여, 상기 갱신된 심볼 사전 상의 인덱스 정보 및 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보에 따라 스트라이프 이미지를 형성하는 디코딩 장치를 포함하며,
    심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖도록 하는 상기 심볼 사전의 갱신은, 상기 스트라이프 이미지에 대응하여 갱신되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템.
  20. 각각의 심볼들에 대응하는 접속 결과에 대한 정보를 갖는 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
    상기 스트라이프 이미지상의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키기 위한 패턴 매칭 유니트와;
    상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 한 개 이상의 새로운 심볼을 생성하고, 가장 적은 접속 결과를 갖는 한 개 이상의 기준 심볼을 제거하여, 심볼 사전이 가장 적은 접속 결과를 갖는 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록 하는 다이나믹 심볼 캐슁 유니트를 포함하며,
    상기 갱신된 심볼 사전을 사용하여 상기 스트라이프 이미지 상의 심볼들을 엔코딩하며,
    심볼 사전이 가장 적은 접속 결과를 갖는 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖도록 하는 상기 심볼 사전의 갱신은, 상기 스트라이프 이미지에 대응하여 갱신되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 패턴 매칭 방법을 이용한 텍스트 이미지 코딩 장치.
  21. 제20항에 있어서,
    상기 가장 적은 접속 결과를 갖는 한 개 이상의 기준 심볼은 가장 적게 사용된 심볼을 갖는 한 개 이상의 기준 심볼을 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 패턴 매칭 방법을 이용한 텍스트 이미지 코딩 장치.
  22. 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
    상기 스트라이프 이미지상의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키기 위한 매칭 유니트와;
    상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때 한 개 이상의 새로운 심볼을 생성하고, 상기 심볼 사전을 한 개 이상의 새로운 심볼을 갖는 제2 심볼 사전으로 갱신하며, 상기 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 그 제거된 가장 적게 사용된 한 개 이상의 기준 심볼이 없는 제3 심볼 사전을 생성하기 위한 다이나믹 심볼 캐슁 유니트를 포함하며,
    상기 제3 심볼 사전을 사용하여 상기 스트라이프 이미지 상의 심볼들을 엔코딩하며,
    상기 한 개 이상의 새로운 심볼을 갖는 제2 심볼 사전의 갱신 및 상기 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거한 상기 제3 심볼 사전의 갱신은, 상기 스트라이프 이미지에 대응하여 각각 갱신되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 패턴 매칭 방법을 이용한 텍스트 이미지 코딩 장치.
  23. 제22항에 있어서,
    상기 심볼 사전, 제2 심볼 사전 및 제3 심볼 사전 중에 적어도 하나를 저장하기 위한 메모리를 더 포함하고;
    상기 다이나믹 심볼 캐슁 유니트는 상기 메모리의 용량을 상기 제2 심볼 사전의 용량과 비교하여, 상기 메모리의 용량보다 더 적은 또 하나의 용량을 갖는 제 3 심볼 사전을 생성하기 위하여 상기 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 패턴 매칭 방법을 이용한 텍스트 이미지 코딩 장치.
  24. 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
    상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
    상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와;
    심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록, 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하는 단계; 및
    상기 갱신된 심볼 사전을 사용하여 상기 스트라이프 이미지 상의 심볼들을 엔코딩하는 단계를 포함하며,
    심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖도록 하는 상기 심볼 사전의 갱신은, 상기 스트라이프 이미지에 대응하여 갱신되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 방법.
  25. 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
    상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
    상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와;
    심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록, 기준 심볼들 중에서 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하는 단계와;
    상기 갱신된 심볼 사전을 사용하여 상기 스트라이프 이미지 상의 심볼들을 엔코딩하는 단계와;
    가장 적게 사용된 한 개 이상의 기준 심볼이 제거된 갱신된 심볼 사전 상의 인덱스 정보와, 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보를 수신하는 단계와;
    상기 갱신된 심볼 사전 상의 인덱스 정보 및 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보에 따라 스트라이프 이미지를 형성하는 단계를 포함하며,
    심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖도록 하는 상기 심볼 사전의 갱신은, 상기 스트라이프 이미지에 대응하여 갱신되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 방법.
  26. 한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
    상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
    상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와;
    상기 심볼 사전을 한 개 이상의 새로운 심볼을 갖는 제2 심볼 사전으로 갱신하는 단계와;
    상기 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 그 제거된 가장 적게 사용된 한 개 이상의 기준 심볼이 없는 제3 심볼 사전을 생성하는 단계; 및
    상기 제3 심볼 사전을 사용하여 상기 스트라이프 이미지 상의 심볼들을 엔코딩하는 단계를 포함하며,
    상기 한 개 이상의 새로운 심볼을 갖는 제2 심볼 사전 및 상기 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거한 제3 심볼 사전의 갱신은, 상기 스트라이프 이미지에 대응하여 각각 갱신되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 패턴 매칭 방법을 이용한 텍스트 이미지 방법.
  27. 텍스트 이미지 코딩 및 디코딩 시스템에서 하나의 방법을 실행하기 위한 프로그램으로서의 컴퓨터 독출가능의 코드를 내포하는 컴퓨터 독출가능의 기록 매체에 있어서, 상기 방법은
    한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
    상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
    상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와;
    심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록, 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하는 단계; 및
    상기 갱신된 심볼 사전을 사용하여 상기 스트라이프 이미지 상의 심볼들을 엔코딩하는 단계를 포함하며,
    심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖도록 하는 상기 심볼 사전의 갱신은, 상기 스트라이프 이미지에 대응하여 갱신되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 하나의 방법을 실행하기 위한 프로그램으로서의 컴퓨터 독출가능의 코드를 내포하는 컴퓨터 독출가능의 기록 매체.
  28. 텍스트 이미지 코딩 및 디코딩 시스템에서 하나의 방법을 실행하기 위한 프로그램으로서의 컴퓨터 독출가능의 코드를 내포하는 컴퓨터 독출가능의 기록 매체에 있어서, 상기 방법은
    한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
    상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
    상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와;
    심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖는 갱신된 심볼 사전으로 갱신되도록, 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하는 단계와;
    상기 갱신된 심볼 사전을 사용하여 상기 스트라이프 이미지 상의 심볼들을 엔코딩하는 단계와;
    가장 적게 사용된 한 개 이상의 기준 심볼이 제거된 갱신된 심볼 사전 상의 인덱스 정보와 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보를 수신하는 단계와;
    상기 갱신된 심볼 사전 상의 인덱스 정보 및 스트라이프 이미지의 각각의 심볼들에 대한 위치 정보에 따라 스트라이프 이미지를 형성하는 단계를 포함하며,
    심볼 사전이 가장 적게 사용된 한 개 이상의 기준 심볼 없이 한 개 이상의 새로운 심볼을 갖도록 하는 상기 심볼 사전의 갱신은, 상기 스트라이프 이미지에 대응하여 갱신되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 하나의 방법을 실행하기 위한 프로그램으로서의 컴퓨터 독출가능의 코드를 내포하는 컴퓨터 독출가능의 기록 매체.
  29. 텍스트 이미지 코딩 및 디코딩 시스템에서 하나의 방법을 실행하기 위한 프로그램으로서의 컴퓨터 독출가능의 코드를 내포하는 컴퓨터 독출가능의 기록 매체에 있어서, 상기 방법은
    한 개 이상의 심볼을 갖는 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와;
    상기 스트라이프 이미지상의 심볼들을 심볼 사전의 기준 심볼들과 매칭시키는 단계와;
    상기 스트라이프 이미지상의 심볼들 중 한 개 이상의 새로운 심볼이 심볼 사전에 포함되어 있지 않을 때, 한 개 이상의 새로운 심볼을 생성하는 단계와;
    상기 심볼 사전을 한 개 이상의 새로운 심볼을 갖는 제2 심볼 사전으로 갱신하는 단계와;
    상기 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거하여, 그 제거된 가장 적게 사용된 한 개 이상의 기준 심볼이 없는 제3 심볼 사전을 생성하는 단계; 및
    상기 제3 심볼 사전을 사용하여 상기 스트라이프 이미지 상의 심볼들을 엔코딩하는 단계를 포함하며,
    상기 한 개 이상의 새로운 심볼을 갖는 제2 심볼 사전의 갱신 및 상기 제2 심볼 사전으로부터 가장 적게 사용된 한 개 이상의 기준 심볼을 제거한 제3 심볼 사전의 갱신은, 각각 상기 스트라이프 이미지에 대응하여 갱신되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 하나의 방법을 실행하기 위한 프로그램으로서의 컴퓨터 독출가능의 코드를 내포하는 컴퓨터 독출가능의 기록 매체.
  30. 각각 한 개 이상의 심볼을 갖는 복수의 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
    상기 각 스트라이프 이미지의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키기 위한 매칭 유니트와;
    상기 심볼 사전을 각 스트라이프 이미지의 심볼을 포함하는 갱신된 심볼 사전으로 갱신하고, 갱신된 심볼 사전으로부터 가장 적게 사용된 기준 심볼을 제거하여, 갱신된 심볼 사전의 용적을 감축시키는 다이나믹 심볼 캐슁 유니트를 포함하며,
    상기 갱신된 심볼 사전을 사용하여 상기 스트라이프 이미지 상의 심볼들을 엔코딩하며,
    상기 다이나믹 심볼 캐슁 유니트는, 상기 각 스트라이프에 대응하여 심볼 사전으로부터 가장 적게 사용된 기준 심볼을 제거하도록 하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  31. 각각 한 개 이상의 심볼을 갖는 복수의 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
    상기 각 스트라이프 이미지의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키기 위한 매칭 유니트와;
    상기 심볼 사전을 각 스트라이프 이미지의 심볼을 포함하는 갱신된 심볼 사전으로 갱신하고, 갱신된 심볼 사전의 용적에 따라 갱신된 심볼 사전으로부터 가장 적게 접속된 기준 심볼을 제거하는 다이나믹 심볼 캐슁 유니트를 포함하며,
    상기 갱신된 심볼 사전으로부터 가장 적게 접속된 기준 심볼이 제거된 사전을 사용하여 상기 각 스트라이프 이미지 상의 심볼들을 엔코딩하며,
    상기 갱신된 심볼 사전으로부터 가장 적게 접속된 기준 심볼이 제거된 사전은, 상기 각 스트라이프 이미지에 대응하여 각각 생성되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  32. 각각 한 개 이상의 심볼과 각 심볼에 대응하는 액세스 정보를 갖는 복수의 스트라이프 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
    상기 각 스트라이프 이미지의 심볼들과 심볼 사전의 기준 심볼들을 매칭시키는 매칭 유니트와;
    상기 각 스트라이프 이미지의 심볼들을 캐슁하여, 상기 심볼 사전을, 상기 각 스트라이프 이미지의 심볼을 갱신된 심볼 사전의 기준 심볼로서 포함하는 갱신된 심볼 사전으로 갱신하고, 그 갱신된 심볼 사전으로부터 가장 적게 접속된 기준 심볼을 제거하며, 각 스트라이프 이미지의 심볼들과 심볼 사전의 기준 심볼들과의 오버랩에 따라 갱신된 심볼 사전의 심볼들에 대한 접속 정보를 갱신하여, 갱신된 접속 정보가 가장 적게 접속된 기준 심볼을 제거하기 위해 사용되도록 하는 다이나믹 심볼 캐슁 유니트를 포함하며,
    상기 갱신된 접속 정보가 가장 적게 접속된 기준 심볼을 제거한 사전을 사용하여 상기 각 스트라이프 이미지 상의 심볼들을 엔코딩하며,
    상기 갱신된 접속 정보가 가장 적게 접속된 기준 심볼을 제거한 사전은, 상기 각 스트라이프 이미지에 대응하여 각각 생성되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
KR1020070025727A 2007-01-24 2007-03-15 텍스트 이미지 코딩 및 디코딩 시스템에서 사전 관리를위해 심볼을 다이나믹하게 캐슁하는 장치 및 방법 KR101123708B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
USUS11/626,522 2007-01-24
US11/626,522 US7724164B2 (en) 2007-01-24 2007-01-24 Apparatus and method of dynamically caching symbols to manage a dictionary in a text image coding and decoding system

Publications (2)

Publication Number Publication Date
KR20080069885A KR20080069885A (ko) 2008-07-29
KR101123708B1 true KR101123708B1 (ko) 2012-03-16

Family

ID=39226955

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070025727A KR101123708B1 (ko) 2007-01-24 2007-03-15 텍스트 이미지 코딩 및 디코딩 시스템에서 사전 관리를위해 심볼을 다이나믹하게 캐슁하는 장치 및 방법

Country Status (4)

Country Link
US (1) US7724164B2 (ko)
EP (1) EP1959672A1 (ko)
KR (1) KR101123708B1 (ko)
CN (1) CN101232557A (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8755604B1 (en) * 2008-06-05 2014-06-17 CVISION Technologies, Inc. Using shape similarity methods to improve OCR speed and accuracy
CN103702133B (zh) * 2013-12-19 2017-10-24 Tcl集团股份有限公司 一种图像压缩展示方法及其装置
KR102249827B1 (ko) * 2014-04-21 2021-05-10 삼성전자주식회사 심볼(symbol) 생성을 위한 디스플레이 장치 및 그 제어방법
CN105323583B (zh) 2014-06-13 2019-11-15 财团法人工业技术研究院 编码方法、解码方法、编解码系统、编码器与解码器
CN111049527B (zh) * 2019-12-23 2023-03-17 云南大学 一种图像编码解码方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4410916A (en) 1979-08-24 1983-10-18 Compression Labs, Inc. Dual mode facsimile coding system and method
US4881075A (en) 1987-10-15 1989-11-14 Digital Equipment Corporation Method and apparatus for adaptive data compression
US5742834A (en) * 1992-06-24 1998-04-21 Canon Kabushiki Kaisha Document processing apparatus using a synonym dictionary
JP3226637B2 (ja) 1992-11-12 2001-11-05 株式会社リコー 予測符号化方式の符号化装置および復号化装置
US5524066A (en) * 1994-03-31 1996-06-04 Xerox Corporation Text recognition by predictive composed shapes
CN1099766C (zh) * 1994-06-16 2003-01-22 精工爱普生株式会社 数据压缩方法、数据复原方法及信息处理装置
JP3084187B2 (ja) 1994-06-22 2000-09-04 シャープ株式会社 2値画像符号化装置及び2値画像復号化装置
US5751859A (en) * 1995-06-14 1998-05-12 Lucent Technologies Inc. Compression of text images by soft pattern matching
JPH09246992A (ja) 1996-03-12 1997-09-19 Seiko Epson Corp データ符号化装置およびその方法ならびにデータ復号化装置およびその方法
US6188385B1 (en) * 1998-10-07 2001-02-13 Microsoft Corporation Method and apparatus for displaying images such as text
EP1111909A1 (de) * 1999-12-23 2001-06-27 Philips Patentverwaltung GmbH Vorrichtung und Verfahren zur Darstellung eines aus mehreren Teilbereichen zusammengesetzten Bildes
AUPR192700A0 (en) 2000-12-06 2001-01-04 Canon Kabushiki Kaisha Storing coding image data in storage of fixed memory size
US6883087B1 (en) * 2000-12-15 2005-04-19 Palm, Inc. Processing of binary data for compression
US7397962B2 (en) * 2001-10-25 2008-07-08 Infoprint Solutions Company, Llc Automatic method of identifying image subregions for reuse during datastream transmission
KR100597004B1 (ko) 2004-11-22 2006-07-06 삼성전자주식회사 심볼 사전 재배치 방식을 이용한 이진 영상 처리 장치 및방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Yan Ye, Cosman, P., ‘Fast and memory efficient JBIG2 encoder’, Acoustics, Speech, and Signal Processing, 2001. 2001 IEEE International Conference on page(s): 1753-1756 vol.3, (2001.05.07~2001.05.11)*
Yan Ye, Cosman, P., 'Fast and memory efficient text image compression with JBIG2', This paper appears in: Image Processing, Image Processing,IEEE Transactions on, Volume: 12, page: 944-956 (2003.08)

Also Published As

Publication number Publication date
EP1959672A1 (en) 2008-08-20
CN101232557A (zh) 2008-07-30
US20080174459A1 (en) 2008-07-24
KR20080069885A (ko) 2008-07-29
US7724164B2 (en) 2010-05-25

Similar Documents

Publication Publication Date Title
KR101314229B1 (ko) 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭 장치 및 방법
US4463386A (en) Facsimile data reduction
JP5952900B2 (ja) エントロピー符号化をサポートするモード切替
JP3515572B2 (ja) 画像伝送システムにおける画像圧縮符号化方法
KR101123708B1 (ko) 텍스트 이미지 코딩 및 디코딩 시스템에서 사전 관리를위해 심볼을 다이나믹하게 캐슁하는 장치 및 방법
JP2007143082A (ja) 画像データの圧縮方法および装置
US20050008224A1 (en) Image compression usable with animated images
US20020191224A1 (en) Image encoding method, image encoding apparatus and storage medium
US5966467A (en) System for compressing and decompressing binary representations of dithered images
JP4371026B2 (ja) プリントシステムおよびプリンタ
Akimov et al. Lossless compression of color map images by context tree modeling
JP2007306513A (ja) 画像データの圧縮方法および装置
Martins et al. Lossless, near-lossless, and refinement coding of bilevel images
JP3085932B2 (ja) マスクを用いた予測映像発生装置及びその装置を用いた2進映像の圧縮、伝送及び復元装置
KR0173079B1 (ko) 프린팅 방법
Figuera et al. A new approach to JBIG2 binary image compression
JP4696738B2 (ja) 画像データの圧縮方法および装置並びに擬似階調画像の復元方法
JP4529681B2 (ja) 画像データの圧縮方法および装置
JP3867886B2 (ja) 画像符号化方法、画像符号化装置、画像復号化方法及び画像復号化装置
JP2008205994A (ja) 画像符号化装置、画像復号化装置、画像処理システム及びプログラム
JP4174111B2 (ja) 符号化方法及び装置
Kim et al. Error Recovery in Facsimile without Retransmission.
Sampath et al. Combined peano scan and VQ approach to image compression
Kim et al. Interactive error recovery in facsimile without retransmission
Park et al. Lossless halftone image compression using adaptive context template update

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160128

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170124

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180212

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190207

Year of fee payment: 8