KR101314229B1 - 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭 장치 및 방법 - Google Patents

텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭 장치 및 방법 Download PDF

Info

Publication number
KR101314229B1
KR101314229B1 KR1020120070531A KR20120070531A KR101314229B1 KR 101314229 B1 KR101314229 B1 KR 101314229B1 KR 1020120070531 A KR1020120070531 A KR 1020120070531A KR 20120070531 A KR20120070531 A KR 20120070531A KR 101314229 B1 KR101314229 B1 KR 101314229B1
Authority
KR
South Korea
Prior art keywords
symbol
text image
distance
reference symbol
comparator
Prior art date
Application number
KR1020120070531A
Other languages
English (en)
Other versions
KR20120093112A (ko
Inventor
옥형수
이종현
찰스 에이 보우만
메리벨 피규에라
Original Assignee
퍼듀 리서치 파운데이션
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퍼듀 리서치 파운데이션, 삼성전자주식회사 filed Critical 퍼듀 리서치 파운데이션
Publication of KR20120093112A publication Critical patent/KR20120093112A/ko
Application granted granted Critical
Publication of KR101314229B1 publication Critical patent/KR101314229B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/4115Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

본 발명은 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치에 관한 것으로서, 텍스트 이미지의 심볼과 심볼 사전의 기준 심볼 간의 제1 거리를 계산하고, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하는지의 여부를 결정하며, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하지 않으면, 텍스트 이미지의 심볼중의 하나와 기준 심볼 간의 제2 거리를 계산하고, 상기 텍스트의 이미지의 심볼이 상기 제2 거리 및 제2 기준에 따라 기준 심볼과 매칭하는지의 여부를 결정하는 매칭 유니트를 포함한다. 이에 의하여, 매칭 프로세스의 고비용을 감축하고, 품질/비트 비율을 향상시킬 수 있다.

Description

텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭 장치 및 방법 {Apparatus and method of matching symbols in a text image coding and decoding system}
본 발명은 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭 장치 및 방법에 관한 것으로서, 특히 패턴 매칭 기반의 코딩 및 디코딩 시스템에서 매칭 동작의 수를 감소시키고, 품질/비트 비율과 매칭 동작의 속도를 향상시킬 수 있는 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭 장치 및 방법에 관한 것이다.
일반적으로, ITU-T(International Telecommunications Union - Telecommunication Standardization Sector) T.88에 기술되어 있는 JBIG2 표준은 2-레벨 이미지, 즉 각 화소가 2개의 가능한 색상 중 하나의 색상을 띠고 있는 하나의 직사각형 비트 평면으로 구성된 이미지에 대한 압축 방법을 정의한다. JBIG2 표준은 오직 이미지에 따른 유연한 비트 스트림을 디코딩하기 위한 요구사항(조건)을 규정하고, 엔코더 설계의 특정한 특징을 규정하지 않으며, 엔코더 설계의 품질, 압축, 또는 속도를 개선할 수 있는 많은 최적화 요인들에 대하여 적응성이 있다.
더욱이, JBIG2 표준은 2-레벨 이미지에 관한 손실이 많은, 손실이 없는, 그리고 다손실에서 무손실로의 압축을 제공하고, 멀티-페이지 이미지와 텍스트 및 반색조(halftone)에 대한 모델 기반의 코딩을 지원하는 최초의 국제 표준이다. 또한 JBIG2 표준은 이전의 표준들, 예를 들면, G3, G4 및 JBIG1보다 더 좋은 3~8배의 압축률을 허용한다.
2-레벨 문서는 하나 이상의 페이지를 포함할 수 있고, 각 페이지는 텍스트 데이터, 하프톤 데이터, 그리고 라인 기술이나 노이즈와 같은 다른 데이터를 입력 2-레벨 이미지로서 포함할 수 있다. JBIG2 엔코더는 입력 2-레벨 이미지를 보통 3개의 다른 영역으로 분할하여, 각 영역을 각기 다른 코딩 방법을 사용하여 개별적으로 코딩하는 것으로 예상된다.
도 1은 입력 이미지로서의 하나의 복합 이미지가 JBIG2에서 3개의 영역(텍스트 영역, 하프톤 영역, 일반 영역)으로 분할되는 것을 보여준다.
JBIG2 표준은 심볼 사전을 이용하여 입력 이미지의 텍스트 영역을 엔코딩하는 것을 포함한다. 입력 이미지는 수평 스트라이프들로 쪼개진다. 각 스트라이프는 래스터(raster) 순서로 주사되어 연결된 성분들(심볼들)이 추출된다. 추출된 각 심볼은 심볼 사전에 있는 기준 심볼들과 비교된다. 만일 입력 페이지의 심볼과 심볼 사전의 기준 심볼 사이에 하나의 매치(match)가 발견되면, 입력 이미지의 심볼은 다음의 정보를 이용하여 엔코딩된다: 선행 심볼과 관련된 심볼의 위치 오프셋, 심볼 사전에 있는 기준 심볼과의 최상의 매치에 대한 사전 인덱스 포인팅, 그리고 입력 이미지의 심볼에 관한 엔코딩된 비트맵의 정련. 만일 어떤 매치가 발견되지 않으면, 입력 이미지의 비매칭 심볼에 상응하는 새로운 심볼이 심볼 사전에 추가된다. 이러한 패턴 매칭 기반의 코딩 시스템은 "Pattern Matching and Substitution (PM&S)"로 알려져 있다.
매칭 절차는 일반적으로 에러 맵을 검사함으로써 이루어진다. 그것은 새로운 심볼과 사전의 기준 심볼 간의 비트에 관한 배타적"OR"이다. 에러 맵을 계산하기에 앞서, 새로운 심볼과 기준 심볼이 서로에 관하여 적당히 배열된다. 새로운 심볼 중의 하나와 기준 심볼 중의 하나에 있어서의 각 픽셀(pixel) 새로운 심볼과 기준 심볼의 다른 하나에 맵핑될 수 있다. 그런 후 에러 맵은 거리 메트릭(metric)을 이용하여 추정된다. 거리 메트릭은 다음과 같이 결정된다.
Exclusive-OR(XOR)는 에러 맵의 Hamming distance(즉, 에러 맵에 놓여 있는 화소들의 총갯수에 의해 두 심볼간의 편차로부터의 정도)를 계산하기 위하여 사용된다.
Weighted Exclusive-OR(WXOR)는 에러가 발생한 정황에 따라 에러 픽셀을 다르게 평가하기 위해 사용된다. 각 에러 픽셀은 3*3 인근에 있는 에러 픽셀의 수와 동일한 양을 증여한다. 그 결과, 하나의 덩어리에서 발생한 에러 픽셀들은 더욱 중요하다. 도 2는 WXOR 작용을 보여준다. 여기에서, 각 백색 원은 하나의 에러 픽셀이고, 그 백색 원 내부의 숫자는 관련된 세력(영향력)이다.
Weighted AND NOT(WAN)은 WXOR과 동일한 방식으로 에러 픽셀을 평가하기 위해 사용되지만, "black-to-white" 에러를 "white-to-black" 에러와 다르게 조작한다.
Improved Weighted Exclusive-OR(WXOR)는 두 에러 맵 E1과 E2 간의 메트릭 구분을 발생시키기 위하여 A와 B가 비교되는 심볼들 또는 비트맵이 되도록 하기 위해 사용된다. E1 비트맵 A에는 있으나 B에는 없는 픽셀들을 포함하고, E2 비트맵 B에는 있으나 A에는 없는 픽셀들을 포함한다. 마지막 에러 맵은 두 에러 맵을 합한 것이다.
Hausdoff 거리는 작은 효력의 영향력을 경계선의 픽섹들에게 주고, 큰 효력의 영향력을 경계선에 근접되지 않은 픽셀들에게 준다.
심볼들을 자기-유사 카테고리로 묶기 위하여, 어떤 매치가 수용될지 또는 거절될지를 결정하기 위하여 하나의 임계치가 사용된다. 각 경우에 있어서의 결과는 2진 결정, "match" 또는 "no match"이다. 하나의 매치는 에러 또는 거리가 미리 정의된 임계치를 초과하면 거절된다.
도 2는 배타적 세력 또는 거리 메트릭, 예컨대, Weighted Exclusive-OR 거리 메트릭을 보여주는 도면이다. 여기서, XOR 거리 메트릭으로는, 문자"C"와 "O"는 문자"e"의 두 개의 버전보다 더 유사하다. 하지만, WXOR에 의해서는, 문자들 "e"의 거리는 문자"C"와 "O" 간의 거리보다 더 작다. XOR 거리 메트릭은 매우 엄격한 임계치가 정의되지 않는한 대체 에러로 유도할 수 있다. 한편, 매우 엄격한 임계치는 비트율을 감소시키는 큰 심볼 사전의 결과를 초래할 수 있다. WXOR 거리 메트릭은 PM&S를 이용할 때 비트율을 감소시키지 않고 문서의 엔코딩에 있어서 대체 에러의 수를 감소시킬 수 있다. 그렇지만, 그것은 XOR 메트릭에 비해 약간의 계산을 요구하는 간접비를 갖는다.
도 2를 참조하면, (a)는 문자 "e"의 두 버전의 비교에 의해 산출된 에러 맵을 생성하기 위하여 A, B 및 A+B를 보여주는 것으로, 이는 29의 XOR 거리와 75의 WXOR 거리로 귀착된다. (b)는 문자"c"와"o"의 비교에 의해 산출된 에러 맵을 생성하기 위하여 C, D 및 C+D를 보여주는 것으로, 이는 23의 XOR 거리와 131의 WXOR거리로 귀착된다. WXOR 거리가 잘못 매칭된 "c"와"o" 심볼 사이에서 XOR 보다 더 큰 에러 거리를 보이고 있음을 주목할 필요가 있다.
그러나, 상기와 같은 종래 매칭 프로세스는 프로세싱 시간이 증가되고 비트율이 감소된다는 결점을 갖는다.
본 발명은 이상과 같은 사항을 감안하여 창출된 것으로서, 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭 장치 및 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 패턴 매칭 기반의 코딩 및 디코딩 시스템에서 매칭 동작의 수를 감소시키고, 품질/비트 비율과 매칭 동작의 속도를 향상시킬 수 있는 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭 장치 및 방법을 제공하는 것을 목적으로 한다.
또한, 본 발명은 복수의 거리와 복수의 기준 거리를 이용하여 매칭 프로세스를 수행하는 패턴 매칭 기반의 코딩 및 디코딩 시스템을 제공하는 것을 목적으로 한다.
또한, 본 발명은 매칭 프로세싱 시간을 줄이기 위하여 개선된 에러 맵을 갖는 패턴 매칭 기반의 코딩 및 디코딩 시스템을 제공하는 것을 목적으로 한다.
상기의 목적을 달성하기 위하여, 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치는,
텍스트 이미지의 심볼과 심볼 사전의 기준 심볼 간의 제1 거리를 계산하고, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하는지의 여부를 결정하며, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하지 않으면, 텍스트 이미지의 심볼중의 하나와 기준 심볼 간의 제2 거리를 계산하고, 상기 텍스트의 이미지의 심볼이 상기 제2 거리 및 제2 기준에 따라 기준 심볼과 매칭하는지의 여부를 결정하는 매칭 유니트를 포함하는 것을 특징으로 한다.
여기서, 상기 매칭 유니트는 상기 텍스트 이미지의 심볼이 상기 기준 심볼과 매칭하는지의 여부를 결정하기 위하여 상기 제1 거리와 제1 기준을 비교하는 제1 비교기와; 상기 텍스트 이미지의 심볼이 상기 기준 심볼과 매칭하는지의 여부를 결정하기 위하여 상기 제2 거리와 제2 기준을 비교하는 제2 비교기를 포함할 수 있다.
또한, 상기 제1 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 새로운 기준 심볼이 상기 텍스트 이미지의 심볼과 대응하기 위해 생성되어 심볼 사전에 저장될 수 있다.
또한, 상기 매칭 유니트는 상기 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하는 것을 결정할 수 있다.
또한, 상기 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 상기 새로운 기준 심볼이 상기 텍스트 이미지의 심볼에 대응하기 위해 생성되어 심볼 사전에 저장될 수 있다.
또한, 상기 제1 기준은 제1 서브-기준과 제2 서브-기준을 포함할 수 있고,상기 제1 비교기는 상기 제1 거리와 제1 서브-기준을 비교하는 제1 서브-비교기와 상기 제1 거리와 제2 서브-기준을 비교하는 제2 서브-비교기를 포함할 수 있으며,상기 매칭 유니트는 상기 제1 및 제2 서브-비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하는 것을 결정할 수 있다.
또한, 상기 제2 기준은 상기 제1 및 제2 서브-기준과 다를 수 있다.
또한, 상기 제1 및 제2 서브-비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 새로운 기준 심볼이 상기 텍스트 이미지의 심볼에 대응하기 위해 생성되어 심볼 사전에 저장될 수 있다.
또한, 상기 매칭 유니트는 상기 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하는 것을 결정할 수 있다.
또한, 상기 제1, 제2 서브-비교기 및 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭할 때, 상기 기준 심볼 및 텍스트 이미지의 심볼의 위치에 대한 정보에 따라 상기 텍스트 이미지의 심볼을 코딩하는 코딩 유니트를 포함할 수 있다.
또한, 상기 텍스트 이미지의 심볼을 포함하여 한 개 이상의 심볼을 갖는 텍스트 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와, 기준 심볼 및 텍스트 이미지에 있는 심볼의 위치에 대한 정보를 갖는 심볼을 코딩하는 코더를 더 포함할 수 있다.
또한, 스캔된 이미지를 이미지 데이터로 생성하기 위하여 하나의 대상을 스캔하기 위한 스캐너를 더 포함할 수 있다.
또한, 상기 제1 및 제2 거리와 제1 및 제2 기준에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 새로운 기준 심볼을 생성하기 위하여 상기 심볼 사전을 제어하는 컨트롤러를 더 포함할 수 있다.
또한, 상기 제1 거리는 XOR 거리일 수 있다.
또한, 상기 제2 거리는 WXOR 거리일 수 있다.
또한, 상기 제2 기준은 상기 제1 기준 값 보다 더 큰 값을 가질 수 있다.
또한, 상기 매칭 유니트는 텍스트 이미지의 심볼을 나타내기 위하여 기준 심볼을 사용해야 할지 또는 텍스트 이미지의 심볼을 새로운 기준 심볼로 생성해야 할지를 결정하기 위하여 상기 XOR 거리를 제1 기준과 비교할 수 있다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 방법은,
텍스트 이미지의 심볼과 심볼 사전의 기준 심볼 간의 제1 거리를 계산하는 단계와;
상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하는지의 여부를 결정하는 단계와;
상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하지 않으면, 텍스트 이미지의 심볼중의 하나와 기준 심볼 간의 제2 거리를 계산하는 단계와;
상기 텍스트의 이미지의 심볼이 상기 제2 거리 및 제2 기준에 따라 기준 심볼과 매칭하는지의 여부를 결정하는 단계를 포함하는 것을 특징으로 한다.
여기서, 상기 텍스트 이미지의 심볼이 상기 기준 심볼과 매칭하는지의 여부를 결정하는 단계는, 상기 텍스트 이미지의 심볼이 상기 기준 심볼과 매칭하는지의 여부를 결정하기 위하여 제1 비교기에서 상기 제1 거리와 제1 기준을 비교하는 단계와; 상기 텍스트 이미지의 심볼이 상기 기준 심볼과 매칭하는지의 여부를 결정하기 위하여 제2 비교기에서 상기 제2 거리와 제2 기준을 비교하는 단계를 포함할 수 있다.
또한, 상기 텍스트 이미지의 심볼에 대응하기 위한 새로운 기준 심볼을 생성하는 단계와; 상기 제1 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 상기 생성된 기준 심볼을 심볼 사전에 저장하는 단계를 더 포함할 수 있다.
또한, 상기 제1 거리와 제1 기준을 비교하는 단계는, 상기 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하는 것을 결정하는 단계를 포함할 수 있다.
또한, 상기 텍스트 이미지의 심볼에 대응하기 위한 새로운 기준 심볼을 생성하는 단계와; 상기 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 상기 생성된 기준 심볼을 심볼 사전에 저장하는 단계를 더 포함할 수 있다.
또한, 상기 제1 기준은 제1 서브-기준과 제2 서브-기준을 포함할 수 있고;상기 제1 비교기는 상기 제1 거리와 제1 서브-기준을 비교하는 제1 서브-비교기와 상기 제1 거리와 제2 서브-기준을 비교하는 제2 서브-비교기를 포함할 수 있으며;상기 텍스트 이미지의 심볼이 상기 기준 심볼과 매칭하는지의 여부를 결정하는 단계는, 상기 매칭 유니트가 상기 제1 및 제2 서브-비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하는 것을 결정하는 것을 포함할 수 있다.
또한, 상기 제2 기준은 상기 제1 및 제2 서브-기준과 다를 수 있다.
또한, 상기 텍스트 이미지의 심볼에 대응하기 위한 새로운 기준 심볼을 생성하는 단계와; 상기 제1 및 제2 서브-비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 생성된 새로운 기준 심볼을 심볼 사전에 저장하는 단계를 더 포함할 수 있다.
*또한, 상기 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하는 것을 결정하는 단계를 더 포함할 수 있다.
또한, 상기 제1, 제2 서브-비교기 및 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭할 때, 상기 기준 심볼 및 텍스트 이미지의 심볼의 위치에 대한 정보에 따라 상기 텍스트 이미지의 심볼을 코딩하는 단계를 더 포함할 수 있다.
*또한, 상기 텍스트 이미지의 심볼을 포함하여 한 개 이상의 심볼을 갖는 텍스트 이미지를 추출하기 위하여 이미지 데이터를 분해하는 단계와; 기준 심볼 및 텍스트 이미지에 있는 심볼의 위치에 대한 정보를 갖는 심볼을 코딩하는 단계를 더 포함할 수 있다.
또한, 스캔된 이미지를 이미지 데이터로 생성하기 위하여 하나의 대상을 스캔하는 단계를 더 포함할 수 있다.
또한, 상기 제1 및 제2 거리와 제1 및 제2 기준에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 새로운 기준 심볼을 생성하기 위하여 상기 심볼 사전을 제어하는 단계를 더 포함할 수 있다.
또한, 상기 제1 거리는 XOR 거리일 수 있다.
또한, 상기 제2 거리는 WXOR 거리일 수 있다.
또한, 상기 제2 기준은 상기 제1 기준 값 보다 더 큰 값을 가질 수 있다.
또한, 상기 제1 거리는 XOR 거리를 포함하고; 상기 제2 거리는 WXOR 거리를 포함하며; 상기 텍스트 이미지의 심볼이 상기 기준 심볼과 매칭하는지의 여부를 결정하는 단계는, 상기 매칭 유니트는 텍스트 이미지의 심볼을 나타내기 위하여 기준 심볼을 사용해야 할지 또는 텍스트 이미지의 심볼을 새로운 기준 심볼로 생성해야 할지를 결정하기 위하여 상기 XOR 거리를 제1 기준과 비교하고, 상기 WXOR 거리를 제2 기준과 비교하는 단계를 포함할 수 있다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른, 텍스트 이미지 코딩 및 디코딩 시스템에서의 하나의 방법을 실행하기 위한 프로그램으로서의 컴퓨터 독출 가능의 코드를 포함하는 컴퓨터 독출가능의 기록 매체에 있어서, 상기 방법은,텍스트 이미지의 심볼과 심볼 사전의 기준 심볼 간의 제1 거리를 계산하는 단계와; 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하는지의 여부를 결정하는 단계와; 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하지 않으면, 텍스트 이미지의 심볼중의 하나와 기준 심볼 간의 제2 거리를 계산하는 단계와; 상기 텍스트의 이미지의 심볼이 상기 제2 거리 및 제2 기준에 따라 기준 심볼과 매칭하는지의 여부를 결정하는 단계를 포함할 수 있다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치는,
텍스트 이미지의 심볼과 기준 심볼 간의 적어도 두 개의 다른 거리와 적어도 두 개의 다른 기준 값에 따라 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 매칭하는지를 결정하기 위한 매칭 유니트를 포함하는 것을 특징으로 한다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치는,
제1 거리와 제1 기준을 이용한 대강의 작업에 따라 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 매칭하는지를 결정하고, 상기 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 대강의 작업으로 매칭하지 않을 때 제2 거리와 제2 기준을 이용한 정교한 작업에 따라 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 매칭하는지를 결정하기 위한 매칭 유니트를 포함하는 것을 특징으로 한다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 시스템은,
텍스트 이미지의 심볼과 심볼 사전의 기준 심볼 간의 제1 거리를 계산하고, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하는지의 여부를 결정하며, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하지 않으면, 텍스트 이미지의 심볼중의 하나와 기준 심볼 간의 제2 거리를 계산하고, 상기 텍스트의 이미지의 심볼이 상기 제2 거리 및 제2 기준에 따라 기준 심볼과 매칭하는지의 여부를 결정하여, 상기 제1,제2 거리와 제1,제2 기준을 이용한 결정에 따라 엔코딩된 신호가 발생되도록 하는 엔코딩 장치와;
상기 제1,제2 거리와 제1,제2 기준을 이용한 결정에 따라 엔코딩된 신호를 수신하고, 텍스트 이미지를 재생하기 위하여 수신된 신호를 디코딩하는 디코딩 장치를 포함하는 것을 특징으로 한다.
또한, 상기의 목적을 달성하기 위하여 본 발명에 따른 텍스트 이미지 코딩 및 디코딩 방법은,
텍스트 이미지의 심볼이 제1 거리 및 제1 기준에 따라 기준 심볼과 매칭하는지의 여부를 결정하기 위하여, 상기 텍스트 이미지의 심볼과 심볼 사전의 기준 심볼 간의 제1 거리를 계산하는 단계와;
상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하지 않으면, 상기 텍스트 이미지의 심볼중의 하나와 기준 심볼 간의 제2 거리를 계산하는 단계와;
상기 제1,제2 거리와 제1,제2 기준을 이용한 결정에 따라 엔코딩된 신호가 발생되도록, 상기 텍스트 이미지의 심볼이 상기 제2 거리 및 제2 기준에 따라 기준 심볼과 매칭하는지의 여부를 결정하는 단계와;
텍스트 이미지를 재생하기 위하여, 상기 제1,제2 거리와 제1,제2 기준을 이용한 결정에 따라 엔코딩된 신호를 디코딩하는 단계를 포함하는 것을 특징으로 한다.
전술한 바와 같이, 본 발명은 2개의 2진 이미지를 매칭하는 새로운 방법을 제공한다. 텍스트 이미지들은 그들이 많은 반복되는 텍스트 문자들을 포함하고 있어, 문자 레벨에 있어서 매우 과다하기 때문에 이진 이미지의 특별한 형태이다. JBIG2와 같은 이미지 압축 방법은 패턴 매칭 기술에 기초하여 텍스트를 코딩함으로써 이러한 과다성을 이용할 수 있다. 픽셀 단위의 입력 이미지 픽셀에서의 모든 문자 비트맵(심볼)을 코딩한다기 보다는, 패턴 매칭 기반의 코딩 시스템에 있어서, 엔코더는 먼저 모든 심볼들로부터 대표 서브세트 심볼을 선택하고 그들을 사전으로 전송한다.
두 개의 심볼을 비교하기 위해 사용된 거리 메트릭은, 높은 압축률을 가져오는 빠르고 정밀한 압축 알고리즘을 획득하기 위한 하나의 키(key)이다. PWXOR로 지칭되는 본 발명은 매칭 프로세스의 고비용을 감축하고 동시에 품질/비트 비율을 향상시키기 때문에 PM&S를 사용하는 어떤 코딩 방법에 유용하다.
도 1은 종래 이미지 엔코딩 및 디코딩 시스템에서 세 개의 영역으로 분할된 입력 이미지를 보여주는 도면.
도 2는 배타적 세력 또는 거리 메트릭을 보여주는 도면.
도 3은 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치를 보여주는 도면.
도 4는 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템의 매칭 방법을 보여주는 흐름도.
도 5는 도 3의 텍스트 이미지 코딩 및 디코딩 시스템에서 사용된 테스트 이미지를 보여주는 도면.
도 6은 종래 이미지 엔코딩 및 디코딩 시스템 및 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템의 압축률을 보여주는 도면.
도 7은 종래 이미지 엔코딩 및 디코딩 시스템 및 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 요구된 심볼 매칭의 평균수를 보여주는 도면.
도 8은 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템의 다른 매칭 방법을 보여주는 흐름도.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 관하여 상세히 설명한다.
본 발명은 WXOR 메트릭에 비교될 수 있는 압축률을 보유하면서 XOR 메트릭의 계산을 요구하는 속도를 획득하는 방법을 제공한다.
XOR 메트릭을 이용하면, 상기 방법은 대강의 작업으로 심볼과 기준 심볼 간의 매칭을 빠르게 확인할 수 있고, 이때 매칭이 불확실할 경우, WXOR 메트릭이 보다 정교한 작업으로서 사용될 수 있다. 본 실시예는 2-레벨 문서의 JBIG2 엔코딩에 적용될 수 있다. 이 경우에, 매칭 방법은 심볼들을 비교하고, 대강 및 정밀 작업에서 사전을 형성하기 위하여 사용될 수 있다. 본 실시예의 매칭 방법은 PWXOR (prescreened weighted exclusive OR)로 지칭될 수 있다.
도 3은 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치를 보여주는 도면이다.
도 3을 참조하면, 텍스트 이미지 코딩(엔코딩) 및 디코딩 시스템(300)은 엔코딩 장치(310)와 디코딩 장치(360)를 포함할 수 있다. 엔코딩 장치(310)는 스캐너(320), 매칭 유니트(330), 코더(340), 컨트롤러(350)를 포함할 수 있다. 디코딩 장치(360)는 디코딩 유니트(361), 프린팅 유니트(362)를 포함할 수 있다. 텍스트 이미지 코딩(엔코딩) 및 디코딩 시스템(300)은 엔코딩 장치(310)와 디코딩 장치(360)사이에서 회로나, 유/무선 네트워크와 같은 라인(390)을 통해 엔코딩된 데이터를 전송하고 수신하는 전송 유니트(370)와 수신 유니트(380)를 더 포함할 수 있다.
스캐너(320)는 광을 문서쪽으로 주사하고, 문서로부터 반사광을 수신하여, 하나의 입력 이미지(또는 이미지 데이터)로서 수신된 광으로부터 스캔된 이미지에 대응하는 입력신호를 발생하는 스캐닝 유니트를 포함할 수 있다. 종래 스캐너가 상기 스캐너(320)로 사용될 수 있다.
매칭 유니트(330)는 디컴포우저(331)와, 두 개의 서브 비교기(332,333)를 갖는 제1 비교기와, 제2 비교기(334)와, 하나의 사전으로서의 기준 심볼들을 저장하는 메모리와 같은 사전(335)을 포함할 수 있다.
디컴포우저(331)는 입력신호(또는 스캔 이미지)를 세 개의 다른 영역, 즉 텍스트 영역, 하프톤 영역, 일반 영역을 나타내는 이진 이미지 신호(2-레벨 이미지 신호)로 분해한다. 여기서, 디컴포우저(331)는 텍스트 영역을 한 개 이상의 스트라이프로 나누거나 쪼개는 디바이더를 포함할 수 있고, 또한 각 스트라이프(또는 스트라이프 이미지)로부터 한 개 이상의 심볼을 추출하기 위한 추출기를 포함할 수 있다. 각 스트라이프는 심볼로 연결된 성분들을 추출하기 위하여 래스터 순서로 스캔된 테스트 영역의 일 부분일 수 있다.
컨트롤러(350)는 텍스트 이미지의 심볼과 심볼 사전의 기준 심볼 사이의 제1 거리를 계산하고, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하는지의 여부를 결정하며, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하지 않으면, 텍스트 이미지의 심볼중의 하나와 기준 심볼 간의 제2 거리를 계산하고, 상기 텍스트의 이미지의 심볼이 상기 제2 거리 및 제2 기준에 따라 기준 심볼과 매칭하는지의 여부를 결정하는 매칭 유니트(330)를 제어한다. 이러한 컨트롤러(350)는 제1 거리와 제2 거리를 계산할 수 있다. 제1 및 제2 기준은 상기 컨트롤러(350) 또는 매칭 유니트(330)에 저장될 수 있다.
일측 서브 비교기(332)는 제1 거리를 서브-기준과 비교하고, 타측 서브 비교기(333)는 제1 거리를 다른 서브-기준과 비교한다.
제2 비교기(334)는 텍스트 이미지의 심볼이 기준 심볼과 매칭하는지를 결정하기 위하여 제2 거리와 제2 기준을 비교한다.
상기 컨트롤러(350)는 스캐너(320)를 경유하여 매칭 유니트(330)로 하여금 텍스트 이미지의 심볼이 기준 심볼과 매칭하는 때를 결정하고, 텍스트 이미지의 심볼과 기준 심볼 간의 매칭을 거절 또는 수용하도록 제어하고, 코더(340)로 하여금 매칭 유니트(330)의 출력 신호를 엔코딩하도록 제어하며, 전송 유니트(370)로 하여금 엔코딩된 신호를 라인(390)을 통해 외부 장치나 디코딩 장치(360)로 전송하도록 제어한다.
디코딩 유니트(361)는 각 심볼 및 사전에 대한 정보에 따라 스트라이프 이미지를 형성하기 위하여 코딩된 심볼을 포함하는 엔코딩된 신호를 수신한다.
디코딩 유니트(361)는 심볼 및 사전에 대한 정보와 함께 각 스트라이프 이미지에 대응하는 코딩된 심볼을 수신할 수 있다.
디코딩 유니트(361)는 상기 수신된 정보에 따라 스트라이프를 갖는 이미지를 재생하기 위하여 기준 심볼에 대한 인덱스 정보와 각 스트라이프에 있는 심볼에 대한 위치 정보를 수신할 수 있다.
디코딩 유니트(361)는 그로부터 디코딩된 데이터를 출력할 수 있고, 프린팅 유니트(362)는 심볼을 포함하여 형성된 스트립(strip)을 포함하는 출력 데이터를 프린팅 매체 위에 프린트할 수 있다. 디코딩 유니트(361)는 디코딩된 데이터 또는 텍스트 이미지 데이터를 회로나 유/무선 네트워크를 통해 외부 장치로 출력할 수 있다. 프린팅 유니트(362)는 한 개 이상의 잉크 노즐을 갖는 한 개 이상의 잉크젯 헤드를 사용하여 프린팅 매체 위에 잉크 방울을 분사하는 잉크젯 프린트 유니트나, 레이저 빔을 이용하여 잠상을 형성하고 토너와 같은 현상제로 그 잠상을 현상하는 레이저 빔 프린팅 유니트일 수 있다.
본 실시예에 따라, 텍스트 이미지 코딩 및 디코딩 시스템(300)에서 사용가능한 장치는 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 텍스트 이미지의 심볼과 기준 심볼 간의 적어도 두 개의 다른 거리와 적어도 두 개의 다른 기준에 따라 매칭하는지를 결정하는 매칭 유니트(330)를 포함할 수 있다.
또한 본 실시예에 따라, 텍스트 이미지 코딩 및 디코딩 시스템(300)에서 사용가능한 장치는 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 제1 거리와 제1 기준을 이용한 대강의 작업에 따라 매칭하는지를 결정하고, 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 대강의 작업에서 매칭하지 않을 때, 제2 거리와 제2 기준을 이용한 정교한 작업에 따라 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 매칭하는지를 결정하는 매칭 유니트(330)를 포함할 수 있다.
또한 본 실시예에 따라, 텍스트 이미지 코딩 및 디코딩 시스템(300)에서 사용가능한 장치는 텍스트 이미지의 심볼과 심볼 사전의 기준 심볼 사이의 제1 거리를 계산하고, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하는지의 여부를 결정하며, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하지 않으면, 텍스트 이미지의 심볼중의 하나와 기준 심볼 간의 제2 거리를 계산하고, 상기 텍스트의 이미지의 심볼이 상기 제2 거리 및 제2 기준에 따라 기준 심볼과 매칭하는지의 여부를 결정하여, 엔코딩된 신호가 그 제1 및 제2 거리와 제1 및 제2 기준을 이용한 결정에 따라 발생되도록 하는 엔코딩 장치(310)를 포함할 수 있다.
또한, 텍스트 이미지 코딩 및 디코딩 시스템(300)은 상기 제1 및 제2 거리와 제1 및 제2 기준을 이용한 결정에 따라 엔코딩된 신호를 수신하고, 텍스트 이미지를 재생하기 위하여 그 수신된 신호를 디코딩하는 디코딩 장치(360)를 포함할 수 있다.
또한, 텍스트 이미지 코딩 및 디코딩 시스템(300)은 디코딩된 신호에 따라 하나의 이미지를 프린팅 매체 위에 텍스트 이미지로 프린팅하는 프린팅 유니트(362)를 포함할 수 있다.
도 4는 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템의 매칭 방법을 보여주는 흐름도이다.
도 3 및 도 4를 참조하면, 단계 S410에서 페이지로부터 추출된 심볼과 사전에 있는 기준 심볼이 기준선이나 중심에 의해 배열된다. 그리하여, 에러 맵이 그 배열된 심볼 및 기준 심볼로부터 생성된다. 단계 S420에서, XOR 거리(dXOR)가 에러 맵에 놓여 있는 픽셀의 총수를 카운팅함으로써 계산된다. 이때 스크리닝 방법은 두 개의 심볼 간의 WXOR 메트릭이 단계 S420의 출력에 따라 계산될 필요가 있는지를 결정한다.
단계 S430의 판단에서, 만일 두 심볼간의 XOR 거리(dXOR)가 미리 결정된 임계치 T1보다 더 크면, 단계 S440에서 더 이상의 고려 없이 매치는 거절된다. 그리고, 만일 두 심볼간의 XOR 거리(dXOR)가 임계치 T1의 반, 즉 T1/2 보다 더 작으면, 매치는 수용되고 심볼은 유사한 것으로 지칭되며, 알고리즘은 종료된다. 그러나, 두 심볼간의 XOR 거리(dXOR)가 T1보다는 작으나 단계 S450에서 T1/2 보다 더 크면, 두 개의 심볼 간의 WXOR 거리가 단계 S460에서 새로운 거리(dWXOR)를 얻기 위하여 계산되고, 단계 S480에서 추정된다. WXOR 거리가 미리 결정된 임계치 T2보다 더 작은 경우에는, 매치는 단계 S492에서 수용되고, 그렇지 않은 경우에는 매치는 단계 S491에서 거절된다. 각 거리 메트릭에 대하여, 적당한 임계치가 결정되어, 위에서 서술된 방법의 분류 과정의 결과에 영향을 미침없이 가능한 한 선택적으로 선택된다.
도 5는 도 3의 텍스트 이미지 코딩 및 디코딩 시스템에서 사용된 테스트 이미지를 보여주는 도면이다. 여기서, 2-레벨 이미지가 테스트 이미지로 사용되었다. 2-레벨 이미지는 세 개의 다른 형태의 메트릭, 예컨대, XOR, WXOR, PWXOR을 이용하여 엔코딩되었다. 그 이미지는 다음의 특징을 갖는다.
* Dimension: 1566ㅧ 2122
* Resolution: 192dpi
* Size: 407Kbyte
* Full clean characters
* No skew
* Contains 1639 symbols
도 6은 종래 이미지 엔코딩 및 디코딩 시스템 및 도 3의 텍스트 이미지 코딩 및 디코딩 시스템의 압축률을 보여주는 도면이고, 도 7은 종래 이미지 엔코딩 및 디코딩 시스템 및 도 3의 텍스트 이미지 코딩 및 디코딩 시스템에서 요구된 심볼 매칭의 평균수를 보여주는 도면이다.
도 6을 참조하면, PWKOR의 본 실시예는 WXOR로부터 획득된 압축률과 유사한 압축률을 갖는 WXOR 및 XOR 보다 훨씬 더 빠른 알고리즘을 제공한다.
도 7을 참조하면, 이는 한 페이지(텍스트 이미지)로부터 추출된 각 심볼마다 요구되는 심볼 매치의 평균수를 비교한다. 더 큰 사전은 각 새로운 심볼을 많은 수의 심볼과 비교하도록 요구된다. 그러므로, JBIG2 엔코딩에 대한 계산 시간은 심볼 사전의 크기에 직접적으로 관련될 것이다. 도 7에 도시된 바와 같이, XOR 및 WXOR 메트릭은 심볼당 각 평균 176 및 131의 매칭 동작을 요구하는 반면에, PWXOR은 심볼당 단지 129 XOR 동작 및 14 WXOR 동작을 요구한다.
본 실시예에 따라, 본 발명의 장치는 일련의 매칭 매트릭스, d1, d2, ..., dn을 사용하도록 확장될 수 있다. 여기서, di를 계산하기 위해 요구되는 계산 시간은 di+1를 계산하기 위해 요구되는 계산 시간보다 짧다.
도 8은 본 발명의 실시예에 따른 텍스트 이미지 코딩 및 디코딩 시스템의 다른 매칭 방법을 보여주는 흐름도이다.
도 3, 4 및 8을 참조하면, 도 8의 동작들은 도 4의 동작들과 유사하다. 따라서, 유사한 동작에 대한 상세한 설명은 생략한다.
단계 S820에서, 거리 d1이 계산되고, 그 거리 d1은 단계 S830에서 임계치 T11과 비교된다. 단계 S830에서 임계치 T11이 만족되지 않으면, 단계 S840에서 매치는 요구된 더 이상의 계산 없이 거절된다. 단계 S830에서 임계치 T11이 만족되면, 단계 S850에서 거리 d1은 임계치 T12와 더 비교된다. 임계치 T12가 만족되면, 단계 S870에서, 요구된 더 이상의 계산 없이 매치는 수용된다. 임계치 T12가 만족되지 않으면, 단계 S880에서 제2 거리 d2가 계산된다. 제2 거리 d2는 단계 S890에서 임계치 T21과 비교된다. 임계치 T21이 만족되면, 단계 S893에서 매치는 수용된다. 임계치 T21이 만족되지 않으면, 제3 거리 d3와 제n번째의 거리 dn가 단계 S894와 단계 S895에서 각각 계산된다. 제3 거리 d3 또는 제n번째의 거리 dn가 단계 S896에서 n번째 임계치 Tn1과 비교된다. 제n번째의 거리 dn가 n번째 임계치 Tn1보다 더 작으면, 매치는 단계 S892에서 수용된다.
제n번째의 거리 dn가 n번째 임계치 Tn1보다 더 작지 않으면, 매치는 단계 S891에서 거절된다. 즉, 첫 번째 조건이 만족되고, 두 번째 조건이 만족되지 않으면, 그 다음의 더욱 복잡한 메트릭 di +1이 적용된다. 이러한 순환적인 사전차단 과정은 총 계산(시간)을 감소시키는 한편, 가장 값비싼 메트릭 dn의 정밀도를 거의 성취할 수 있다.
위에서 설명한 바와 같이, 본 실시예에 의하면, 텍스트 이미지 코딩 및 디코딩 방법은 텍스트 이미지의 심볼과 심볼 사전의 기준 심볼 간의 제1 거리를 계산하는 단계와, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하는지의 여부를 결정하는 단계와, 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준에 따라 상기 기준 심볼과 매칭하지 않으면, 텍스트 이미지의 심볼중의 하나와 기준 심볼 간의 제2 거리를 계산하는 단계와, 상기 텍스트의 이미지의 심볼이 상기 제2 거리 및 제2 기준에 따라 기준 심볼과 매칭하는지의 여부를 결정하는 단계를 포함한다.
또한, 위에서 설명한 바와 같이, 본 실시예에 의하면, 텍스트 이미지 코딩 및 디코딩 방법은 텍스트 이미지의 심볼과 기준 심볼 간의 적어도 두 개의 다른 거리와 적어도 두 개의 다른 기준 값에 따라 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 매칭하는지를 결정하는 단계를 포함한다.
또한, 위에서 설명한 바와 같이, 본 실시예에 의하면, 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치는, 제1 거리와 제1 기준을 이용한 대강의 작업에 따라 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 매칭하는지를 결정하고, 상기 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 대강의 작업으로 매칭하지 않을 때 제2 거리와 제2 기준을 이용한 정교한 작업에 따라 입력 이미지 데이터의 심볼과 사전의 기준 심볼이 매칭하는지를 결정하기 위한 매칭 유니트를 포함한다.
또한, 본 실시예에 따르면, 두 개의 메트릭스가 결합되는데, 두 개중에서 더 빠른 것이 더욱 복잡한 메트릭을 계산하기 위한 스크린 방법으로서 사용된다. 그러므로, 본 실시예는 맡겨진 보기판 매칭 동작의 수를 감소시키고, 동시에 품질/비트 율을 향상시킨다.
본 발명은 또한 컴퓨터 독출가능의 기록 매체상의 프로그램으로서의 컴퓨터 독출가능의 코드로 구현될 수도 있다. 컴퓨터 독출가능의 기록 매체는 컴퓨터 시스템에 의해 나중에 읽혀질 수 있는 데이터를 저장할 수 있는 어떤 데이터 저장 장치이다. 컴퓨터 독출가능의 기록 매체의 예로는 ROM(read-only memory), RAM (random-access memory), CD-ROMs, 마그네틱 테이프, 플로피 디스크, 광학적 데이터 저장 장치, 인터넷을 통한 데이터 전송과 같은 캐리어 웨이브(carrier wave)를 들 수 있다. 컴퓨터 독출가능의 기록 매체는 또한 컴퓨터 독출 가능의 코드가 저장되어 분산 방식으로 실행되도록 하는 네트워크 결합의 컴퓨터 시스템을 망라하여 분산될 수 있다.
또한, 본 발명을 달성하기 위하여 기능적 프로그램, 코드 및 코드 세그먼트들이 본 발명이 속하는 기술분야에서 숙련된 프로그래머들에 의해 용이하게 짜맞추어질 수 있다.
비록 본 발명의 몇 가지 실시예가 보여지고 설명되었다 할지라도, 변경물들이 본 발명의 원리나 사상을 벗어남 없이 그러한 실시예들에서 만들어질 수 있음이 당 기술분야에서 숙력된 사람들에 의해 인식될 것이다. 본 발명의 범위는 청구항들 및 그들의 균등물로 정의된다.
* 도면의 주요 부분에 대한 부호의 설명 *
300 : (본 발명의)텍스트 이미지 코딩 및 디코딩 시스템
310 : 엔코딩 장치 320 : 스캐너
330 : 매칭 유니트 331 : 디컴포우저(decomposer)
332,333 : 서브-비교기 334 : 제2 비교기
335 : 사전 340 : 코더
350 : 컨트롤러 360 : 디코딩 장치
361 : 디코딩 유니트 362 : 프린팅 유니트
370 : 전송 유니트 380 : 수신 유니트
390 : 라인

Claims (15)

  1. 텍스트 이미지의 심볼과 사전의 기준 심볼 간의 적어도 두 개의 다른 거리와 적어도 두 개의 다른 기준 값에 따라 상기 텍스트 이미지의 심볼과 상기 기준 심볼이 매칭하는지를 결정하기 위한 매칭 유니트를 포함하며,
    상기 두 개의 다른 거리는 제1 및 제2 거리를 포함하고,
    상기 두 개의 다른 기준값은 제1 및 제2 기준값을 포함하며,
    상기 매칭 유니트는
    상기 텍스트 이미지의 심볼이 상기 기준 심볼과 매칭하는지의 여부를 결정하기 위하여 상기 제1 거리와 제1 기준을 비교하는 제1 비교기와;
    상기 텍스트 이미지의 심볼이 상기 기준 심볼과 매칭하는지의 여부를 결정하기 위하여 상기 제2 거리와 제2 기준을 비교하는 제2 비교기;를 포함하고,
    상기 제1 기준은 제1 서브-기준과 상기 제1 서브-기준보다 작은 값을 갖는 제2 서브-기준을 포함하고;
    상기 제1 비교기는 상기 제1 거리와 제1 서브-기준을 비교하는 제1 서브-비교기와 상기 제1 거리와 제2 서브-기준을 비교하는 제2 서브-비교기를 포함하며;
    상기 매칭 유니트는 상기 제1 및 제2 서브-비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 상기 제1 거리 및 제1 기준값에 따라 상기 기준심볼과 매칭하지 않으면, 상기 텍스트 이미지의 심볼이 상기 제2거리 및 제2 기준값에 따라 상기 기준 심볼과 매칭하는지 여부를 결정하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  2. 제1항에 있어서,
    상기 제1 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 새로운 기준 심볼이 상기 텍스트 이미지의 심볼과 대응하기 위해 생성되어 심볼 사전에 저장되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  3. 제2항에 있어서,
    상기 매칭 유니트는 상기 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하는 것을 결정하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  4. 제3항에 있어서,
    상기 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 상기 새로운 기준 심볼이 상기 텍스트 이미지의 심볼에 대응하기 위해 생성되어 심볼 사전에 저장되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  5. 제3항에 있어서,
    상기 제2 기준은 상기 제1 및 제2 서브-기준과 다른 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  6. 제3항에 있어서,
    상기 제1 및 제2 서브-비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 새로운 기준 심볼이 상기 텍스트 이미지의 심볼에 대응하기 위해 생성되어 심볼 사전에 저장되는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  7. 제6항에 있어서,
    상기 매칭 유니트는 상기 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하는 것을 결정하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  8. 제1항에 있어서,
    상기 제1, 제2 서브-비교기 및 제2 비교기의 비교에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭할 때, 상기 기준 심볼 및 텍스트 이미지의 심볼의 위치에 대한 정보에 따라 상기 텍스트 이미지의 심볼을 코딩하는 코딩 유니트를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  9. 제1항에 있어서,
    상기 텍스트 이미지의 심볼을 포함하여 한 개 이상의 심볼을 갖는 텍스트 이미지를 추출하기 위하여 이미지 데이터를 분해하는 디컴포우저와;
    기준 심볼 및 텍스트 이미지에 있는 심볼의 위치에 대한 정보를 갖는 심볼을 코딩하는 코더;를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  10. 제9항에 있어서,
    스캔된 이미지를 이미지 데이터로 생성하기 위하여 하나의 대상을 스캔하기 위한 스캐너를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  11. 제2항에 있어서,
    상기 제1 및 제2 거리와 제1 및 제2 기준에 따라 상기 텍스트 이미지의 심볼이 기준 심볼과 매칭하지 않을 때, 새로운 기준 심볼을 생성하기 위하여 상기 심볼 사전을 제어하는 컨트롤러를 더 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  12. 제1항에 있어서,
    상기 제1 거리는 XOR 거리를 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  13. 제1항에 있어서,
    상기 제2 거리는 WXOR 거리를 포함하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  14. 제1항에 있어서,
    상기 제2 기준은 상기 제1 기준 값 보다 더 큰 값을 갖는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
  15. 제1항에 있어서,
    상기 제1 거리는 XOR 거리를 포함하고;
    상기 제2 거리는 WXOR 거리를 포함하며;
    상기 매칭 유니트는 텍스트 이미지의 심볼을 나타내기 위하여 기준 심볼을 사용해야 할지 또는 텍스트 이미지의 심볼을 새로운 기준 심볼로 생성해야 할지를 결정하기 위하여 상기 XOR 거리를 제1 기준과 비교하는 것을 특징으로 하는 텍스트 이미지 코딩 및 디코딩 시스템에서 사용가능한 장치.
KR1020120070531A 2007-01-24 2012-06-29 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭 장치 및 방법 KR101314229B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/626,543 2007-01-24
US11/626,543 US7907783B2 (en) 2007-01-24 2007-01-24 Apparatus and method of matching symbols in a text image coding and decoding system

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020070025728A Division KR101201226B1 (ko) 2007-01-24 2007-03-15 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭장치 및 방법

Publications (2)

Publication Number Publication Date
KR20120093112A KR20120093112A (ko) 2012-08-22
KR101314229B1 true KR101314229B1 (ko) 2013-10-04

Family

ID=39271250

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020070025728A KR101201226B1 (ko) 2007-01-24 2007-03-15 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭장치 및 방법
KR1020120070531A KR101314229B1 (ko) 2007-01-24 2012-06-29 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭 장치 및 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020070025728A KR101201226B1 (ko) 2007-01-24 2007-03-15 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭장치 및 방법

Country Status (4)

Country Link
US (2) US7907783B2 (ko)
EP (1) EP1950950B1 (ko)
KR (2) KR101201226B1 (ko)
CN (1) CN101246596A (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7907783B2 (en) * 2007-01-24 2011-03-15 Samsung Electronics Co., Ltd. Apparatus and method of matching symbols in a text image coding and decoding system
KR101309782B1 (ko) * 2008-09-30 2013-09-23 삼성전자주식회사 문서 처리장치 및 문서 처리방법
KR101074015B1 (ko) * 2009-09-22 2011-10-17 고려대학교 산학협력단 멀티 펑션 4 비트/1 셀 비휘발성 퓨전 메모리 소자 및 그의 제조 방법
US8488886B2 (en) * 2010-08-02 2013-07-16 Celartem, Inc. Font matching
CN101968851B (zh) * 2010-09-09 2012-08-08 西安电子科技大学 基于字典学习上采样的医学影像处理方法
US9020262B2 (en) * 2012-07-31 2015-04-28 Hewlett-Packard Development Company, L.P. Symbol compression using conditional entropy estimation
CN105164665B (zh) * 2013-04-30 2018-10-02 惠普发展公司,有限责任合伙企业 一种层级词典的创建方法及图像压缩系统
US8928949B1 (en) * 2013-08-19 2015-01-06 Xerox Corporation Method and apparatus for minimizing gray level variation within each symbol in Microtext
WO2015054811A1 (en) 2013-10-14 2015-04-23 Microsoft Corporation Features of intra block copy prediction mode for video and image coding and decoding
KR102318785B1 (ko) 2013-10-14 2021-10-27 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 영상 코딩 및 디코딩에 대한 기본 색상 인덱스 맵 모드의 특징
EP3058736B1 (en) 2013-10-14 2019-02-27 Microsoft Technology Licensing, LLC Encoder-side options for intra block copy prediction mode for video and image coding
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
BR112016015080A2 (pt) 2014-01-03 2017-08-08 Microsoft Technology Licensing Llc Predição de vetor de bloco em codificação / decodificação de vídeo e imagem
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
US10785486B2 (en) 2014-06-19 2020-09-22 Microsoft Technology Licensing, Llc Unified intra block copy and inter prediction modes
CA3171803A1 (en) 2014-09-30 2016-04-07 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
KR101595189B1 (ko) * 2014-11-14 2016-02-19 인하대학교 산학협력단 압축된 문자열에 대한 Boyer-Moore-Horspool 알고리즘 기반 패턴매칭 방법
CN106664405B (zh) 2015-06-09 2020-06-09 微软技术许可有限责任公司 用调色板模式对经逸出编码的像素的稳健编码/解码
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
KR102156357B1 (ko) * 2018-12-17 2020-09-15 연세대학교 산학협력단 스와이프 라인 촬상 센서를 이용하여 등간격 이미지를 취득하는 이미지 취득 시스템 및 방법, 그것을 포함하는 지문인증시스템 및 컨트롤러시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100312810B1 (ko) * 1997-12-12 2001-12-12 고형화 패턴상관성의 효율적인 이용에 의한 2진 영상의 유/무손실부호화방법
KR20030084590A (ko) * 2002-04-25 2003-11-01 마이크로소프트 코포레이션 클러스터링

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4288782A (en) * 1979-08-24 1981-09-08 Compression Labs, Inc. High speed character matcher and method
GB8525509D0 (en) 1985-10-16 1985-11-20 Int Computers Ltd Symbol pattern matching
JP2735187B2 (ja) * 1987-03-17 1998-04-02 株式会社東芝 情報検索方法
US5572604A (en) * 1993-11-22 1996-11-05 Lucent Technologies Inc. Method for pattern recognition using prototype transformations and hierarchical filtering
JP3260979B2 (ja) * 1994-07-15 2002-02-25 株式会社リコー 文字認識方法
US5867114A (en) * 1996-02-29 1999-02-02 Mitel Corporation Method and apparatus for performing data compression
US5835638A (en) * 1996-05-30 1998-11-10 Xerox Corporation Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
AU3274301A (en) * 2000-01-05 2001-07-16 Realnetworks, Inc. Systems and methods for multiple-file data compression
JP2003084590A (ja) 2001-09-12 2003-03-19 Fuji Xerox Co Ltd 画像形成装置
EP1388815A3 (en) 2002-04-25 2005-11-16 Microsoft Corporation Segmented layered image system
US6987882B2 (en) * 2002-07-01 2006-01-17 Xerox Corporation Separation system for Multiple Raster Content (MRC) representation of documents
DE10301362B4 (de) * 2003-01-16 2005-06-09 GEMAC-Gesellschaft für Mikroelektronikanwendung Chemnitz mbH Blockdatenkompressionssystem, bestehend aus einer Kompressionseinrichtung und einer Dekompressionseinrichtung, und Verfahren zur schnellen Blockdatenkompression mit Multi-Byte-Suche
KR100597004B1 (ko) * 2004-11-22 2006-07-06 삼성전자주식회사 심볼 사전 재배치 방식을 이용한 이진 영상 처리 장치 및방법
RU2007135945A (ru) * 2005-02-28 2009-04-10 Зи Декума Аб (Se) Граф распознавания
WO2006091155A1 (en) * 2005-02-28 2006-08-31 Zi Decuma Ab Segmentation-based recognition
KR200384590Y1 (ko) 2005-03-07 2005-05-16 지대호 이중 패드로 구성된 발 질환 치료용구
KR100599141B1 (ko) 2005-05-20 2006-07-12 삼성전자주식회사 문서 압축시스템 및 그 압축방법
CA2509496A1 (en) * 2005-06-06 2006-12-06 3618633 Canada Inc. Search-enhanced trie-based syntactic pattern recognition of sequences
US7365658B2 (en) * 2006-02-28 2008-04-29 The Board Of Trustees Of The University Of Arkansas Method and apparatus for lossless run-length data encoding
US7907783B2 (en) * 2007-01-24 2011-03-15 Samsung Electronics Co., Ltd. Apparatus and method of matching symbols in a text image coding and decoding system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100312810B1 (ko) * 1997-12-12 2001-12-12 고형화 패턴상관성의 효율적인 이용에 의한 2진 영상의 유/무손실부호화방법
KR20030084590A (ko) * 2002-04-25 2003-11-01 마이크로소프트 코포레이션 클러스터링

Also Published As

Publication number Publication date
EP1950950B1 (en) 2011-08-17
US20080175487A1 (en) 2008-07-24
CN101246596A (zh) 2008-08-20
KR20080069886A (ko) 2008-07-29
EP1950950A1 (en) 2008-07-30
KR20120093112A (ko) 2012-08-22
KR101201226B1 (ko) 2012-11-13
US7907783B2 (en) 2011-03-15
US20110158545A1 (en) 2011-06-30
US8300963B2 (en) 2012-10-30

Similar Documents

Publication Publication Date Title
KR101314229B1 (ko) 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭 장치 및 방법
US7164797B2 (en) Clustering
US8180164B2 (en) OCR-guided text tokenization of digital images
JP4733911B2 (ja) インククラスタの明示的な表現を用いた2レベルイメージの圧縮
US20090148042A1 (en) Text representation method and apparatus
JP5049921B2 (ja) 画像処理装置及び画像処理方法
US20080316538A1 (en) Device using low visibility encoded image to manage copy history
JPS6145429B2 (ko)
US20060182358A1 (en) Coding apparatus, decoding apparatus, data file, coding method, decoding method, and programs thereof
EP0902398B1 (en) Method and system for compressing and decompressing binary representations of dithered images
KR101123708B1 (ko) 텍스트 이미지 코딩 및 디코딩 시스템에서 사전 관리를위해 심볼을 다이나믹하게 캐슁하는 장치 및 방법
Grailu et al. An improved pattern matching technique for lossy/lossless compression of binary printed Farsi and Arabic textual images
US7702154B2 (en) Method and apparatus indentifying halftone regions within a digital image
GB2332801A (en) Prediction image generating apparatus
JPH1155528A (ja) 画像符号化装置
Ageenko et al. Context-based filtering of document images
JP2008205994A (ja) 画像符号化装置、画像復号化装置、画像処理システム及びプログラム
JP2002204358A (ja) 適応型予測符号化、復号化方法およびそれらの装置ならびに適応型予測符号化、復号化プログラムを記録した記録媒体
KR20230099224A (ko) Ocr을 이용한 문자판독방법
KR20050113510A (ko) 하프토닝 처리장치 및 방법
JP4529681B2 (ja) 画像データの圧縮方法および装置
Zhang Document image compression via pattern matching
Boncelet 11 Binary Image Compression
JPH064705A (ja) 画像処理装置

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160830

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170825

Year of fee payment: 5