KR100937543B1 - 세그먼트된 계층화 이미지 시스템, 사진 복사기, 문서 스캐너, 광학 문자 인식 시스템, pda, 팩스 장치, 디지털 카메라, 디지털 비디오 카메라, 비디오 게임 시스템, 마스크의 생성 방법, 마스크 분리기 컴포넌트, 문서 이미지 압축 시스템, 데이터 패킷 및 컴퓨터 판독가능 매체 - Google Patents

세그먼트된 계층화 이미지 시스템, 사진 복사기, 문서 스캐너, 광학 문자 인식 시스템, pda, 팩스 장치, 디지털 카메라, 디지털 비디오 카메라, 비디오 게임 시스템, 마스크의 생성 방법, 마스크 분리기 컴포넌트, 문서 이미지 압축 시스템, 데이터 패킷 및 컴퓨터 판독가능 매체 Download PDF

Info

Publication number
KR100937543B1
KR100937543B1 KR1020030018541A KR20030018541A KR100937543B1 KR 100937543 B1 KR100937543 B1 KR 100937543B1 KR 1020030018541 A KR1020030018541 A KR 1020030018541A KR 20030018541 A KR20030018541 A KR 20030018541A KR 100937543 B1 KR100937543 B1 KR 100937543B1
Authority
KR
South Korea
Prior art keywords
foreground
background
energy
pixel
mask
Prior art date
Application number
KR1020030018541A
Other languages
English (en)
Other versions
KR20030084589A (ko
Inventor
시마드패트릭와이.
렌샤에린엘.
린커제임스러셀
Original Assignee
마이크로소프트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/133,558 external-priority patent/US7164797B2/en
Priority claimed from US10/133,939 external-priority patent/US7392472B2/en
Priority claimed from US10/133,842 external-priority patent/US7263227B2/en
Application filed by 마이크로소프트 코포레이션 filed Critical 마이크로소프트 코포레이션
Publication of KR20030084589A publication Critical patent/KR20030084589A/ko
Application granted granted Critical
Publication of KR100937543B1 publication Critical patent/KR100937543B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Character Discrimination (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

문서 이미지의 포그라운드(foreground)를 백그라운드(background)로부터 분리하는 마스크를 이용하여 문서 이미지 압축을 용이하게 하는 시스템 및 방법이 제공된다. 본 발명은 영역들을 포그라운드와 백그라운드로 파티셔닝하도록 설계되는 화소 에너지 분석기를 포함한다. 본 발명은 합병된 영역이 임계 에너지를 초과하는 않았다면 영역들의 합병을 시도하도록 설계되는 합병 영역 컴포넌트를 더 제공한다. 합병된 영역들은 새로운 포그라운드와 새로운 백그라운드들로 파티셔닝된다. 그 후, 마스크 저장 컴포넌트가 바이너리(binary) 마스크에 파티셔닝(partitioning) 정보를 저장한다.
포그라운드, 백그라운드, 문서 이미지, 압축, 마스크

Description

세그먼트된 계층화 이미지 시스템, 사진 복사기, 문서 스캐너, 광학 문자 인식 시스템, PDA, 팩스 장치, 디지털 카메라, 디지털 비디오 카메라, 비디오 게임 시스템, 마스크의 생성 방법, 마스크 분리기 컴포넌트, 문서 이미지 압축 시스템, 데이터 패킷 및 컴퓨터 판독가능 매체{SYSTEM AND METHOD FACILITATING DOCUMENT IMAGE COMPRESSION UTILIZING A MASK}
도 1은 본 발명의 특징에 따른 마스크 분리기 컴포넌트(mask separator component)의 블록도.
도 2는 본 발명의 특징에 따른 예시적인 문서 이미지.
도 3은 본 발명의 특징에 따른 도 2의 예시적인 문서 이미지와 관련된 마스크.
도 4는 본 발명의 특징에 따른 도 2의 예시적인 문서 이미지 및 도 3의 마스크와 관련된 백그라운드(background).
도 5는 본 발명의 특징에 따른 문서 이미지의 예시적인 2화소 x 2화소 영역.
도 6은 본 발명의 특징에 따른 문서 이미지의 예시적인 2화소 x 4화소로 잠재적으로 합병된 영역.
도 7은 본 발명의 특징에 따른 문서 이미지의 예시적인 4화소 x 4화소로 잠재적으로 합병된 영역.
도 8은 본 발명의 특징에 따른 마스크의 생성 방법론을 설명하는 흐름도.
도 9는 도 8의 방법론을 더 설명하는 흐름도.
도 10은 본 발명의 특징에 따른 문서 이미지 분리 시스템의 블록도.
도 11은 본 발명의 특징에 따른 문서 이미지 압축의 블록도.
도 12는 본 발명의 특징에 따른 문서 이미지 압축의 블록도.
도 13은 본 발명의 특징에 따른 세그먼트된 계층화 이미지 시스템(segmented layered image system)의 블록도.
도 14는 본 발명에 따라 구성된 시스템에 대한 예시적인 동작 환경의 개략적인 블록도.
도 15는 본 발명에 따른 예시적인 통신 환경의 개략적인 블록도.
〈도면의 주요 부분에 대한 부호의 설명〉
100 : 마스크 분리기 컴포넌트
110 : 문서 이미지
120 : 마스크
130 : 화소 에너지 컴포넌트
140 : 영역 합병 컴포넌트
150 : 마스크 저장 컴포넌트
160 : 포그라운드/백그라운드 세그멘터 컴포넌트
170 : 포그라운드 이미지
180 : 백그라운드 이미지
본 명세서는 2002년 4월 25일자로 출원된 "액티비티 디텍터(ACTIVITY DETECTOR)"라는 제목의 미국 실용신안 공보 제10/133,842호, 2002년 4월 25일자로 출원된 "클러스터링(CLUSTRING)"이라는 제목의 미국 실용신안 공보 제10/133,558호, 및 2002년 4월 25일자로 출원된 "레이아웃 분석(LAYOUT ANALYSIS)"라는 제목의 미국 실용신안 공보 제10/133,939호의 연속물이다.
본 발명은 일반적으로 문서 이미지 처리에 관한 것으로, 특히 문서 이미지의 포그라운드(foreground)를 백그라운드(background)로부터 파티셔닝하는(partitioning) 마스크를 이용하여 문서 이미지 압축을 용이하게 하는 시스템 및 방법에 관한 것이다.
컴퓨터를 통해 이용할 수 있는 정보량은 컴퓨터 네트워크들, 인터넷 및 디지털 저장 수단들의 폭넓은 확산에 의해 크게 증가하고 있다. 정보량이 증가함에 따라 정보를 고속으로 전송하고 정보를 효율적으로 저장할 필요가 있다. 데이터 압축은 문서(들)를 보다 효과적으로 전송하거나 또는 저장하는 하나의 방식이다.
종래 데이터 압축 시스템들은 예를 들면 심볼 매칭(symbol matching) 등의 다양한 압축 접근을 이용했다. 그러나, 이미지(들)를 갖는 문서들에 효과적으로 작용하는 일반적인 압축 접근들은, 예를 들면, 텍스트 및/또는 수기(handwriting)를 갖는 문서에서는 잘 작용하지 않는다.
데이터 압축은 정보를 표시하는데 필요한 공간을 감소시킨다. 압축은 임의의 형식의 정보에 사용될 수 있다. 그러나, 이미지들, 텍스트, 음성, 및 영상을 포함하는 디지털 정보의 압축이 보다 중요하게 되고 있다. 일반적으로 데이터 압축은 표준 컴퓨터 시스템에 의해 사용된다. 그러나, 셀룰러/디지털 폰뿐만 아니라 디지털 및 위성 텔레비전 등의(이에 한정되지 않음), 다른 기술들도 데이터 압축을 이용한다.
데이터 압축은 여러가지 이유에서 중요하다. 데이터 압축에 의해 정보는 압축되지 않은 데이터보다 적은 공간에 저장될 수 있다. 대량의 정보에 대한 요구가 증가함에 따라, 대량의 정보를 공급하는 데에 데이터 압축이 요구될 수 있다. 저장 장치들의 사이즈는 크게 증가했지만, 정보에 대한 요구는 이들 사이즈 증가를 넘어서고 있다. 예를 들면, 압축되지 않은 이미지는 5 메가바이트의 공간을 차지할 수 있는 반면, 동일한 이미지가 압축되어 2.5 메가바이트의 공간만을 차지할 수 있다. 또한, 데이터 압축은 압축되지 않은 정보보다 많은 양의 압축된 정보를 전송할 수 있게 한다. 광대역, DSL, 케이블 모뎀 인터넷 등과 같이, 전송률의 증가에도 불구하고, 압축되지 않은 정보를 이용한다면 전송 제한들에 쉽게 도달하게 된다. 예를 들면, DSL 라인을 통한 압축되지 않은 이미지의 전송은 10분이 걸릴 수 있다. 그러나, 데이터 압축에 의하면, 약 1분 내에 동일한 이미지가 전송될 수 있다.
일반적으로, 무손실 압축 및 손실 압축인 2가지 형태의 압축이 있다. 무손실 압축에 의하면 압축 후에 정확히 원래의 데이터가 복구될 수 있지만, 손실 압축에 의하면 압축해제된 데이터와 원래의 데이터가 달라질 수 있다. 손실 압축은 원래 데이터로부터 데이터를 제거할 수 있기 때문에 압축률이 더 좋아질 수 있다. 예를 들면, 중요한 텍스트를 압축하는 경우에 데이터를 정확하게 재현하지 못하는 것은 텍스트의 질과 판독가능성에 심각한 영향을 줄 수 있기 때문에, 무손실 압축이 이용될 수 있다. 소정 양의 왜곡 또는 노이즈가 우리의 제한된 감각들에 의해 지각될 수 없거나 또는 수용될 수 있는 이미지 또는 중요하지 않은 텍스트에는 손실 압축이 사용될 수 있다.
데이터 압축은 특히 디지털 문서들에 적용가능하다. 디지털 문서들 또는 디지털 문서 이미지들은 문서들의 디지털 표시이다. 일반적으로, 디지털 문서들은 텍스트, 이미지들 및/또는 텍스트와 이미지들을 포함한다. 현재 디지털 데이터에 대해 적은 저장 공간을 사용하는 것에 부가하여, 현저한 질의 저하가 없는 컴팩트(compact) 저장장치가 종이없는 오피스(paperless office)를 가능하게 하는 현행 하드 카피(hard copies)의 디지털화를 장려할 것이다. 이러한 종이없는 오피스를 향한 노력은, 종이없는 오피스가 많은 이점, 예를 들면, 정보에 대한 액세스를 용이하게 하고, 환경적 비용을 감소시키고, 저장 공간 비용 등을 감소시킨다는 이점을 제공하기 때문에 사업상 중요한 목적이다. 또한, 압축을 통해 디지털 문서들의 파일 크기를 감소시킴으로써 인터넷 대역폭의 보다 효율적인 사용이 가능해지고, 이에 의해 많은 정보의 고속 전송 및 네트워크 정체(congestion)의 감소가 가능해진다. 정보에 요구되는 저장 공간의 감소, 효율적인 종이없는 오피스로의 전환, 및 인터넷 대역폭 효율성의 증가는 압축 기술의 많은 중요한 장점들 중 단지 일부이다.
디지털 문서들의 데이터 압축은, 디지털 문서의 사용을 보다 매력적인 것으로 만들기 위한 많은 목표를 갖는다. 첫째, 데이터 압축은 많은 양의 정보를 단기간 동안에 압축 및 압축해제할 수 있어야 한다. 둘째, 데이터 압축은 디지털 문서를 정확하게 재생할 수 있어야 한다.
또한, 디지털 문서들의 데이터 압축시에 문서의 용도를 활용해야 한다. 일부 디지털 문서들은 하드 카피들을 파일링 또는 제공하는 데 사용된다. 다른 문서들은 개정 및/또는 편집될 수 있다. 현재의 데이터 압축은 검사시 텍스트 및/또는 이미지들의 리플로우(reflow)를 처리할 수 없고, 인식된 문자들에 압축 기술을 가능하게 하고 그것들을 워드 프로세서, PDA(personal digital assistants), 셀룰러폰 등에 리플로우하는 효율적이고 효과적인 수단들을 제공할 수 없다. 따라서, 하드 카피 오피스 문서들이 디지털 형식으로 스캔되면, 현재의 압축 기술은, 디지털화된 문서를 갱신, 보정, 또는 일반적으로 변경하는 것을, 불가능하지는 않지만, 어렵게 할 수 있다.
다음은 본 발명의 일부 특징들의 기본적인 이해를 제공하기 위해 발명의 간단한 요약을 제시한다. 이 요약은 본 발명의 광범위한 개관은 아니다. 이는 본 발명의 핵심적인/중요한 구성요소들을 식별하거나 본 발명의 범위를 서술하기 위해 의도되지 않는다. 이 요약의 유일한 목적은 발명의 일부 개념을 후술되는 보다 상세한 설명에 대한 서두로서 간단한 형식으로 제시하는 것이다.
본 발명은 일반적으로 문서 이미지의 포그라운드와 백그라운드를 파티셔닝하는 마스크를 이용하여 문서 이미지 압축을 용이하게 하는 시스템 및 방법에 관한 것이다. 본 발명의 하나의 특징에 따르면, 마스크 분리기 컴포넌트(mask separator component)는 문서 이미지(즉, 문서(들)의 바이너리, RGB 및/또는 YUV 표시)를 입력으로서 수신한다. 마스크 분리기 컴포넌트는 문서 이미지를 처리하고 문서 이미지의 각 화소가 포그라운드 및/또는 백그라운드에 속하는 지를 나타내는 마스크(예를 들어, 바이너리)를 출력한다. 포그라운드(예를 들어, 텍스트 정보)와 백그라운드(예를 들어, 그래픽 정보)를 분리함으로써, 포그라운드 및/또는 백그라운드는 보다 효과적으로 압축될 수 있고, 이에 의해 파일 크기 및/또는 전송 시간을 감소시킬 수 있다. 그 후 마스크 및/또는 문서 이미지는 압축 시스템의 다른 부분(들)에 의해 (예를 들면, 문서 이미지의 개선된 압축을 실현하기 위해)처리될 수 있다. 예를 들면, 본 발명의 시스템 및/또는 방법은 텍스트, 수기, 그림 등의 식별 및/또는 압축을 용이하게 하는, 전체 세그먼트된 계층화 이미지 시스템(segmented layered image system)에서 이용될 수 있다.
본 발명의 하나의 특별한 특징에 따르면, 마스크 분리기 컴포넌트는 화소 에너지 컴포넌트, 영역 합병 컴포넌트 및 마스크 저장 컴포넌트를 포함한다. 화소 에너지 컴포넌트는 포그라운드 및/또는 백그라운드의 에너지 분산(variance)(들)을 최소화하기 위해 문서 이미지의 영역(들)에 대한 화소 에너지(즉, 분산)를 계산하도록 적응된다. 에너지(예를 들면, 거리의 제곱의 합에 기초하는 에너지 측정치)는 포그라운드 및/또는 백그라운드에 대해 얻어질 수 있는 압축의 견적으로서 사용된다. 그러나, 계산 비용을 간단히 하기 위해, 문서 이미지는 영역들(예를 들어, 2화소 x 2화소) 및 각 영역에 대해 (예를 들어, 적어도 부분적으로 포그라운드 및/또는 백그라운드의 에너지 분산(들)의 최소화에 기초하여) 결정된 포그라운드와 백그라운드로 파티셔닝될 수 있다. 즉, 각 영역 자체는 2개의 세트: 포그라운드에 속하는 화소들, 및 백그라운드에 속하는 화소들로 파티셔닝된다. 계산 비용을 더 최소화하기 위해, 화소 에너지 컴포넌트는 적어도 일시적으로 합병 영역 컴포넌트 및/또는 마스크 저장 컴포넌트에 의해 사용되는 계산 정보를 저장할 수 있다.
영역 합병 컴포넌트는, 잠재적인 합병 영역들의 새로운 포그라운드 및/또는 새로운 백그라운드의 에너지들이 제1 임계 에너지보다 작은 지에 대한 판정에 적어도 부분적으로 기초하여 문서 이미지의 영역들의 쌍들의 합병을 시도하도록 적응된다. 영역 합병 컴포넌트는 화소 에너지 컴포넌트에 의해 저장되는 계산 정보를 이용할 수 있다. 합병의 결물은 그 자체의 포그라운드 및 백그라운드 파티션(partition)에 의해 특징지어지는 보다 큰 영역이다. 합병 이전에 포그라운드였던 화소(들)는 합병된 영역의 백그라운드로 귀결될 수 있고 그 반대도 가능하다. 영역 합병 컴포넌트는 예컨대 새로운 백그라운드 및 새로운 포그라운드 에너지들의 최소화에 적어도 부분적으로 기초하여, 합병된 에너지의 적절한 포그라운드/백그라운드 파티션을 결정할 수 있다.
영역 합병 컴포넌트는 임계 에너지가 초과되거나 실질적으로 모든 문서이미지가 합병될 때까지 연속적으로 보다 큰 영역들을 합병하도록 계속 시도할 수 있다. 예를 들면, 영역 합병 컴포넌트는 수평으로 인접하는 2x2 영역들을 2x4 영역들로 합병할 수 있다. 그 후, 영역 합병 컴포넌트는 영역들을 4x4 영역으로 수직으로 합병할 수 있다. 일반적으로, 제1 임계 에너지값은, (예를 들면, 영역에 두 가지 이상의 색이 있는 경우) 텍스트 등의 중요한 세부 사항(들)의 잠재적인 손실에 따라, 시도된 합병(들)이 여러개의 계조 레벨들을 포그라운드 또는 백그라운드로 파티셔닝하는 잠재적인 상황(들)을 완화하도록 선택될 수 있다. 따라서, 문서 이미지와 관련된 대부분의 텍스트 및/또는 그래픽 라인(들)을 캡쳐(capture)하는 마크스가 캡쳐될 수 있다.
일단 영역에 대해 합병이 완결되면, 이 영역에 대한 포그라운드 및 백그라운드의 파티션이 마스크를 구성한다. 예를 들면, 포그라운드에 속하는 화소(들)는 마스크에서 "1"로 할당될 수 있는 반면, 백그라운드에 속하는 화소(들)는 "0"으로 할당될 수 있다. 불행히도, 합병 동작시 포그라운드 및 백그라운드 파티션들을 계속하여 추적하는 것은 고도의 계산이 요구될 수 있다. (예를 들어, 보다 계산적으로 효율적인) 대안은, 합병된 영역의 거의 모든 화소들의 평균을 계산하여 이 평균보다 큰 계조 레벨값을 갖는 화소(들)를 포그라운드에 할당하며, 나머지 화소는 백그라운드에 할당되도록 하는 것이다. 또는, 평균보다 큰 계조 레벨 값을 갖는 화소(들)는 백그라운드에 할당되고, 나머지 화소(들)는 포그라운드에 할당될 수 있다. 2가지 대안들은 시각적으로 차이가 없는 마스크들을 계산할 수 있다.
그 후, 마스크 저장 컴포넌트는 마스크의 포그라운드와 백그라운드를 파티셔닝하는 것과 관련된 정보를 저장하도록 적응된다. 따라서, 마스크는 문서 이미지의 각 화소가 포그라운드 및/또는 백그라운드에 속하는 지를 나타낸다.
본 발명의 다른 특징에 의하면, 계산 비용을 최소화하기 위해, 작은 영역(예를 들어, 4화소x4화소)에 대한 에너지가 화소 에너지 컴포넌트에 의해 계산될 수 있다. 에너지가 제2 임계 에너지보다 작으면, 실질적으로 모든 화소들은 포그라운드 또는 백그라운드에 할당될 수 있고, 나머지는 거의 비어있다. 에너지가 제2 임계 에너지보다 크거나 같으면, 파티셔닝(partitioning)은 상기한 바와 같이 진행될 수 있다. (예를 들어, 일정한 면적(들)을 갖는) 비교적 깨끗한 문서 이미지(들)에 대해, 계산 속도의 상당한 증가가 달성될 수 있다.
본 발명의 다른 특징에 의하면, 마스크의 사이즈를 최소화하기 위해, 최종 영역(예를 들면, 제1 임계 에너지를 초과하지 않고 합병될 수 없는 영역)이 제3 임계 에너지보다 높은 평균 포그라운드와 평균 백그라운드 사이의 차를 가지면, 영역의 전체 평균이 중간 계조 레벨값(예를 들어, 계조레벨 값들이 0과 255 사이이면 127)보다 큰지 또는 작은지에 따라, 전체 영역은 포그라운드로 선언되거나 백그라운드로 선언된다. 약간의 디더링을(dithering) 갖는 칼라 문서에 있어서, 이들 영역에 대한 마스크는 이러한 최적화가 없는 솔트 앤드 페퍼(salt and pepper)와 같고, 압축 비용이 높을 것이다. 제3 임계치는 중요한 텍스트를 손실하지 않고, 많은 경우의, 프린트된 문서를 스캐닝할 때 나타나는 약간의 디더링(dithering)도 (예를 들면, 많은 프린터들은 4 내지 6가지의 색들만을 가져서 색들의 전체 팔레트를 생성하기 위해 디더링을 이용해야 함) 제거하도록 선택된다. 일 예에서는, 제3 임계치로는 값 40이 좋은 선택치이다.
본 발명의 또 다른 특징은 포그라운드 및/또는 백그라운드를 설명하기 위해 다항 회귀(polynomial regression)를 이용하는 화소 에너지 컴포넌트를 제공한다.
본 발명의 다른 특징은 마스크 분리기 컴포넌트 및 포그라운드/백그라운드 세그멘터(segmenter)를 갖는 문서 이미지 분리 시스템을 제공한다. 마스크 분리기 컴포넌트는 문서 이미지(예를 들면, 텍스트 및/또는 수기를 포함)를 처리하고, 어떤 화소들이 포그라운드에 있는지, 어떤 화소들이 마스크의 백그라운드에 있는 지에 대한 정보를 저장할 수 있다. 그 후, 포그라운드/백그라운드 세그멘터는 마스크와 문서 이미지를 수신할 수 있고 문서 이미지를 포그라운드 이미지와 백그라운드 이미지로 분리할 수 있다.
본 발명의 또 다른 특징에 의하면, 문서 이미지 변환 컴포넌트, 마스크 분리 컴포넌트 및 포그라운드/백그라운드 분리 컴포넌트를 갖는 문서 이미지 압축 시스템이 제공된다. 선택적으로, 문서 이미지 압축 시스템은 마스크 인코더, 포그라운드 인코더 및/또는 백그라운드 인코더를 포함할 수 있다.
본 발명의 또 다른 특징은 화소 에너지 컴포넌트 및 마스크 저장 컴포넌트를 갖는 세그먼트된 계층화 이미지 시스템을 제공한다. 세그먼트된 계층화 이미지 시스템은 사진 복사기들, 문서 스캐너들, 광학 문자 인식 시스템들, PDA, 팩스, 디지털 카메라, 디지털 비디오 카메라 및/또는 비디오 게임 시스템을 포함하지만 이에 한정되지 않는 다량의 문서 이미지 어플리케이션들에 사용될 수 있다.
본 발명의 다른 특징들은 마스크를 생성하기 위한 방법, 마스크와 관련된 정보를 포함하는 2개 이상의 컴퓨터 프로세스들 사이에 전송되도록 적응된 데이터 패킷 및 마스크 분리 컴포넌트에 대한 컴퓨터 사용가능한 명령어들을 갖는 컴퓨터 판독가능 매체를 제공하며, 여기서 마스크는 문서 이미지의 포그라운드 및 백그라운드 중 적어도 하나에 화소들을 할당하고, 문서 이미지의 영역에 있는 화소들의 에너지 최소화 계산에 적어도 부분적으로 기초한다.
상기 및 관련된 목적을 달성하기 위해, 본 발명의 임의의 예시적인 특징들이 다음 설명과 첨부된 도면에 따라 기재되었다. 그러나, 이들 특징들은 본 발명의 원리들이 채용될 수 있는 각종 방식들 중 단지 소수만을 나타낸 것이며, 본 발명은 모든 이러한 특징들 및 그 등가물들을 포함하도록 의도된다. 본 발명의 다른 이점들 및 진보적인 특징들은 도면과 함께 고려될 때 하기의 발명의 상세한 설명으로부터 명백해질 것이다.
이제 본 발명은 도면을 참조하여 기술되며, 전반적으로 동일한 구성요소들을 참조하기 위해 동일한 참조 부호들이 사용된다. 다음 기재에서, 설명의 편의상, 본 발명의 총체적인 이해를 제공하기 위해 다수의 특정 세부사항들이 기술된다. 그러나, 본 발명은 이들 특정 세부사항들 없이 실행될 수 있음은 자명하다. 다른 예에서, 본 발명의 설명을 용이하게 하기 위해 공지된 구조들 및 장치들이 블록도로 도시된다.
이 출원서에서 사용된 바와 같이, 용어 "컴포넌트(component)" 및 "시스템(system)"은 컴퓨터 관련 실체, 즉 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어, 또는 실행중인 소프트웨어들 중 하나를 언급하도록 의도된다. 예를 들면, 컴포넌트는 프로세서에서 실행되는 프로세스, 프로세서, 오브젝트, 실행가능물, 실행의 스레드(a thread of execution), 프로그램, 및/또는 컴퓨터일 수 있지만, 이에 한정되지 않는다. 설명에 의하면, 서버에서 실행되는 어플리케이션 및 서버는 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트들이 프로세스 및/또는 실행의 스레드 내에 존재할 수 있고, 하나의 컴포넌트가 하나의 컴퓨터에 배치되거나 및/또는 2개 이상의 컴퓨터들 사이에 분배될 수 있다.
또한, "문서 이미지(document image)"는 하나 이상의 색(들)을 포함하는 문서(들)(예를 들면, 바이너리(즉, 흑/백), 계조 및/또는 칼라 문서(들))의 디지털 표시를 언급하도록 의도된다. 또한, 문서 이미지는 텍스트와 이미지들의 가능한 중첩에 의해 이미지(들), 텍스트 및/또는 이미지를 포함하는 텍스트를 가질 수 있다. 문서 이미지는 문서(들)의 바이너리, RGB 및/또는 YUV 표시일 수 있다. RGB 문서 이미지는 적색, 녹색 및 청색 성분들로 표시된다. YUV 문서 이미지는 Y로 나타낸 루미네센스(luminescence) 성분 및 U와 V로 나타낸 크로미넌스(chrominance) 성분들을 사용하여 표시된다. YUV 이미지의 시각적인 품질을 많이 희생하지 않으면서 크로미넌스 성분들 U 및 V를 표시하는데 하위비트들이 사용될 수 있다. YUV 표시는 RGB 표시보다 일반적으로 보다 컴팩트하고 용이하게 사용하는 표시이다. 문서 이미지는 공통적으로 "화소들(pixels)"로서 칭해지는 화상 요소들을 포함한다. 문서 이미지는 임의의 형상 또는 사이즈를 가지는 단일 페이지 또는 복수의 페이지 문서(들)에 기초할 수 있다.
도 1을 참조하여, 본 발명의 특징에 따른 마스크 분리기 컴포넌트(100)를 설명한다. 마스크 분리기 컴포넌트(100)는 (예를 들어, 아카이브(archived)되거나 전송되는 문서에 기초하여) 문서 이미지(110)를 수신한다. 예를 들면, 마스크 분리기 컴포넌트(100)는 문서 압축 시스템(도시하지 않음)의 일부일 수 있다. 문서 이미지(110)는 문서(들)의 바이너리, RGB 및/또는 YUV 표시일 수 있다. 마스크 분리기 컴포넌트(100)는 문서 이미지(110)를 처리하고, 문서 이미지(110)의 각 화소가 포그라운드 및/또는 백그라운드에 속하는 지의 여부를 나타내는 마스크(120)(예를 들면, 바이너리)를 출력한다. 마스크(120) 및/또는 문서 이미지(110)는 그 후 문서 이미지(110)의 압축에 영향을 주기 위해 압축 시스템(도시하지 않음)의 다른 부분(들)에 의해 처리될 수 있다.
간단하게 도 2를 참조하여, 예시적인 문서 이미지가 설명된다. 문서 이미지는 바(bar)와 함께 글자들 "C" 및 "O"을 포함한다. 도 3은 본 발명의 특징에 따라 도 2의 예시적인 문서 이미지와 관련된 마스크를 예시한다. 도 4는 본 발명의 특징에 따라 도 2의 예시적인 문서 이미지 및 도 3의 마스크와 관련된 백그라운드를 예시한다. 점선은 백그라운드가 "케어(care)" 화소들의 경계를 나타내며, 이 화소들은 점선을 포함하고, 문서 이미지들이 다시 조합될 때 적어도 부분적으로 마스크에 저장된 복구 정보에 기초하여 백그라운드 위에 포그라운드가 배치될 것이기 때문에 점선 내의 화소들은 백그라운드 내의 "돈케어(don't care)"이다. 글자 "C" 및 "O" 및/또는 바가 일정한 칼라(들)이거나 스무스한 칼라 천이(들)를 갖는 경우의 예에서는, 각종 스무딩(smoothing) 및/또는 압축 기술(들) 중 하나를 사용하여 포그라운드의 효과적인 압축을 달성할 수 있다. 백그라운드의 효과적인 압축은, "돈케어" 화소(들)를 더 스무스한 천이(들)를 가능하게 하는 화소(값)들로 대체함으로써 달성될 수 있다. "돈케어" 화소들을 채우기 위한 하나의 예시적인 간단한 알고리즘은 로우 패스 필터(low pass filter)로 백그라운드를 처리한 후, 중요한 화소들을 다시 복구하는 것이다. 이들 두 단계들을 몇 번 반복한 후에는, "돈케어" 화소들은 결국 스무스한 천이(들)를 가능하게 하는 값들을 갖게 되어 압축이 잘 될 것이다. 이 알고리즘의 간단한 개량은 매우 낮은 로우 패스 필터로 시작해서 각 반복시 로우 패스 필터의 차단 주파수를 증가시키는 것이다. 포그라운드를 채우기 위해 유사한 알고리즘이 사용될 수 있다.
도 1을 다시 참조하면, 마스크 분리기 컴포넌트(100)는 화소 에너지 컴포넌트(130), 영역 합병 컴포넌트(140) 및 마스크 저장 컴포넌트(150)를 포함한다.
화소 에너지 컴포넌트(130)는 문서 이미지(110)의 영역(들)에 대한 화소 에너지(즉, 분산)를 계산하도록 적응된다. 예를 들면, 문서 이미지(110)가 YUV 표시인 경우의 예에서는, 화소 에너지 컴포넌트(130)는 Y 성분 및/또는 YUV 표시의 YUV 성분들의 적절한 조합에 기초하여 화소 에너지 분산을 계산한다. 계산의 편의상, 포그라운드와 백그라운드가 영역에 걸쳐 일정하도록 가정될 수 있다. 이들 상수에 가까운 분산을 최소화하는 마스크(120)를 계산하는 것이 바람직하다. 분산은 포그라운드 및/또는 백그라운드에 대해 얻어질 수 있는 압축의 견적으로서 사용된다. 대안적으로, 영역(들)은 압축될 수 있고 비트수들은 정량적으로 측정될 수 있지만, 계산 비용은 높아지면 안된다. 따라서, 거리들의 제곱의 합에 기초하는 에너지의 측정치이기도 한 분산의 계산은 압축 후의 포그라운드와 백그라운드의 사이즈의 수용가능한 견적이다.
영역은 N 화소들의 집합 S이고, 포그라운드 F 및 백그라운드 B는 F∪B=S 및 F∩B=Φ인 S의 파티션(partition)이라고 가정한다. f(x)가 화소 위치 x( x∈S)에서의 이미지 값이면, 포그라운드 및 백그라운드의 분산은 각각 다음과 같다:
Figure 112008021609213-pat00001
Figure 112008021609213-pat00002
여기서,
Figure 112008021609213-pat00003
Figure 112008021609213-pat00004
는, 각각 포그라운드 및 백그라운드의 평균 화소값이고, NF 및 NB는 각각 포그라운드 및 백그라운드의 화소수이다. 이들 분산은 다음과 같이 표현될 수도 있다:
Figure 112008021609213-pat00005
Figure 112008021609213-pat00006
다음, 포그라운드 및/또는 백그라운드의 에너지(즉, 분산)의 최소화에 적어도 부분적으로 기초하여, 화소 에너지 컴포넌트(130)에 의해 S의 적절한 파티션 F 및 B가 결정된다(즉, 이는 합 E=υFB를 최소화한다). 그러나, S의 적절한 파티션 F 및 B를 찾는 것은 2N개의 가능한 마스크가 있기 때문에 계산 집약적일 수 있다.
계산을 간략화시키기 위해, 문서 이미지는, 영역들, 예를 들어 2화소 x 2화소 영역들로 나누어질 수 있다. 간단히 도 5를 참조하면, 본 발명의 특징에 따른 문서 이미지의 2화소 x 2화소 영역이 예시된다. 4개의 화소들은 값들 V1, V2, V3 및 V4를 갖는다. 각각의 2화소 x 2화소 영역들에서는, 단지 24=16개의 가능한 마스크들이 있다. 따라서, 이들 각각의 2화소 x 2화소 영역들에 대해, 최적 F 및 B를 찾을 수 있어, 모든 16개의 조합에 대한 E를 계산하고, 최소 에너지를 갖는 것을 이용함으로써 E=υFB를 최소화시킨다.
그러나, K-평균 클러스터링 알고리즘(K-means clustering algorithm)을 이용하면, K=2일 때, 문서 이미지가 스칼라 함수이기 때문에, 효율적으로 계산될 수 있는 결과를 산출하는 f(x)값들이 소트(sort)될 수 있다. 소트된 순서가 V1 V2 V3 V4라고 가정하면, K-평균 클러스터링 알고리즘은, K=2일 때 3개의 가능한 파티션들을 산출한다:
가능한 가능한
포그라운드 백그라운드
V1 V2 V3 V4
V1 V2 V3 V4
V1 V2 V3 V4
실질적으로 모든 다른 조합들은 동일하거나 더 높은 에너지를 가진다는 것을 볼 수 있다. 이는 인접하지 않는 값들의 그룹핑보다 낮은 분산을 갖는 인접하는 값의 그룹핑이 항상 존재해야 하기 때문에 직관적이다. 소팅 순서가 다르면, 화소는 V1 V2 V3 V4가 소팅되도록 항상 다시 라벨링될 수 있다. 그 후, 포그라운드와 백그라운드의 3개의 가능한 파티션들중 어느 것이 최저 에너지를 산출하는 지를 바로 결정한다. 중요하게도, 화소 에너지 컴포넌트(130)는 계산 비용을 최소화하기 위해, 부분합
Figure 112008021609213-pat00007
,
Figure 112008021609213-pat00008
,
Figure 112008021609213-pat00009
및/또는
Figure 112008021609213-pat00010
를 저장할 수 있다. 또한, 화소 에너지 컴포넌트(130)는 NF 및/또는 NB를 따라 (예를 들면, 영역 합병 컴포넌트(140) 및/또는 마스크 저장 컴포넌트(150)에 의해 사용되는) 부분합
Figure 112008021609213-pat00011
,
Figure 112008021609213-pat00012
,
Figure 112008021609213-pat00013
및/또는
Figure 112008021609213-pat00014
의 적어도 일부를 적어도 일시적으로 저장할 수 있다.
또한, 계산 비용을 최소화하기 위해, 작은 영역(예를 들어, 4화소 x 4화소)에 대한 에너지가 계산될 수 있다. 에너지가 임계량보다 작으면, 모든 화소들이 포그라운드에 할당되거나 백그라운드에 할당되고 할당받지 않는 것은 비어있을 수 있다. 에너지가 임계 에너지보다 크거나 같은 경우, 상기한 바와 같이 파티셔닝이 진행될 수 있다. 이 파티션이 최적일 수 없더라도, 임계값이 충분히 작으면 역효과는 관찰되지 않는다. (예를 들면, 일정한 면적(들)을 갖는) 비교적 깨끗한 문서 이미지(들)에 있어서, 계산 속도의 현저한 증가가 달성될 수 있다.
또한, 포그라운드와 백그라운드를 분리하는 마스크가 계산된 후에 실질적으로 일정한 영역(들)(즉, 완전한 포그라운드 또는 완전한 백그라운드)이 설정될 수 있다. 예를 들면, 평균 포그라운드와 평균 백그라운드 사이의 차이가 실험적으로 결정될 수 있는 임의의 임계치보다 작으면(예를 들어, 40의 값은 0에서 255의 전체 계조 레벨들와 비교하여 사용될 수 있음), 전체 영역은 포그라운드나 백그라운드 중 어느 하나로 설정된다(평균이 0에 가까운지 또는 255에 가까운지에 따라).
도 1을 다시 참조하면, 문서 이미지(110)를 2화소 x 2화소 영역들로 파티셔닝하는 것에 의해, 화소 노이즈를 픽업(pick up)할 수 있는 별개의 포그라운드(들) 및 백그라운드(들)을 갖는 영역(들)이 생길 수 있다. 이에 대해, 마스크(120)의 텍스트 및/또는 그래픽 선들을 캡쳐할 수 있는 목표에 부합하지 않는 솔트 앤드 페퍼(salt and pepper)와 유사한 마스크(120)가 될 수 있다. 따라서, 영역 합병 컴포넌트(140)는 잠재적인 합병된 영역들의 포그라운드 및/또는 백그라운드의 에너지들이 제1 임계 에너지보다 작은 지의 여부에 대한 판정에 적어도 부분적으로 기초하여 문서 이미지(110)의 영역들의 쌍들의 합병을 시도하도록 적응된다. 영역 합병 컴포넌트(140)는 화소 에너지 컴포넌트(130)에 의해 계산되고 저장된 NF 및/또는 NB를 따라 부분합
Figure 112008021609213-pat00015
,
Figure 112008021609213-pat00016
,
Figure 112008021609213-pat00017
및/또는
Figure 112008021609213-pat00018
를 이용할 수 있다.
각각의 합병 후, 이 양들은 다시 계산되어야 하지만, 다행스럽게도, 이는 또한 포그라운드 및 백그라운드 조합에 따라 이들 양들을 단지 합하는 것에 의해 일정한 시간에 수행된다. 모든 영역들에 대한 합
Figure 112008021609213-pat00019
은 각 파티션에 대해 일정하고, 최적 파티션을 선택하기 위해 계산될 필요가 있다는 것에 유의해야 한다. 그러나, 영역들을 합병하지 않을 경우에도 이 양을 결정할 필요는 있을 것이다.
간단히 도 6을 참조하여, 포그라운드 F1 및 백그라운드 B1을 갖는 제1 영역과 포그라운드 F2 및 백그라운드 B2를 갖는 제2 영역과의 가능한 합병에 대해 예시한다. 합병될 영역들의 에너지들이 제1 임계 에너지보다 작은 지를 판정할 때, 영역 합병 컴포넌트(150)는 새로운 포그라운드와 새로운 백그라운드의 그룹핑을 계산할 수 있다. 2개의 영역들 내의 에너지 분산은 새로운 포그라운드와 새로운 백그라운드의 7가지 가능한 그룹핑을 가진다.
가능한 합병 영역의 가능한 합병 영역의
새로운 포그라운드 새로운 백그라운드
F1 B1 F2 B2
F1 B1 F2 B2
F1 B2 F2 B1
F2 F1 B1 B2
F1 F2 B1 B2
F1 B1 F2 B2
F1 B2 F2 B1
가능한 그룹핑들 중 적어도 하나가 제1 임계 에너지보다 작은 백그라운드 및/또는 포그라운드 에너지들을 제공하면, 영역 합병 컴포넌트(140)는 예를 들어 포그라운드 및 백그라운드 에너지(즉, E=υFB)의 최소화에 적어도 부분적으로 기초하여, 합병된 영역의 적절한 포그라운드/백그라운드 파티션을 결정할 수 있다. 이들 그룹핑들 중 어느 것도 제1 임계 에너지보다 낮은 에너지를 제공하지 않으면, 합병은 발생하지 않으며, 이들 영역들은 더 이상 합병이 고려되지 않는다. 디폴트 F1 및 F2가 포그라운드 화소들을 계산하는데 사용되는 반면, B1 및 B2는 백그라운드 화소들을 계산하는 데 사용될 것이다.
영역 합병 컴포넌트(140)는 제1 임계 에너지가 초과되거나 및/또는 실질적으로 모든 문서 이미지(110)가 합병될 때까지, 더 많은 영역들을 합병하려고 계속 시도할 수 있다. 예를 들면, 영역 합병 컴포넌트(140)는 도 6에 예시된 바와 같이 수평으로 인접하는 2x2 영역들을 2x4 영역들로 합병할 수 있다. 그 후, 영역 합병 컴포넌트(140)는 도 7에 예시된 바와 같이 영역들을 4x4 영역으로 수직 합병할 수 있다. 일반적으로, 제1 임계 에너지값은, (예를 들어, 영역에 2개 이상의 칼라가 있는 경우) 시도된 합병(들)이 여러개의 계조 레벨들을, 텍스트 등의 중요한 세부사항(들)의 잠재적인 손실을 갖는, 포그라운드 또는 백그라운드로 파티셔닝하는 잠재적인 상황(들)을 완화하도록 선택될 수 있다. 예를 들어 제1 영역이 백색 위에 회색으로 기입된 텍스트를 갖고 제2 영역이 대부분 흑색이면, 2개의 영역들의 합병에 의해 회색과 백색이 그 포그라운드로 되고 흑색이 결과로서의 합병된 영역의 백그라운드로 될 수 있기 때문에, 마스크(120)로부터의 실질적으로 모든 텍스트 정보가 손실된다. 그러나, 2가지의 색이 포그라운드 또는 백그라운드 중 하나에 합병될 때마다, 상수가 더 이상 이 영역에 바람직한 모델이 아니기 때문에, 그 영역에 대한 에너지의 가파른 증가가 발생한다.
또한, 실질적으로 모든 7가지 조합들에 대한 결과로서의 에너지를 계산하는 대안으로서, 포그라운드와 백그라운드의 평균은 소트될 수 있고, 소트된 평균에 대한 파티셔닝이 고려될 수 있다. 값 V1 V2 V3 V4 의 소팅에 대해서는 파티션의 수를 3으로 내린다(평균에 의해 소트 F1 B1 F2 B2를 소트하고 순서에 관계하는 파티션들을 고려한다).
부가적으로 및/또는 대안적으로, 영역 합병 컴포넌트(120)는 주어진 영역들에 대한 근사치 f에 기초하여, 2개의 영역의 포그라운드들과 백그라운드들의 조합들의 제한된 서브세트를 평가할 수 있다. 영역 합병 컴포넌트(120)는 최소 누적 에너지와의 조합을 선택할 수 있다.
일단 이러한 합병이 제1 임계치 이상으로 에너지를 증가시키기 때문에 영역이 더이상 합병될 수 없으면, 이 영역의 화소는 포그라운드와 백그라운드로 파티셔닝될 수 있다. 이러한 파티션은 각각의 합병을 따라 행해질 수 있지만, 이는 계산적으로 고가일 수 있다. 또한, 합병 영역 컴포넌트(140)는 합병된 영역의 실질적으로 모든 화소 값들의 평균을 계산하여 평균보다 큰 값을 갖는 화소(들)을 포그라운드에 할당하고 남은 화소(들)를 백그라운드에 할당할 수 있다. 또한, 평균보다 큰 값을 갖는 화소(들)는 백그라운드에 할당되고 남은 화소(들)는 포그라운드에 할당될 수 있다.
도 1을 다시 참조하면, 일단 영역 합병 컴포넌트(140)에 의해 합병이 고갈되면, 마스크 저장 컴포넌트(150)는 마스크(120)의 화소 에너지 컴포넌트(130) 및/또는 합병 영역 컴포넌트(140)에 의해 수행되는 포그라운드와 백그라운드의 파티셔닝과 관련된 정보를 저장하도록 적응된다. 이에 의해, 마스크(120)는 문서 이미지(110)의 각 화소가 포그라운드 및/또는 백그라운드에 속하는 지를 나타낸다.
일 예에서, 계산 비용을 최소화하기 위해, 작은 영역(예를 들면, 4화소x4화소)에 대한 에너지는 화소 에너지 컴포넌트(130)에 의해 계산될 수 있다. 에너지가 제2 임계 에너지보다 낮으면, 실질적으로 모든 화소들이 포그라운드에 할당되거나 백그라운드에 할당되고 할당받지 않은 것은 거의 비어 있다. 에너지가 제2 임계 에너지 이상이면, 파티셔닝은 상기한 바와 같이 진행될 수 있다. (예를 들면, 일정 면적(들)을 갖는) 비교적 깨끗한 문서 이미지(들)에 대해서는, 계산 속도의 상당한 증가가 달성될 수 있다.
다른 예에서, 마스크의 사이즈를 최소화하기 위해, 최종 영역(예를 들면, 제1 임계치를 초과하지 않고 합병될 수 없는 영역)이 제3 임계치보다 높은 평균 포그라운드와 평균 백그라운드 사이의 차를 가지면, 영역의 전체적인 평균이 중간 계조 레벨 값(예를 들면, 계조 레벨 값들이 0과 255 사이라면 127)보다 큰지 작은 지에 따라, 전체 영역은 포그라운드로 선언되거나 백그라운드로 선언된다. 약간의 디더링을 갖는 칼라 문서에 있어서, 이들 영역에 대한 마스크는 이 최적화가 없는 솔트 앤드 페퍼(salt and pepper)와 유사할 것이고, 압축 비용이 높을 것이다. 제3 임계치는 중요한 텍스트를 손실하지 않지만, 많은 경우의, 프린트된 문서를 스캐닝할 때 보여지는 약간의 디더링을(예를 들면, 많은 프린터들은 4 내지 6의 색들만을 가져서 색들의 전체 팔레트를 생성하는 데에 디더링(dithering)을 이용해야 한다) 제거하도록 선택된다. 예를 들면, 제3 임계치로는 값 40이 좋은 선택치일 수 있다.
마스크 분리기 컴포넌트(100)는, 포그라운드 및 백그라운드가 각각 일반적으로 일정하다는 가정하에서 설명되었다. 그러나, 본 발명의 특징에 따르면, 포그라운드 및/또는 백그라운드를 설명하기 위해 화소 에너지 컴포넌트(130)에 의해 다항 회귀가 사용될 수 있다. 예를 들면, 포그라운드 및/또는 백그라운드의 다항식들이 식 αx+βy+μ 평면에 있다면, 에너지는 다음과 같이 정의될 것이다:
Figure 112003010435077-pat00020
Figure 112003010435077-pat00021
여기서, x,y는 화소 위치들을 나타내고, αF, βF 및 μF는 υF를 최소화하는 스칼라들이고 αB, βB 및 μB는 υB를 최소화하는 스칼라들이다. αF, βF 및 μF는 3개의 미지수 및 3개의 식들의 선형계인 수량들
Figure 112008021609213-pat00022
,
Figure 112008021609213-pat00023
,
Figure 112008021609213-pat00024
Figure 112008021609213-pat00025
를 이용하는 일정한 시간 내에 구해질 수 있음을 유의한다. 유사하게, αB, βB 및 μB는 유사한 방식으로 구해질 수 있다. 일반적으로 일정한 포그라운드 및/또는 백그라운드에 관하여 상술된 바와 같이, 화소 에너지 컴포넌트(130)는 에너지 최소화에 기초하여 영역을 포그라운드와 백그라운드로 파티셔닝하는 작은 영역들에 대한 화소 에너지의 계산을 진행한다. 그 후, 작은 영역들은, 각각의 시도된 합병에서의 에너지(E)의 최소화에 적어도 부분적으로 기초하여 합병 영역 컴포넌트(140)에 의해 순차 합병되도록 시도된다. 그러나, 포그라운드들 및 백그라운드들은 평균에 의해 소트될 수 없기 때문에, 모든 7개의 조합들은 어떤 조합이 E를 최소화시키는 지를 알아내도록 테스트되어야 한다. 합병을 용이하게 하기 위해, 수량들
Figure 112008021609213-pat00026
,
Figure 112008021609213-pat00027
,
Figure 112008021609213-pat00028
,
Figure 112008021609213-pat00029
및 N이 포그라운드 및 백그라운드에 대한 각 영역에 대해 저장될 수 있다.
다시 계산 비용을 최소화하기 위해, 작은 영역(예를 들면, 4화소x4화소)에 대한 에너지는 화소 에너지 컴포넌트(130)에 의해 계산될 수 있다. 그러나, 화소 에너지 컴포넌트(130)는 영역에 대해 상수에 기초한 모델을 이용할 수 있고, 및/또는 다항 회귀를 이용할 수 있다.
부가적으로 및/또는 대안적으로, 화소 에너지 컴포넌트(110)는 면 회귀(planar regression)를 사용하여 에너지를 계산할 수 있다. 포그라운드 υF 및 백그라운드 υB의 에너지는 다음과 같이 정의된다:
Figure 112003010435077-pat00030
Figure 112003010435077-pat00031
여기서, F는 포그라운드, B는 백그라운드, f(x,y)는 위치 x,y에서의 화소값이다. 또한, AF, BF, CF는 포그라운드 υF의 에너지를 최소화하기 위해 선택되고, AB, BB, CB는 백그라운드 υB의 에너지를 최소화하기 위해 선택된다. 예를 들면, 포그라운드 υF의 에너지의 최소화는 방정식계(3개의 미지수, 3개의 방정식)를 풀어서 얻을 수 있다:
Figure 112003010435077-pat00032
여기서, 예를 들면:
Figure 112003010435077-pat00033
백그라운드 υB의 에너지에 대해서도 유사한 계산을 할 수 있다.
도 1은 마스크 분리기 컴포넌트(100)에 대한 컴포넌트들을 예시하는 개략적인 도면이지만, 마스크 분리기 컴포넌트(100)는 그 용어가 본 명세서에 정의된 바와 같이, 하나 이상의 컴포넌트들로서 구현될 수 있다는 것을 이해해야 한다. 따라서, 마스크 분리기 컴포넌트(100)를 구현하도록 동작가능한 컴퓨터 실행가능한 컴포넌트들은, 본 발명에 따른 ASIC(application specific integrated circuit), CD(compact disc), DVD(digital video disk), ROM(read only memory), 플로피 디스크, 하드 디스크, EEPROM(electrically erasable programmable read only memory) 및 메모리 스틱을 포함하지만 이에 한정되지 않는 컴퓨터 판독가능 매체에 저장될 수 있다.
상기되고 도시된 예시적인 시스템들의 관점에서, 본 발명에 따라 구현될 수 있는 방법은 도 8 및 도 9의 흐름도를 참조하여 잘 이해될 수 있다. 설명의 편의상, 방법이 일련의 블록들로서 도시되고 기재되지만, 본 발명에 따르면, 일부 블록들은 본 명세서에 도시되고 기재된 것과 다른 순서로 및/또는 다른 블록들과 동시에 발생할 수 있기 때문에, 본 발명은 블록들의 순서에 의해 제한되지 않는다는 것을 이해하고 인식해야 한다. 또한, 모든 예시된 블록들이 본 발명에 따른 방법을 구현하기 위해 요구되는 것은 아니다.
본 발명은 하나 이상의 컴포넌트들에 의해 실행되는, 프로그램 모듈과 같은 컴퓨터 실행가능한 명령어들의 일반적인 관점으로 기재될 수 있다. 일반적으로, 프로그램 모듈들은 특정 작업을 수행하거나 특정 추상 데이터 유형을 구현하는, 루틴들, 프로그램들, 오브젝트들, 데이터 구조 등을 포함한다. 일반적으로 프로그램 모듈들의 기능성은 다양한 실시예들에서 요구되는 바와 같이 결합되거나 분산될 수 있다.
도 8 및 도 9를 참조하면, 본 발명의 특징에 따른 마스크의 생성 방법론(800)이 설명된다. 810에서, 문서 이미지의 영역에 대한 화소 에너지(예를 들면, 변수들)가 계산된다. 예를 들면, 계산된 화소 에너지는, 영역의 다항 회귀에 적어도 부분적으로 기초한 분산일 수 있다. 또한, 계산된 화소 에너지 분산은 영역의 실질적으로 모든 화소값들에 대한 거리의 제곱의 합에 사용되는, 포그라운드에 대해 계산된 평균 화소값 및 백그라운드에 대해 계산된 평균 화소값을 이용하여 계산될 수 있다. 대안적으로, 계산된 화소 에너지 분산은 백그라운드에 대한 화소값들의 합과 포그라운드에 대해 계산된 화소값들의 합을 이용하여 계산될 수 있다.
다음, 820에서, 포그라운드 및/또는 백그라운드의 화소 에너지를 최소화시키기 위한 영역에 대한 화소 파티션이 계산된다. 830에서, 문서 이미지의 실질적으로 모든 영역들이 파티셔닝되었는 지의 여부에 대한 판정이 이루어진다. 830에서 판정이 아니오이면, 810에서의 처리가 계속된다. 830에서의 판정이 예이면, 840에서 처리가 계속된다.
다음, 840에서, 영역들의 인접한 쌍들은 합병되도록 시도된다. 850에서, 시도된 합병에 의해 임계 에너지가 새로운 포그라운드 및/또는 새로운 백그라운드에서 초과되는지에 대한 판정이 이루어진다. 850에서의 판정이 예이면, 860에서 처리가 계속된다. 850에서의 판정이 아니오이면, 870에서, 영역들이 합병된다. 880에서, 합병된 영역의 새로운 포그라운드와 백그라운드 파티션이 계산된다. 885에서, 문서 이미지의 실질적으로 모든 영역들이 합병되도록 시도되었는 지의 여부에 대한 판정이 이루어진다. 885에서의 판정이 예이면, 더 이상 처리가 이루어지지 않는다. 885에서의 판정이 아니오이면, 840에서 처리가 계속된다.
860에서, 문서 이미지의 실질적으로 모든 영역들이 합병되도록 시도되었는 지에 대한 판정이 이루어진다. 860에서의 판정이 아니오이면, 890에서, 시도된 합병들의 포커스가 다음의 합병되지 않은 영역(예를 들면, 2화소x2화소 영역)으로 이동한다. 860에서의 판정이 예이면, 더 이상 처리가 이루어지지 않는다.
다음, 도 10을 참조하여, 본 발명의 특징에 따른 문서 이미지 분리를 위한 시스템(1000)을 설명한다. 시스템(1000)은 마스크 분리기 컴포넌트(100) 및 포그라운드/백그라운드 세그멘터(segmenter)(160)를 포함한다. 마스크 분리기 컴포넌트(100)는 화소 에너지 컴포넌트(130), 영역 합병 컴포넌트(140) 및 마스크 저장 컴포넌트(150)를 포함한다.
상기한 바와 같이, 본 발명의 특징에 따르면, 마스크 분리기 컴포넌트(100)는 입력으로서 문서 이미지(110)를 수신한다. 마스크 분리기 컴포넌트(100)는 출력으로서 마스크(120)를 생성하기 위해 문서 이미지를 처리한다.
포그라운드/백그라운드 세그멘터(160)는 마스크(120) 및 문서 이미지(110)를 입력으로서 수신한다. 마스크(120)에 적어도 부분적으로 기초하여, 포그라운드/백그라운드 세그멘터(160)는 문서 이미지(110)를 포그라운드 이미지(170)와 백그라운드 이미지(180)로 분리하도록 적응된다. 예를 들면, 마스크(120)에서 "1"로 표시된 실질적으로 모든 화소(들)는 포그라운드 이미지(170)가 될 수 있고 마스크(120)에서 "0"으로 표시된 실질적으로 모든 화소(들)는 백그라운드 이미지(180)가 될 수 있다. 반대로, 예로서, 마스크(120)에서 "0"으로 표시된 실질적으로 모든 화소(들)는 포그라운드 이미지(170)가 될 수 있고 마스크(120)에서 "1"로 표시된 실질적으로 모든 화소(들)는 백그라운드 이미지(180)가 될 수 있다.
예를 들면, 마스크 분리기 컴포넌트(100)는 (예를 들어, 텍스트와 관련된) 화소들을 포그라운드로 분리하고, 어떤 화소가 마스크(120)의 포그라운드에 있는 지에 대한 정보를 저장함으로써 텍스트를 포함하는 문서 이미지(110)를 처리할 수 있다. 그 후, 포그라운드/백그라운드 세그멘터(160)는 마스크(120) 및 문서 이미지(110)를 수신할 수 있다. 포그라운드/백그라운드 세그멘터(160)는 문서 이미지(110)를 포그라운드 이미지(170)와 백그라운드 이미지(180)로 분리할 수 있다.
도 11을 참조하여, 본 발명의 특징에 따른 문서 이미지 압축을 위한 시스템(1100)이 설명된다. 시스템(1100)은 문서 이미지 변환 컴포넌트(1110), 마스크 분리기 컴포넌트(100) 및 포그라운드/백그라운드 세그멘터 컴포넌트(160)를 포함한다. 포그라운드/백그라운드 세그멘터(160)는 마스크(120)와 문서 이미지(1150)를 입력들로서 수신한다. 마스크(120)에 적어도 부분적으로 기초하여, 포그라운드/백그라운드 세그멘터(160)는 문서 이미지(1150)를 포그라운드 이미지(170)와 백그라운드 이미지(180)로 분리하도록 적응된다.
도 12에 도시된 바와 같이, 시스템(1100)은, 선택적으로, 마스크 인코더(1120), 포그라운드 인코더(1130) 및/또는 백그라운드 인코더(1140)를 포함할 수 있다. 마스크 분리기 컴포넌트(100)는 화소 에너지 컴포넌트(130), 영역 합병 컴포넌트(140) 및 마스크 저장 컴포넌트(150)를 포함한다. 선택적으로, 시스템(110)은 포그라운드 이미지 프로세서(1170) 및/또는 백그라운드 이미지 프로세서(1180)를 포함할 수 있다.
문서 이미지 변환 컴포넌트(1110)는 문서 이미지(1150)를 수신하고 문서 이미지의 변환된 표시(1160)를 출력하도록 선택된다. 예를 들면, 문서 이미지 변환 컴포넌트(1110)는 RGB 문서 이미지를 수신하고 RGB 문서 이미지의 YUV 표시를 출력할 수 있다.
마스크 인코더(1120)는 마스크(120)를 인코드하도록 적응된다. 예를 들면, 마스크(120)는 일반적으로 바이너리이기 때문에, 마스크 인코더(1120)는 마스크의 효율적인 압축을 달성하기 위해 종래의 바이너리 압축 기술(들)을 이용할 수 있다. 마스크 인코더(1120)는 마스크 비트 스트림을 출력한다.
포그라운드 인코더(1130)는 포그라운드 이미지(170)를 인코드하도록 적응된다. 포그라운드는 포그라운드 화소들, 및 "돈케어(don't care)" 화소들(즉, 원래 백그라운드에 속하는 화소(들))로 이루어지는 이미지이다. 포그라운드 이미지 프로세서(1170)는 압축을 용이하게 하는 값들로 "돈케어" 화소들을 채우고 변경된 포그라운드 이미지를 포그라운드 인코더(1130)에 제공하는 데에 사용될 수 있다. 예를 들면, 포그라운드 이미지(170)가 일반적으로 흑색의 텍스트 정보를 포함하는 경우의 예에서, 전체 포그라운드 이미지가 흑색이 되도록 "돈케어" 화소도 흑색으로 채워질 수 있다. 포그라운드 인코더(1130)는 JPEG, 웨이브렛(wavelets), 또는 다른 이미지 압축 알고리즘 등의 이미지 압축에 효과적인 압축 기술(들)을 이용할 수 있다. 포그라운드 인코더(1130)는 포그라운드 비트 스트림을 출력한다.
백그라운드 인코더(1140)는 백그라운드 이미지(180)를 인코드하도록 적응된다. 백그라운드는 백그라운드 화소들, 및 "돈케어(don't care)" 화소들(예를 들면, 원래 포그라운드에 속하는 화소(들))로 이루어지는 이미지이다. 백그라운드 이미지 프로세서(1180)는 압축을 용이하게 하는 값들로 "돈케어(don't care)" 화소들을 채우고 변경된 백그라운드 이미지를 백그라운드 인코더(1140)에 제공하는 데에 사용될 수 있다. 예를 들면, 백그라운드 이미지(180)가 스무스 화이트 페이지(smooth white page)를 포함하는 경우의 예에서, 전체 백그라운드 이미지가 백색이 되도록, 텍스트가 있었던 위치에 배치되는 "돈케어(don't care)" 화소가 백색으로 채워질 수 있다. 백그라운드 인코더(1140)는 JPEG, 웨이브렛(wavelets), 또는 다른 이미지 압축 알고리즘 등의 이미지 압축에 효과적인 압축 기술(들)을 이용할 수 있다. 백그라운드 인코더(1140)는 백그라운드 비트 스트림을 출력한다.
예를 들면, "돈케어(don't care)" 화소들을 채우기 위한 간단한 알고리즘은 로우 패스 필터로 이미지를 처리한 후, 중요한 화소들을 복구하는 것이다. 이들 2단계를 몇 번 반복한 후, "돈케어(don't care)" 화소들은 스무스한 천이(들)를 가능하게 하는 값들로 귀결되어 압축이 잘 될 것이다. 이 알고리즘의 간단한 개량은, 매우 낮은 로우 패스 필터로 시작해서 각 반복 마다 로우 패스 필터의 차단 주파수를 증가시키는 것이다.
또한, 포그라운드 인코더(1130) 및/또는 백그라운드 인코더(1140)는 포그라운드 및/또는 백그라운드의 압축을 향상시키기 위해 마스크(120)를 이용할 수 있다. 다수의 인코더들 및/또는 디코더들은, 본 발명과 관련되는 적어도 하나의 포그라운드 및 백그라운드의 화소 에너지 분산의 최소화에 적어도 부분적으로 기초하여, 문서 이미지의 파티션에 적어도 부분적으로 기초하는 마스크를 이용한다는 것이 고려됨을 이해해야 한다. 본 발명과 관련되어 사용되기에 적합한 이러한 인코더 및/또는 디코더는 첨부된 클레임의 범위 내에 있도록 의도된다.
마스크 비트 스트림, 포그라운드 비트 스트림 및/또는 백그라운드 비트 스트림은 단일 비트 스트림으로 결합되거나 및/또는 예를 들어, 디코딩 시스템(도시하지 않음)에 개별적으로 전송될 수 있다. 디코딩 시스템은 마스크(120)를 얻기 위해 마스크 비트 스트림을 디코드할 수 있다. 대안적으로, 디코딩 시스템은 마스크(120)를 수신할 수 있다. 디코딩 시스템은 포그라운드 비트 스트림 및/또는 백그라운드 비트 스트림을 문서 이미지로 재결합하기 위해 마스크(120)를 이용할 수 있다.
본 발명의 시스템 및/또는 방법은 텍스트, 수기, 그림 등의 식별 및/또는 압축을 용이하게 하는 전체 세그먼트된 계층화 이미지 시스템에서 이용될 수 있다. 또한, 당업자들은 본 발명의 시스템 및/또는 방법이 사진 복사기들, 문서 스캐너들, 광학 문자 인식 시스템들, PDA들, 팩스들, 디지탈 카메라들, 디지탈 비디오 카메라들 및/또는 비디오 게임 시스템들을 포함하지만 이에 한정되지 않는 다량의 문서 이미지 어플리케이션들에 사용될 수 있다는 것을 알 것이다.
도 13을 참조하면, 세그먼트된 계층화 이미지 시스템(1300)이 설명된다. 시스템(1300)은 화소 에너지 컴포넌트(130) 및 마스크 저장 컴포넌트(150)를 포함한다.
화소 에너지 컴포넌트(130)는 문서 이미지의 영역에 대한 화소 에너지 분산을 계산하도록 적응된다. 또한, 화소 에너지 컴포넌트(130)는 포그라운드 및 백그라운드 중 적어도 하나의 화소 에너지(즉, 분산)의 최소화에 적어도 부분적으로 기초한 영역의 파티션을 계산하도록 더 설계되었다.
마스크 저장 컴포넌트(150)는 마스크의 파티션과 관련된 정보를 저장하도록 적응된다. 예를 들면, 시스템(1300)은 사진 복사기들, 문서 스캐너들, 광학 문자 인식 시스템들, PDA들, 팩스들, 디지탈 카메라들, 디지탈 비디오 카메라들 및/또는 비디오 게임 시스템들을 포함하지만 이에 한정되지 않는 다량의 문서 이미지 어플리케이션들에 사용될 수 있다.
본 발명의 다양한 특징들에 추가의 환경을 제공하기 위해, 도 14 및 다음의 설명은, 본 발명의 다양한 특징들이 구현될 수 있는 하나의 가능하고 적합한 컴퓨팅 환경(1410)에 대한 간단하고 일반적인 설명을 제공하도록 의도된다. 컴퓨팅 환경(1410)은 하나의 가능한 컴퓨팅 환경이지만 본 발명이 채용될 수 있는 컴퓨팅 환경을 제한하도록 의도되지 않는다는 것을 이해해야 한다. 발명은 하나 이상의 컴퓨터에서 실행될 수 있는 컴퓨터 실행가능한 명령어들의 일반적인 관점에서 설명되었지만, 본 발명은 다른 프로그램 모듈들의 조합으로 및/또는 하드웨어와 소프트웨어의 조합으로서 구현될 수도 있다는 것을 인식해야 한다. 일반적으로, 프로그램 모듈들은 특정 작업들을 수행하거나 특정 추상 데이터 유형을 구현하는, 루틴들, 프로그램들, 컴포넌트들, 데이터 구조들 등을 포함한다. 또한, 발명의 방법들은, 각각이 하나 이상의 관련 장치들과 동작적으로 결합될 수 있는 퍼스널 컴퓨터들, 핸드헬드(hand-held) 컴퓨팅 장치들, 마이크로프로세서 기반의 또는 프로그램가능한 가전 제품 등 뿐만 아니라 단일 프로세서 또는 멀티 프로세서 컴퓨터 시스템, 미니컴퓨터들, 메인프레임 컴퓨터들을 포함하는 다른 컴퓨터 시스템 구성들에서 실행될 수 있다는 것을 알 것이다. 본 발명의 예시된 특징들은 임의의 작업들이 통신 네트워크를 통해 링크되어 있는 원격 처리 장치들에 의해 수행되는 분산된 컴퓨팅 환경들에서 실행될 수도 있다. 분산된 컴퓨팅 환경에서는, 프로그램 모듈들이 로컬 및 원격 메모리 저장 장치 모두에 배치될 수 있다.
도 14는 본 명세서에 기재된 시스템들 및 방법들을 지원하는 하나의 가능한 하드웨어 구성을 예시한다. 독립형 아키텍쳐가 예시되지만, 본 발명에 따라 임의의 적절한 컴퓨팅 환경이 채용될 수 있다는 것을 이해해야 한다. 예를 들면, 독립형, 멀티프로세서, 분산형, 서버/클라이언트, 미니컴퓨터, 메인프레임, 수퍼컴퓨터, 디지털 및 아날로그를 포함하지만 이에 한정되지 않는 컴퓨팅 아키텍쳐들이 본 발명에 따라 채용될 수 있다.
도 14를 참조하면, 본 발명의 다양한 특징들을 구현하는 예시적인 환경(1410)은 처리 유닛(1414), 시스템 메모리(1416), 및 시스템 메모리를 포함한 다양한 시스템 컴포넌트들을 처리 유닛(1414)에 결합시키는 시스템 버스(1418)를 포함하는 컴퓨터(1412)를 포함한다. 처리 유닛(1414)은 임의의 각종 상업적으로 유용한 프로세서들일 수 있다. 듀얼 마이크로프로세서들 및 다른 멀티 프로세서 아키텍처들은 또한 처리 유닛(1414)으로서 사용될 수 있다.
시스템 버스(1418)는 메모리 버스 또는 메모리 컨트롤러, 주변 버스, 및 임의의 다양한 상업적으로 이용가능한 버스 아키텍쳐들을 이용하는 로컬 버스를 포함하는 여러 유형의 버스 구조들 중 어느 것이라도 될 수 있다. 컴퓨터 메모리(1416)는 ROM(read only memory)(1420) 및 RAM(random access memory)(1422)를 포함한다. 시동 중과 같은 때에, 컴퓨터(1412) 내의 구성요소들 사이의 정보를 전송하도록 돕는 기본적인 루틴을 포함하는, BIOS(basic input/output system)이 ROM(1420)에 저장되어 있다.
컴퓨터(1412)는 하드 디스크 드라이브(1424), 예를 들면, 이동식 디스크(1428)로부터 판독하거나 이 디스크에 기록하기 위한 자기 디스크 드라이브(1426), 및 CO-ROM 디스크(1434)를 판독하거나, 다른 광학 매체로부터 판독하거나 이 광학 매체에 기록하기 위한 광디스크 드라이브(1430)를 더 포함할 수 있다. 하드 디스크 드라이브(1424), 자기 디스크 드라이브(1426), 및 광디스크 드라이브(1430)는, 각각, 하드 디스크 드라이브 인터페이스(1434), 자기 디스크 드라이브 인터페이스(1436), 및 광 드라이브 인터페이스(1438)에 의해 시스템 버스(1418)에 접속된다. 컴퓨터(1412)는 일반적으로 컴퓨터 판독가능 매체의 적어도 일부 형태를 포함한다. 컴퓨터 판독가능 매체는 컴퓨터(1412)에 의해 액세스될 수 있는 임의의 이용가능한 매체일 수 있다. 예로서, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 포함할 수 있지만 이에 한정되지 않는다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어들, 데이터 구조들, 프로그램 모듈들 또는 기타 데이터 등의 정보의 저장을 위한 임의의 방법 또는 기술로 구현되는 휘발성과 비휘발성, 및 이동식과 비이동식 매체를 포함한다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital versatile disks) 또는 기타 자기 저장 장치들, 또는 원하는 정보를 저장하는데 사용될 수 있고 컴퓨터(1412)에 의해 액세스될 수 있는 임의의 기타 매체들을 포함하지만, 이에 제한되지 않는다. 통신 매체는 일반적으로 컴퓨터 판독가능 명령어들, 데이터 구조들, 프로그램 모듈들 또는 반송파 또는 기타 전송 메카니즘과 같이 변조된 데이터 신호의 다른 데이터를 구현하며, 임의의 정보 전달 매체를 포함한다. "변조된 데이터 신호(modulated data signal)"라는 용어는 그 특성들 중 하나 이상이 신호의 정보를 인코드하도록 설정되거나 변경된 신호를 의미한다. 제한되지 않는 예에 의하면, 통신 매체는 유선 네트워크 또는 직접 유선 접속과 같은 유선 매체, 및 음향(acoustic), RF, 적외선 및 기타 무선 매체 등의 무선 매체를 포함한다. 상술한 것의 임의의 조합들도 컴퓨터 판독가능 매체의 범위내에 포함되어야 한다.
운영 체제(1440), 하나 이상의 어플리케이션 프로그램들(1442), 다른 프로그램 모듈들(1444), 및 프로그램 비인터럽트 데이터(1446)를 포함한 다수의 프로그램 모듈들은 드라이버들과 RAM(1442)에 저장될 수 있다. 컴퓨터(1412)의 운영 체제(1440)는 다수의 상업적으로 이용가능한 운영 체제 중 어느 것일 수 있다.
사용자는 키보드(1448) 및 마우스(1450) 등의 포인팅 장치(pointing device)를 통해 커맨드들과 정보를 컴퓨터(1412)에 입력할 수 있다. 다른 입력 장치들(도시하지 않음)로는 마이크로폰, IR 리모트 컨트롤, 조이스틱, 게임 패드, 위성 안태나, 스캐너 등을 포함할 수 있다. 이들 및 다른 입력 장치들은 종종 시스템 버스(1418)에 결합되는 직렬 포트 인터페이스(1452)를 통해 처리 유닛(1414)에 접속되지만, 병렬 포트, 게임 포트, USB(universal serial bus), IR 인터페이스 등의 다른 인터페이스들에 의해 접속될 수 있다. 모니터(1454), 또는 다른 유형의 표시 장치는 또는 비디오 어댑터(1456) 등의 인터페이스를 통해 시스템 버스(1418)에 접속될 수 있다. 모니터 외에도, 컴퓨터는 일반적으로 스피커들, 프린터들 등의 다른 주변 출력 장치들(도시하지 않음)을 포함한다.
컴퓨터(1412)는 원격 컴퓨터(들)(1458)와 같은 하나 이상의 원격 컴퓨터들과의 논리적 및/또는 물리적 접속을 이용하여 네트워킹된 환경에서 동작할 수 있다. 원격 컴퓨터(들)(1458)는 워크스테이션, 서버 컴퓨터, 라우터, 퍼스널 컴퓨터, 마이크로프로세서 기반의 오락 기기, 피어(peer) 장치 또는 다른 공통 네트워크 노드일 수 있으며, 컴퓨터(1412)와 관련된 상기 구성요소들 중 대다수 또는 모두를 포함하지만, 설명의 편의상, 메모리 저장 장치(1460)만이 예시되었다. 도시된 논리적 접속들은 LAN(local area network)(1462) 및 WAN(wide area network)(1464)을 포함한다. 이러한 네트워킹 환경들은 사무실, 전사적(enterprise-wide) 컴퓨터 네트워크들, 인트라넷들 및 인터넷에서 일반적이다.
LAN 네트워킹 환경에서 사용되는 경우, 컴퓨터(1412)는 네트워크 인터페이스 또는 어댑터(1466)를 통해 로컬 네트워크(1462)에 접속된다. WAN 네트워킹 환경에서 사용되는 경우, 컴퓨터(1412)는 일반적으로 모뎀(1468)을 포함하거나, LAN 상의 통신 서버에 접속되거나, 인터넷과 같은, WAN(1464)을 통한 통신들을 구축하는 기타 수단들을 갖는다. 내부 또는 외부에 있을 수 있는 모뎀(1468)은 직렬 포트 인터페이스(1452)를 통해 시스템 버스(1418)에 접속된다. 네트워킹된 환경에서, 컴퓨터(1412)와 관련하여 설명된 프로그램 모듈들, 또는 그 일부는 원격 메모리 저장 장치(1460)에 저장될 수 있다. 도시된 네트워크 접속들은 예시적이며, 컴퓨터들 사이의 통신 링크를 구축하는 기타 수단들이 사용될 수 있다는 것을 이해해야 한다.
도 15는 본 발명이 상호작용할 수 있는 샘플 컴퓨팅 환경(1500)의 개략적인 블록도이다. 시스템(1500)은 하나 이상의 클라이언트(들)(1510)을 포함한다. 클라이언트(들)(1510)는 하드웨어 및/또는 소프트웨어(예를 들면, 스레드들(threads), 프로세스들, 컴퓨팅 장치들)일 수 있다. 시스템(1500)은 또한 하나 이상의 서버(들)(1530)를 포함한다. 서버(들)(1530)는 또한 하드웨어 및/또는 소프트웨어(예를 들면, 스레드들(threads), 프로세스들, 컴퓨팅 장치들)일 수 있다. 서버들(1530)은 예를 들어 본 발명을 채용함으로써 변환을 수행하기 위해 스레드들을 하우징(housing)할 수 있다. 클라이언트(1510)와 서버(1530) 사이의 하나의 가능한 통신은 두개 이상의 컴퓨터 프로세스들 사이에 전송되도록 적응된 데이터 패킷의 형태일 수 있다. 시스템(1500)은 클라이언트(들)(1510)와 서버(들)(1530) 사이의 통신들을 용이하게 하도록 채용될 수 있는 통신 프레임워크(1550)를 포함한다. 클라이언트(들)(1510)는 클라이언트(들)(1510)에 국부적인 정보를 저장하도록 채용될 수 있는 하나 이상의 클라이언트 데이터 저장소(store)(들)(1560)에 동작가능하게 접속될 수 있다. 유사하게, 서버(들)(1530)는 서버(들)(1530)에 국부적인 정보를 저장하도록 채용될 수 있는 하나 이상의 서버 데이터 스토어(들)(1540)에 동작가능하게 접속될 수 있다.
상술된 것은 본 발명의 예들을 포함한다. 물론, 본 발명의 기재를 위해 컴포넌트들 또는 방법론들의 모든 생각할 수 있는 조합을 기재하는 것은 불가능하지만, 당업자들은 본 발명의 많은 추가의 조합들 및 변형들이 가능하다는 것을 인식할 수 있다. 따라서, 본 발명은 첨부된 특허청구범위의 사상 및 범위에 속하는 모든 이러한 변경들, 수정들 및 변화들을 포함하도록 의도된다. 또한, 용어 "포함한다(include)"가 상세한 설명 및 특허청구범위에서 이용되는 한, 이러한 용어는 청구항에서 변형되는 단어로서 채용될 때 "포함하는(comprising)"이 해석되는 것과 같이 용어 "포함하는(comprising)"과 마찬가지로 내포적인 것이다.
본 발명에 의하면, 일반적으로 문서 이미지의 포그라운드와 백그라운드를 분리하는 마스크를 이용하여 문서 이미지 압축을 용이하게 할 수 있다.

Claims (40)

  1. 세그먼트된 계층화 이미지 시스템(segmented layered image system)으로서,
    문서 이미지의 영역에 대한 화소 에너지를 계산하고, 포그라운드(foreground) 및 백그라운드(background) 중 적어도 하나의 화소 에너지의 최소화에 적어도 부분적으로 기초하여 상기 영역의 파티션(partition)을 계산하도록 적응된 화소 에너지 컴포넌트(pixel energy component);
    화소 에너지의 최소화에 적어도 부분적으로 기초하여 상기 문서 이미지의 영역들의 쌍들을 합병하는 영역 합병 컴포넌트(region merge component); 및
    상기 파티션과 관련된 정보를 마스크에 저장하도록 적응된 마스크 저장 컴포넌트(mask storage component)
    를 포함하는 세그먼트된 계층화 이미지 시스템.
  2. 제1항에 있어서, 상기 화소 에너지 컴포넌트는 상기 영역의 화소 에너지의 분산(variance)을 계산하기 위해
    Figure 112009060177936-pat00034
    Figure 112009060177936-pat00035
    을 이용하여 에너지 분산을 계산하고,
    여기서, F는 상기 포그라운드이고,
    B는 상기 백그라운드이고, f(x)는 화소 위치 x에서의 상기 화소의 값이고,
    Figure 112009060177936-pat00036
    는 상기 포그라운드의 평균 화소값이고,
    Figure 112009060177936-pat00037
    는 상기 백그라운드의 평균 화소값이고,
    NF는 상기 포그라운드의 화소수이며,
    NB는 상기 백그라운드의 화소수인,
    세그먼트된 계층화 이미지 시스템.
  3. 제1항에 있어서, 상기 화소 에너지 컴포넌트는 상기 영역의 화소 에너지의 계산을 위해
    Figure 112008021609213-pat00038
    Figure 112008021609213-pat00039
    을 이용하여 에너지를 계산하고,
    여기서, F는 상기 포그라운드이고,
    B는 상기 백그라운드이고, f(x,y)는 위치 x,y에서의 상기 화소의 값이고,
    AF, BF, CF는 상기 포그라운드의 에너지 υF를 최소화하도록 선택되고,
    AB, BB, CB는 상기 백그라운드의 에너지 υB를 최소화하도록 선택되는,
    세그먼트된 계층화 이미지 시스템.
  4. 제1항에 있어서, 상기 영역 합병 컴포넌트는 2개의 영역들의 포그라운드들과 백그라운드들의 조합들을 평가하고, 최소한의 누적 에너지(cumulative energy)를 갖는 조합을 선택하는 세그먼트된 계층화 이미지 시스템.
  5. 제1항에 있어서, 상기 영역 합병 컴포넌트는 소정의 영역들에 대한 상기 화소 에너지의 근사치 f에 기초하여, 2개의 영역들의 포그라운드들과 백그라운드들의 조합들의 제한된 서브세트를 평가하고, 최소한의 누적 에너지를 갖는 조합을 선택하는 세그먼트된 계층화 이미지 시스템.
  6. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 사진 복사기.
  7. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 문서 스캐너.
  8. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 광학 문자 인식 시스템.
  9. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 PDA(personal digital assistants).
  10. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 팩스 장치.
  11. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 디지털 카메라.
  12. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 디지털 비디오 카메라.
  13. 제1항의 세그먼트된 계층화 이미지 시스템을 사용하는 비디오 게임 시스템.
  14. 세그먼트된 계층화 이미지 시스템에서 사용되는 마스크를 생성하는 방법에 있어서,
    소정의 영역에 대한 화소 에너지를 계산하는 단계;
    상기 영역의 포그라운드와 백그라운드 중 적어도 하나의 상기 계산된 화소 에너지에 적어도 부분적으로 기초하여 상기 영역을 파티셔닝(partitioning)하는 단계;
    상기 포그라운드와 상기 백그라운드 중 적어도 하나의 에너지의 최소화에 기초하여 인접한 영역들의 쌍들을 합병하는 단계; 및
    상기 파티셔닝 정보를 마스크에 저장하는 단계
    를 포함하는 세그먼트된 계층화 이미지 시스템에서 사용되는 마스크를 생성하는 방법.
  15. 제14항에 있어서, 상기 소정의 영역에 대한 화소 에너지를 계산하는 단계는,
    포그라운드에 대한 화소값들의 합을 계산하는 단계;
    백그라운드에 대한 화소값들의 합을 계산하는 단계; 및
    상기 영역의 화소들 모두에 대하여 상기 포그라운드 및 상기 백그라운드의 평균 화소값들과 상기 포그라운드 및 상기 백그라운드에 대한 상기 화소값들간의 거리들의 제곱들의 합을 계산하는 단계를 더 포함하는 방법.
  16. 마스크 분리기 컴포넌트(mask separator component)를 구현하기 위한 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능 기록 매체에 있어서, 상기 마스크 분리기 컴포넌트는,
    문서 이미지의 영역에 대한 화소 에너지를 계산하고, 포그라운드 및 백그라운드 중 적어도 하나의 화소 에너지의 최소화에 적어도 부분적으로 기초하여 상기 영역의 파티션을 계산하도록 적응된 화소 에너지 컴포넌트;
    합병되는 영역이 제1 임계 에너지를 초과하는 지에 대한 판정에 적어도 부분적으로 기초하여 상기 문서 이미지의 영역들의 쌍들을 합병하고, 이 합병된 영역을 새로운 포그라운드와 새로운 백그라운드로 파티셔닝하도록 적응된 합병 영역 컴포넌트; 및
    상기 파티션과 관련된 정보를 마스크에 저장하도록 적응된 마스크 저장 컴포넌트
    를 포함하는 컴퓨터 판독가능 기록 매체.
  17. 제16항에 있어서, 상기 문서 이미지는 문서의 YUV, RGB 및 바이너리 표시 중 적어도 하나를 포함하는 컴퓨터 판독가능 기록 매체.
  18. 제16항에 있어서, 상기 마스크는 상기 포그라운드와 상기 백그라운드의 파티션과 관련된 정보의 바이너리 표시인 컴퓨터 판독가능 기록 매체.
  19. 제16항에 있어서, 상기 화소 에너지 컴포넌트는 K-평균 클러스터링 알고리즘(K-means clustering algorithm)-여기서, K=2임-을 적어도 부분적으로 이용하여 소정의 영역에 대한 화소 에너지 분산을 계산하는 컴퓨터 판독가능 기록 매체.
  20. 제16항에 있어서, 상기 화소 에너지 컴포넌트는, 상기 영역의 화소 에너지의 분산을 계산하기 위해
    Figure 112009060177936-pat00040
    Figure 112009060177936-pat00041
    을 이용하여 에너지 분산을 계산하고
    여기서, F는 상기 포그라운드이고,
    B는 상기 백그라운드이고, f(x)는 화소 위치 x에서의 상기 화소의 값이고,
    Figure 112009060177936-pat00042
    는 상기 포그라운드의 평균 화소값이고,
    Figure 112009060177936-pat00043
    는 상기 백그라운드의 평균 화소값이고,
    NF는 상기 포그라운드의 화소수이며,
    NB는 상기 백그라운드의 화소수인,
    컴퓨터 판독가능 기록 매체.
  21. 제16항에 있어서, 상기 화소 에너지 컴포넌트는 화소 에너지의 계산과 관련된 정보의 적어도 일부를 적어도 일시적으로 저장하는 컴퓨터 판독가능 기록 매체.
  22. 제16항에 있어서, 상기 화소 에너지 컴포넌트는 상기 영역의 다항 회귀(polynomial regression)에 적어도 부분적으로 기초하여 상기 영역에 대한 화소 에너지를 계산하는 컴퓨터 판독가능 기록 매체.
  23. 제16항에 있어서, 상기 영역 합병 컴포넌트의 파티셔닝은 상기 합병된 영역의 화소값들의 평균에 적어도 부분적으로 기초하는 컴퓨터 판독가능 기록 매체.
  24. 제23항에 있어서, 상기 포그라운드에 할당되는 화소값은 상기 평균보다 큰 컴퓨터 판독가능 기록 매체.
  25. 제23항에 있어서, 상기 백그라운드에 할당되는 화소값은 상기 평균보다 큰 컴퓨터 판독가능 기록 매체.
  26. 제16항에 있어서, 상기 문서 이미지는 YUV 표시이고 상기 화소 에너지 컴포넌트는 화소 에너지 계산시 적어도 Y 성분을 이용하는 컴퓨터 판독가능 기록 매체.
  27. 문서 이미지를 백그라운드와 포그라운드로 파티셔닝하는 마스크의 생성 방법에 있어서,
    소정의 영역에 대한 화소 에너지를 계산하는 단계;
    상기 영역의 포그라운드와 백그라운드 중 적어도 하나의 상기 계산된 화소 에너지에 적어도 부분적으로 기초하여 상기 영역을 파티셔닝하는 단계;
    새로운 포그라운드와 백그라운드에 관련된 임계 에너지가 합병되는 영역에서 초과되지 않는다면 인접한 영역들의 쌍들을 합병하는 단계;
    상기 합병된 영역을 상기 새로운 포그라운드와 상기 새로운 백그라운드로 파티셔닝하는 단계; 및
    상기 파티셔닝 정보를 마스크에 저장하는 단계
    를 포함하는, 문서 이미지를 백그라운드와 포그라운드로 파티셔닝하는 마스크의 생성 방법.
  28. 제27항에 있어서, 상기 소정의 영역에 대한 화소 에너지를 계산하는 단계는,
    포그라운드에 대한 화소값들의 합을 계산하는 단계;
    백그라운드에 대한 화소값들의 합을 계산하는 단계; 및
    상기 영역의 화소들 모두에 대하여 상기 포그라운드 및 상기 백그라운드의 평균 화소값들과 상기 포그라운드 및 상기 백그라운드에 대한 상기 화소값들간의 거리들의 제곱의 합을 계산하는 단계를 더 포함하는 방법.
  29. 제27항에 있어서, 상기 소정의 영역에 대한 화소 에너지를 계산하는 단계는 상기 영역의 다항 회귀(polynomial regression)에 적어도 부분적으로 기초하는 방법.
  30. 제27항에 있어서, 상기 영역을 파티셔닝하는 단계는 포그라운드 및 백그라운드 중 적어도 하나의 화소 에너지를 최소화하는 단계를 더 포함하는 방법.
  31. 제27항에 있어서, 상기 합병된 영역을 파티셔닝하는 단계는 상기 합병된 영역의 화소값들의 평균을 계산하는 단계를 더 포함하는 방법.
  32. 제27항에 있어서, 상기 합병된 영역을 파티셔닝하는 단계는,
    상기 합병된 영역의 포그라운드의 평균 화소값을 계산하는 단계;
    상기 합병된 영역의 백그라운드의 평균 화소값을 계산하는 단계; 및
    상기 포그라운드의 평균 화소값과 상기 백그라운드의 평균 화소값 사이의 차가 제3 임계치보다 크면 상기 포그라운드와 상기 백그라운드 중 하나에 화소들을 할당하는 단계를 더 포함하는 방법.
  33. 제27항에 있어서, 상기 영역을 파티셔닝하는 단계는,
    상기 영역에 대한 에너지를 계산하는 행위; 및
    상기 에너지가 제2 임계 에너지보다 작으면 상기 포그라운드와 상기 백그라운드 중 하나에 상기 영역의 화소들을 할당하는 행위를 더 포함하는 방법.
  34. 문서 이미지 압축 시스템으로서,
    문서 이미지를 수신하고 상기 문서 이미지의 변환된 표시를 출력하도록 적응된 문서 변환 컴포넌트; 및
    상기 변환된 표시의 영역에 대한 화소 에너지를 결정하고 포그라운드와 백그라운드 중 적어도 하나의 에너지의 최소화에 적어도 부분적으로 기초하여 상기 영역의 파티션을 결정하도록 적응된 화소 에너지 컴포넌트를 포함하는 마스크 분리기 컴포넌트 - 상기 마스크 분리기 컴포넌트는, 제1 임계 에너지가 초과되지 않았으면 영역들의 쌍들을 합병하고, 새로운 포그라운드와 새로운 백그라운드를 포함하는 화소들의 에너지의 최소화에 적어도 부분적으로 기초하여 합병된 영역들의 화소들을 상기 새로운 포그라운드와 상기 새로운 백그라운드로 파티셔닝하도록 적응된 합병 영역 컴포넌트를 더 포함하며, 상기 마스크 분리기 컴포넌트는, 마스크에 파티션 정보를 저장하도록 적응된 마스크 저장 컴포넌트를 더 포함함 -
    를 포함하는 문서 이미지 압축 시스템.
  35. 제34항에 있어서, 상기 마스크에 저장된 정보에 적어도 부분적으로 기초하여 상기 변환된 표시를 포그라운드 이미지와 백그라운드 이미지로 분리하도록 적응된 포그라운드/백그라운드 세그멘터(segmenter) 컴포넌트를 더 포함하는 문서 이미지 압축 시스템.
  36. 제34항에 있어서, 포그라운드 인코더, 백그라운드 인코더 및 마스크 인코더중 적어도 하나를 더 포함하는 문서 이미지 압축 시스템.
  37. 제34항에 있어서, 상기 문서 변환 컴포넌트는 RGB 문서 이미지를 수신하고 상기 RGB 문서 이미지의 YUV 표시를 출력하도록 적응된 문서 이미지 압축 시스템.
  38. 2개 이상의 컴퓨터 프로세스들 사이에 전송되도록 적응된 데이터 패킷에 있어서,
    마스크와 연관된 정보 - 상기 마스크는, 문서 이미지의 포그라운드와 백그라운드 중 적어도 하나에 화소들을 할당하고, 상기 문서 이미지의 영역 내의 화소들의 에너지의 최소화의 계산에 적어도 부분적으로 기초함 - 를 포함하는 데이터 패킷.
  39. 마스크 분리 컴포넌트에 대한 컴퓨터 사용가능한 컴포넌트들을 갖는 컴퓨터 판독가능 매체에 있어서,
    문서 이미지의 표시의 영역에 대한 화소 에너지를 계산하고, 백그라운드와 포그라운드 중 적어도 하나의 에너지의 최소화에 적어도 부분적으로 기초하여 상기 영역의 파티션을 계산하도록 적응된 화소 에너지 컴포넌트;
    합병될 영역들이 임계 에너지를 초과하는지에 대한 판정에 적어도 부분적으로 기초하여 상기 문서 이미지의 표시의 영역들의 쌍들을 합병하고, 포그라운드와 백그라운드 중 적어도 하나의 화소들의 에너지의 최소화에 적어도 부분적으로 기초하여 상기 합병된 영역을 상기 포그라운드와 상기 백그라운드로 파티셔닝도록 적응된 합병 영역 컴포넌트; 및
    상기 포그라운드와 상기 백그라운드의 파티셔닝과 관련된 정보를 마스크에 저장하도록 적응된 마스크 저장 컴포넌트
    를 포함하는 컴퓨터 판독가능 매체.
  40. 마스크 분리 컴포넌트(mask seperation component)를 구현하기 위한 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능 기록 매체에 있어서, 상기 마스크 분리 컴포넌트는,
    문서 이미지의 표시의 영역에 대한 화소 에너지를 계산하기 위한 수단;
    2개의 면(plane)들 중 적어도 하나의 에너지의 최소화에 적어도 부분적으로 기초하여 상기 영역의 파티션을 계산하기 위한 수단;
    합병될 영역들이 임계 에너지를 초과하였는지에 대한 판정에 적어도 부분적으로 기초하여 상기 문서 이미지의 표시의 영역들의 쌍들을 합병하기 위한 수단;
    포그라운드와 백그라운드 중 적어도 하나를 포함하는 화소들의 에너지의 최소화에 적어도 부분적으로 기초하여 영역들의 화소들을 상기 포그라운드와 상기 백그라운드들로 파티셔닝하기 위한 수단; 및
    상기 파티션과 관련된 정보를 마스크에 저장하기 위한 수단
    을 포함하는 컴퓨터 판독가능 기록 매체.
KR1020030018541A 2002-04-25 2003-03-25 세그먼트된 계층화 이미지 시스템, 사진 복사기, 문서 스캐너, 광학 문자 인식 시스템, pda, 팩스 장치, 디지털 카메라, 디지털 비디오 카메라, 비디오 게임 시스템, 마스크의 생성 방법, 마스크 분리기 컴포넌트, 문서 이미지 압축 시스템, 데이터 패킷 및 컴퓨터 판독가능 매체 KR100937543B1 (ko)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US10/133,558 US7164797B2 (en) 2002-04-25 2002-04-25 Clustering
US10/133,842 2002-04-25
US10/133,939 US7392472B2 (en) 2002-04-25 2002-04-25 Layout analysis
US10/133,939 2002-04-25
US10/133,558 2002-04-25
US10/133,842 US7263227B2 (en) 2002-04-25 2002-04-25 Activity detector
US10/180,771 US7110596B2 (en) 2002-04-25 2002-06-26 System and method facilitating document image compression utilizing a mask
US10/180,771 2002-06-26

Publications (2)

Publication Number Publication Date
KR20030084589A KR20030084589A (ko) 2003-11-01
KR100937543B1 true KR100937543B1 (ko) 2010-01-19

Family

ID=29554396

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030018541A KR100937543B1 (ko) 2002-04-25 2003-03-25 세그먼트된 계층화 이미지 시스템, 사진 복사기, 문서 스캐너, 광학 문자 인식 시스템, pda, 팩스 장치, 디지털 카메라, 디지털 비디오 카메라, 비디오 게임 시스템, 마스크의 생성 방법, 마스크 분리기 컴포넌트, 문서 이미지 압축 시스템, 데이터 패킷 및 컴퓨터 판독가능 매체

Country Status (7)

Country Link
US (2) US7110596B2 (ko)
EP (1) EP1388816B1 (ko)
JP (1) JP4295537B2 (ko)
KR (1) KR100937543B1 (ko)
CN (1) CN100470593C (ko)
ES (1) ES2600756T3 (ko)
TW (1) TWI244051B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11961217B2 (en) 2020-12-29 2024-04-16 Pusan National University Industry—University Cooperation Foundation Device and method for storing image data for surface defect detection scanner

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7110596B2 (en) * 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
US20040233477A1 (en) * 2003-05-21 2004-11-25 International Business Machines Corporation Digital halftoning
JP3738291B2 (ja) * 2003-06-09 2006-01-25 住友大阪セメント株式会社 三次元形状測定装置
US7202872B2 (en) * 2003-10-29 2007-04-10 Via Technologies, Inc. Apparatus for compressing data in a bit stream or bit pattern
FR2864857B1 (fr) * 2004-01-05 2006-03-03 Canon Kk Procede et dispositif d'optimisation de la taille d'un document numerique
US6992686B2 (en) * 2004-06-14 2006-01-31 Xerox Corporation System and method for dynamic control of file size
US7782339B1 (en) 2004-06-30 2010-08-24 Teradici Corporation Method and apparatus for generating masks for a multi-layer image decomposition
US8442311B1 (en) 2005-06-30 2013-05-14 Teradici Corporation Apparatus and method for encoding an image generated in part by graphical commands
US7616341B2 (en) * 2004-07-12 2009-11-10 Toshiba Corporation System and method for metadata controlled multi-configured halftone screening
AU2004242419A1 (en) * 2004-12-21 2006-07-06 Canon Kabushiki Kaisha Analysing digital image of a document page
KR100599141B1 (ko) * 2005-05-20 2006-07-12 삼성전자주식회사 문서 압축시스템 및 그 압축방법
US7567254B2 (en) * 2005-06-30 2009-07-28 Microsoft Corporation Parallel texture synthesis having controllable jitter
KR100708180B1 (ko) * 2005-09-22 2007-04-17 삼성전자주식회사 화상 압축 장치 및 방법
DE102006010763A1 (de) * 2006-03-08 2007-09-13 Netviewer Gmbh Hybrides Bildkompressionsverfahren
JP4764231B2 (ja) * 2006-03-31 2011-08-31 キヤノン株式会社 画像処理装置、制御方法、コンピュータプログラム
US8175409B1 (en) 2006-12-01 2012-05-08 Adobe Systems Incorporated Coherent image selection and modification
US8004536B2 (en) * 2006-12-01 2011-08-23 Adobe Systems Incorporated Coherent image selection and modification
US7899247B2 (en) * 2007-01-24 2011-03-01 Samsung Electronics Co., Ltd. Apparatus and method of segmenting an image according to a cost function and/or feature vector and/or receiving a signal representing the segmented image in an image coding and/or decoding system
US7929729B2 (en) * 2007-04-02 2011-04-19 Industrial Technology Research Institute Image processing methods
KR101366596B1 (ko) 2007-08-03 2014-03-14 삼성전자주식회사 이차원 정지 화상에 대해 몰입감을 생성하는 방법 및시스템 그리고 상기 몰입감 생성을 위한 팩터 조절 방법,이미지 콘텐트 분석 방법 및 스케일링 파라미터 예측 방법
US7907778B2 (en) * 2007-08-13 2011-03-15 Seiko Epson Corporation Segmentation-based image labeling
US8391638B2 (en) 2008-06-04 2013-03-05 Microsoft Corporation Hybrid image format
US8204964B2 (en) * 2008-08-06 2012-06-19 Microsoft Corporation Efficient size optimization of visual information or auditory information
US9355469B2 (en) 2009-01-09 2016-05-31 Adobe Systems Incorporated Mode-based graphical editing
CN101510304B (zh) * 2009-03-30 2014-05-21 北京中星微电子有限公司 一种分割获取前景图像的方法、装置和摄像头
EP2406953B1 (en) * 2009-06-22 2015-06-10 Sony Corporation A method of compression of graphics images and videos
JP2011013898A (ja) * 2009-07-01 2011-01-20 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
JP5870458B2 (ja) * 2009-09-09 2016-03-01 ソニー株式会社 無線hd1.1におけるグラフィック−モード圧縮のためのビットストリーム構文
CN102725773B (zh) * 2009-12-02 2015-12-02 惠普发展公司,有限责任合伙企业 数字化图像的前景背景分割的系统与方法
US8582906B2 (en) * 2010-03-03 2013-11-12 Aod Technology Marketing, Llc Image data compression and decompression
CN102006473B (zh) * 2010-11-18 2013-03-13 无锡中星微电子有限公司 视频编码器和编码方法以及视频解码器和解码方法
US8965140B1 (en) * 2011-01-31 2015-02-24 Teradici Corporation Method and apparatus for encoding mixed content image sequences
US8891894B2 (en) * 2011-09-30 2014-11-18 Apple Inc. Psychovisual image compression
CN102890827B (zh) * 2011-10-09 2015-05-13 北京多看科技有限公司 一种扫描版文档重排版的方法
TWI479448B (zh) * 2012-07-06 2015-04-01 Univ Nat Taiwan 影像前處理方法及系統
US9460365B1 (en) * 2015-03-24 2016-10-04 Intel Corporation Clustered palette compression
US10303498B2 (en) 2015-10-01 2019-05-28 Microsoft Technology Licensing, Llc Performance optimizations for emulators
US10922537B2 (en) * 2018-05-01 2021-02-16 Scribe Fusion, LLC System and method for processing and identifying content in form documents
CN108924557B (zh) * 2018-06-11 2022-02-08 海信视像科技股份有限公司 图像处理方法、装置、电子设备及存储介质
US10936907B2 (en) 2018-08-10 2021-03-02 Buffalo Automation Group Inc. Training a deep learning system for maritime applications
CN111652144B (zh) * 2020-06-03 2023-09-26 广东小天才科技有限公司 基于目标区域融合的题目分割方法、装置、设备和介质
US11042422B1 (en) 2020-08-31 2021-06-22 Microsoft Technology Licensing, Llc Hybrid binaries supporting code stream folding
US11231918B1 (en) 2020-08-31 2022-01-25 Microsoft Technologly Licensing, LLC Native emulation compatible application binary interface for supporting emulation of foreign code
US11403100B2 (en) 2020-08-31 2022-08-02 Microsoft Technology Licensing, Llc Dual architecture function pointers having consistent reference addresses
KR20210152992A (ko) * 2020-12-04 2021-12-16 한국전자통신연구원 이진 마스크를 사용하는 영상 인코딩/디코딩을 위한 방법, 장치 및 기록 매체

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020064313A1 (en) 2000-11-29 2002-05-30 Xerox Corporation Rate-distortion optimization system and method for image compression
US6633670B1 (en) * 2000-03-31 2003-10-14 Sharp Laboratories Of America, Inc. Mask generation for multi-layer image decomposition
US6731800B1 (en) * 1999-12-04 2004-05-04 Algo Vision Lura Tech Gmbh Method for compressing scanned, colored and gray-scaled documents

Family Cites Families (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3606546A (en) * 1969-05-13 1971-09-20 Dennison Mfg Co Photocopier
US3719922A (en) * 1971-06-24 1973-03-06 L Lopes Digital camera
FR2171518A5 (ko) * 1972-02-03 1973-09-21 Labo Electronique Physique
US4606069A (en) * 1983-06-10 1986-08-12 At&T Bell Laboratories Apparatus and method for compression of facsimile information by pattern matching
JPS60254871A (ja) 1984-05-31 1985-12-16 Kokusai Denshin Denwa Co Ltd <Kdd> フアクシミリ画像の符号化方法
US4754492A (en) * 1985-06-03 1988-06-28 Picturetel Corporation Method and system for adapting a digitized signal processing system for block processing with minimal blocking artifacts
US5077807A (en) * 1985-10-10 1991-12-31 Palantir Corp. Preprocessing means for use in a pattern classification system
GB8525509D0 (en) 1985-10-16 1985-11-20 Int Computers Ltd Symbol pattern matching
EP0227848B1 (en) * 1985-12-17 1991-05-29 International Business Machines Corporation Image preprocessing procedure for noise removal
JP2675303B2 (ja) 1987-04-28 1997-11-12 キヤノン株式会社 文字認識方法
JPH0816918B2 (ja) 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法
US4924494A (en) * 1989-05-05 1990-05-08 Copam Electronics Corp. Fax machine equipped for simultaneous transmission and reception via two telephone lines
JPH0318986A (ja) 1989-06-15 1991-01-28 Ricoh Co Ltd 文字認識装置
JPH0832085B2 (ja) * 1989-10-18 1996-03-27 松下電器産業株式会社 表示機能付き選択呼出受信装置
US5129014A (en) * 1989-12-08 1992-07-07 Xerox Corporation Image registration
JP2612383B2 (ja) 1991-02-19 1997-05-21 株式会社ピーエフユー 文字認識処理方式
JPH05189617A (ja) * 1991-04-15 1993-07-30 Microsoft Corp 手書き文字認識に於けるアークのセグメント化の方法と装置
JPH06507743A (ja) * 1991-05-21 1994-09-01 ケンブリッジ アニメーション システムズ リミテッド 画像合成及び処理
US5434953A (en) * 1992-03-20 1995-07-18 Xerox Corporation Use of fast textured reduction for discrimination of document image components
US5680479A (en) 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5454047A (en) * 1992-05-15 1995-09-26 Hughes Aircraft Company Optical method and system for generating expansion coefficients for an image processing function
US5721788A (en) * 1992-07-31 1998-02-24 Corbis Corporation Method and system for digital image signatures
US5402146A (en) * 1992-10-23 1995-03-28 International Business Machines Corporation System and method for video compression with artifact dispersion control
US5991515A (en) * 1992-11-10 1999-11-23 Adobe Systems Incorporated Method and apparatus for compressing and decompressing data prior to display
JP3422541B2 (ja) 1992-12-17 2003-06-30 ゼロックス・コーポレーション キーワードのモデル化方法及び非キーワードhmmの提供方法
US5384864A (en) 1993-04-19 1995-01-24 Xerox Corporation Method and apparatus for automatic determination of text line, word and character cell spatial features
JP3037432B2 (ja) * 1993-11-01 2000-04-24 カドラックス・インク 光波オーブンによる食物調理方法および調理装置
US5572604A (en) * 1993-11-22 1996-11-05 Lucent Technologies Inc. Method for pattern recognition using prototype transformations and hierarchical filtering
US5640468A (en) * 1994-04-28 1997-06-17 Hsu; Shin-Yi Method for identifying objects and features in an image
US6137908A (en) * 1994-06-29 2000-10-24 Microsoft Corporation Handwriting recognition system simultaneously considering shape and context information
JP2630923B2 (ja) * 1994-12-05 1997-07-16 日本アイ・ビー・エム株式会社 画像認識方法及び装置
US5737455A (en) * 1994-12-12 1998-04-07 Xerox Corporation Antialiasing with grey masking techniques
DE4445386C1 (de) * 1994-12-20 1996-05-02 Ibm Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage
US5572565A (en) * 1994-12-30 1996-11-05 Philips Electronics North America Corporation Automatic segmentation, skinline and nipple detection in digital mammograms
JP3640318B2 (ja) * 1995-09-01 2005-04-20 インターナショナル・ビジネス・マシーンズ・コーポレーション ディジタル画像の符号化方法及びシステム
JP2761467B2 (ja) * 1995-03-29 1998-06-04 インターナショナル・ビジネス・マシーンズ・コーポレイション 画像切り出し装置及び文字認識装置
US5689585A (en) 1995-04-28 1997-11-18 Xerox Corporation Method for aligning a text image to a transcription of the image
US5883986A (en) 1995-06-02 1999-03-16 Xerox Corporation Method and system for automatic transcription correction
US5915044A (en) * 1995-09-29 1999-06-22 Intel Corporation Encoding video images using foreground/background segmentation
US5574511A (en) * 1995-10-18 1996-11-12 Polaroid Corporation Background replacement for an image
US6094506A (en) * 1995-10-25 2000-07-25 Microsoft Corporation Automatic generation of probability tables for handwriting recognition systems
US6272253B1 (en) * 1995-10-27 2001-08-07 Texas Instruments Incorporated Content-based video compression
JP3756580B2 (ja) * 1995-11-07 2006-03-15 セイコープレシジョン株式会社 多層基板の製造方法及びその製造装置
US5828771A (en) * 1995-12-15 1998-10-27 Xerox Corporation Method and article of manufacture for determining whether a scanned image is an original image or fax image
JP2958396B2 (ja) * 1995-12-20 1999-10-06 富士ゼロックス株式会社 画像形成装置
US5910805A (en) * 1996-01-11 1999-06-08 Oclc Online Computer Library Center Method for displaying bitmap derived text at a display having limited pixel-to-pixel spacing resolution
US6345119B1 (en) * 1996-02-19 2002-02-05 Fujitsu Limited Handwritten character recognition apparatus and method using a clustering algorithm
US6901153B1 (en) * 1996-03-14 2005-05-31 Ati Technologies Inc. Hybrid software/hardware video decoder for personal computer
US5805739A (en) * 1996-04-02 1998-09-08 Picturetel Corporation Lapped orthogonal vector quantization
DE19615493A1 (de) 1996-04-19 1997-10-23 Philips Patentverwaltung Verfahren zur Bildsegmentierung
US6310972B1 (en) * 1996-06-28 2001-10-30 Competitive Technologies Of Pa, Inc. Shape adaptive technique for image and video compression
US5914748A (en) * 1996-08-30 1999-06-22 Eastman Kodak Company Method and apparatus for generating a composite image using the difference of two images
US5778092A (en) * 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
US5917964A (en) * 1996-12-23 1999-06-29 Lg Electronics, Inc. Method and apparatus for pre-processing image data of encoders
JP2836681B2 (ja) 1997-01-14 1998-12-14 日本電気株式会社 パタンマッチング符号化方法及び符号化装置
US5960111A (en) * 1997-02-10 1999-09-28 At&T Corp Method and apparatus for segmenting images prior to coding
US6108446A (en) * 1997-02-18 2000-08-22 Hoshen; Joseph Method and apparatus for extracting cluster shape features from digital images
US6321243B1 (en) * 1997-06-27 2001-11-20 Microsoft Corporation Laying out a paragraph by defining all the characters as a single text run by substituting, and then positioning the glyphs
US6108444A (en) 1997-09-29 2000-08-22 Xerox Corporation Method of grouping handwritten word segments in handwritten document images
US5917951A (en) * 1997-10-03 1999-06-29 International Business Machines Corporation Clustered aperiodic mask
US6118890A (en) * 1997-11-12 2000-09-12 International Business Machines Corporation System and method for broad classification of biometric patterns
US6020972A (en) 1997-11-14 2000-02-01 Xerox Corporation System for performing collective symbol-based compression of a corpus of document images
US6144767A (en) * 1998-04-02 2000-11-07 At&T Corp Efficient convolutions using polynomial covers
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6285801B1 (en) * 1998-05-29 2001-09-04 Stmicroelectronics, Inc. Non-linear adaptive image filter for filtering noise such as blocking artifacts
US6073153A (en) * 1998-06-03 2000-06-06 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6154762A (en) * 1998-06-03 2000-11-28 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6072496A (en) * 1998-06-08 2000-06-06 Microsoft Corporation Method and system for capturing and representing 3D geometry, color and shading of facial expressions and other animated objects
JP2000013596A (ja) 1998-06-18 2000-01-14 Minolta Co Ltd 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
US6192360B1 (en) * 1998-06-23 2001-02-20 Microsoft Corporation Methods and apparatus for classifying text and for building a text classifier
US6253165B1 (en) * 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6233364B1 (en) * 1998-09-18 2001-05-15 Dainippon Screen Engineering Of America Incorporated Method and system for detecting and tagging dust and scratches in a digital image
US6326977B1 (en) * 1998-11-03 2001-12-04 Sharp Laboratories Of America, Inc. Rendering of YCBCR images on an RGS display device
EP1006714A3 (en) 1998-12-02 2001-09-19 Xerox Corporation Method of processing mixed raster content planes
US6564263B1 (en) * 1998-12-04 2003-05-13 International Business Machines Corporation Multimedia content description framework
JP2000175053A (ja) * 1998-12-07 2000-06-23 Xerox Corp 文書の圧縮ピクセルマップ表現を表す混合ラスタコンテントプレ―ンの処理方法
US6195024B1 (en) * 1998-12-11 2001-02-27 Realtime Data, Llc Content independent data compression method and system
US6100825A (en) * 1998-12-31 2000-08-08 Microsoft Corporation Cluster-based data compression system and method
JP3551908B2 (ja) 1999-09-24 2004-08-11 日本電信電話株式会社 背景スプライトと前景オブジェクトの分離方法、及びその装置
EP1089230A3 (en) * 1999-09-24 2008-06-11 Nippon Telegraph and Telephone Corporation Method and apparatus for separating background sprite and foreground object and method and apparatus for extracting segmentation mask
US6826727B1 (en) * 1999-11-24 2004-11-30 Bitstream Inc. Apparatus, methods, programming for automatically laying out documents
EP1104916B1 (de) 1999-12-04 2011-05-11 LuraTech Imaging GmbH Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
KR100337359B1 (ko) * 1999-12-15 2002-05-21 이계안 차량의 주행단 밀림 방지장치 및 그 제어방법
GB2358098A (en) * 2000-01-06 2001-07-11 Sharp Kk Method of segmenting a pixelled image
JP2001266158A (ja) 2000-01-11 2001-09-28 Canon Inc 画像処理装置、画像処理システム、画像処理方法、及び記憶媒体
US7320104B2 (en) * 2000-02-12 2008-01-15 Adobe Systems Incorporated Text grid creation tools
JP2001256244A (ja) * 2000-03-14 2001-09-21 Fuji Xerox Co Ltd 画像データ分類装置および画像データ分類方法
US6674900B1 (en) 2000-03-29 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for extracting titles from digital images
US6738079B1 (en) * 2000-06-02 2004-05-18 Sun Microsystems, Inc. Graphical user interface layout customizer
US6839463B1 (en) * 2000-12-22 2005-01-04 Microsoft Corporation System and method providing subpixel-edge-offset-based determination of opacity
US7027647B2 (en) * 2001-12-31 2006-04-11 Hewlett-Packard Development Company, L.P. Coder matched layer separation for compression of compound documents
US7110596B2 (en) * 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
US7024039B2 (en) 2002-04-25 2006-04-04 Microsoft Corporation Block retouching

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6731800B1 (en) * 1999-12-04 2004-05-04 Algo Vision Lura Tech Gmbh Method for compressing scanned, colored and gray-scaled documents
US6633670B1 (en) * 2000-03-31 2003-10-14 Sharp Laboratories Of America, Inc. Mask generation for multi-layer image decomposition
US20020064313A1 (en) 2000-11-29 2002-05-30 Xerox Corporation Rate-distortion optimization system and method for image compression

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11961217B2 (en) 2020-12-29 2024-04-16 Pusan National University Industry—University Cooperation Foundation Device and method for storing image data for surface defect detection scanner

Also Published As

Publication number Publication date
JP2003346166A (ja) 2003-12-05
US20060274381A1 (en) 2006-12-07
TW200306501A (en) 2003-11-16
EP1388816A2 (en) 2004-02-11
EP1388816B1 (en) 2016-08-03
US7764834B2 (en) 2010-07-27
CN1458628A (zh) 2003-11-26
EP1388816A3 (en) 2005-11-16
ES2600756T3 (es) 2017-02-10
US7110596B2 (en) 2006-09-19
TWI244051B (en) 2005-11-21
KR20030084589A (ko) 2003-11-01
CN100470593C (zh) 2009-03-18
JP4295537B2 (ja) 2009-07-15
US20030202699A1 (en) 2003-10-30

Similar Documents

Publication Publication Date Title
KR100937543B1 (ko) 세그먼트된 계층화 이미지 시스템, 사진 복사기, 문서 스캐너, 광학 문자 인식 시스템, pda, 팩스 장치, 디지털 카메라, 디지털 비디오 카메라, 비디오 게임 시스템, 마스크의 생성 방법, 마스크 분리기 컴포넌트, 문서 이미지 압축 시스템, 데이터 패킷 및 컴퓨터 판독가능 매체
JP4152789B2 (ja) クラスタリングシステムおよびクラスタリング方法
US7120297B2 (en) Segmented layered image system
KR100937542B1 (ko) 세그먼트된 계층화 이미지 시스템
US8229238B2 (en) Image encoding apparatus, image processing apparatus and control method thereof
US7386171B2 (en) Activity detector
US5995665A (en) Image processing apparatus and method
KR20120065394A (ko) 화상처리장치 및 그 처리 방법
JPH11338976A (ja) 文書画像認識装置、その方法、及び記録媒体
EP0613290B1 (en) Method and apparatus for binary image data compression
US7315652B2 (en) Image processing apparatus
JP3085932B2 (ja) マスクを用いた予測映像発生装置及びその装置を用いた2進映像の圧縮、伝送及び復元装置
JP4719924B2 (ja) 画像処理装置および画像処理方法
JP3754721B2 (ja) 画像処理装置及びその方法
JP4743883B2 (ja) 画像符号化装置およびその制御方法
JP2966426B2 (ja) カラー画像処理装置および方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121227

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131227

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20141230

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20151217

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20161220

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20171219

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20181226

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20191217

Year of fee payment: 11