KR101402442B1 - 이미지 처리 디바이스 및 방법 - Google Patents

이미지 처리 디바이스 및 방법 Download PDF

Info

Publication number
KR101402442B1
KR101402442B1 KR1020120077184A KR20120077184A KR101402442B1 KR 101402442 B1 KR101402442 B1 KR 101402442B1 KR 1020120077184 A KR1020120077184 A KR 1020120077184A KR 20120077184 A KR20120077184 A KR 20120077184A KR 101402442 B1 KR101402442 B1 KR 101402442B1
Authority
KR
South Korea
Prior art keywords
image
gray scale
regions
pixels
processed
Prior art date
Application number
KR1020120077184A
Other languages
English (en)
Other versions
KR20130010841A (ko
Inventor
다니안 젱
준 선
사또시 나오이
Original Assignee
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20130010841A publication Critical patent/KR20130010841A/ko
Application granted granted Critical
Publication of KR101402442B1 publication Critical patent/KR101402442B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

이미지 처리 디바이스 및 방법. 이미지 처리 디바이스는 로컬 평균 이미지를 생성하도록 구성된 로컬 평균 이미지 생성부; 2치화 이미지를 생성하도록 구성된 2치화 이미지 생성부 - 높은 주파수 영역들에 대응하는 픽셀들은 제1 그레이 스케일을 가지고 있고 낮은 주파수 영역들에 대응하는 픽셀들은 제2 그레이 스케일을 가짐 -; 3치화 이미지를 생성하기 위해, 이미지 및 로컬 평균 이미지 사이의 비교에 기초하여, 2치화 이미지에서 제1 그레이 스케일을 가지는 영역들을 제1 그레이 스케일을 가지는 영역들 및 제3 그레이 스케일을 가지는 영역들로 분할하도록 구성된 3치화 이미지 생성부; 3치화 이미지에서 제2 그레이 스케일을 가지는 접속된 영역들을 인식하고, 접속된 영역들의 경계들에서 제3 그레이 스케일을 가지는 픽셀들의 양에 대한 제1 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 접속된 영역들을 제1 그레이 스케일로 필링하며, 접속된 영역들의 경계들에서 제1 그레이 스케일을 가지는 픽셀들의 양에 대한 제3 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 접속된 영역들을 제3 그레이 스케일로 필링하도록 구성된 필링부; 및 필링된 3치화 이미지의 오브젝트 경계들에서 그레이 스케일의 일관성에 따라 상기 이미지에서 스트로크들 및 라인들을 인식하도록 구성된 인식부을 포함한다.

Description

이미지 처리 디바이스 및 방법{IMAGE PROCESSING DEVICE AND METHOD}
본 발명은 이미지 처리 디바이스 및 방법에 관련되고, 특히 이미지 내의 스트로크들 및 라인들을 인식하는 이미지 처리 및 방법에 관한 것이다.
하나의 문서 이미지로부터 텍스트 및 그림들을 분리하는 기술은 매우 유용하고, 문서 레이아웃 분석, 문서 이미지 레이어 압축 등에 이용될 수 있다. 현재의 상용 제품들은 문서 이미지 압축 기술을 포함하고, 예를 들면 컬러 모드에서 300DPI 샘플링의 조건 하에서, 전형적인 잡지 페이지를 40-60KB로 압축할 수 있고, 이는 주관적으로 유사한 이미지 품질을 유지하면서도 JPEG의 압축율의 약 5-10배이다. 통상적으로 존재하는 이미지 압축 기술의 제1 스테이지는 2차원 은닉 마르코프 모델(Hidden Markov Model)에 의해 백그라운드(그림들 및 문서 백그라운드)로부터 포어그라운드(텍스트)를 분리하는 것이다. 이것은 대개 포어그라운드를 분리하는 초기 스테이지에서 과도-분할(over-segmentation)을 유발하고, 따라서 일부 상이한 필터들이 적용되어 대부분의 명백한 에러들을 삭제한다.
본 발명의 하나의 실시예에 따르면, 이미지 처리 디바이스가 제공되고, 디바이스는 처리될 이미지의 로컬 평균 이미지를 생성하도록 구성된 로컬 평균 이미지 생성부; 이미지의 2치화(binarization) 이미지를 생성하도록 구성된 2치화 이미지 생성부 - 2치화 이미지에서 높은 주파수 영역들에 대응하는 픽셀들은 제1 그레이 스케일을 가지고 있고 낮은 주파수 영역들에 대응하는 픽셀들은 제2 그레이 스케일을 가짐 -; 3치화 이미지를 생성하기 위해, 이미지 및 로컬 평균 이미지 사이의 비교에 기초하여, 2치화 이미지에서 제1 그레이 스케일을 가지는 영역들을 제1 그레이 스케일을 가지는 영역들 및 제3 그레이 스케일을 가지는 영역들로 분할하도록 구성된 3치화 이미지 생성부; 3치화 이미지에서 제2 그레이 스케일을 가지는 접속된 영역들을 인식하고, 접속된 영역들의 경계들에서 제3 그레이 스케일을 가지는 픽셀들의 양에 대한 제1 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 접속된 영역들을 제1 그레이 스케일로 필링하며, 접속된 영역들의 경계들에서 제1 그레이 스케일을 가지는 픽셀들의 양에 대한 제3 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 접속된 영역들을 제3 그레이 스케일로 필링하도록 구성된 필링부; 및 필링된 3치화 이미지의 오브젝트 경계들에서 그레이 스케일의 일관성에 따라 이미지에서 스트로크들 및 라인들을 인식하도록 구성된 인식부를 포함한다.
본 발명의 또 하나의 실시예에 따르면, 이미지 처리 방법이 제공되고, 방법은 처리될 이미지의 로컬 평균 이미지를 생성하는 단계; 이미지의 2치화 이미지를 생성하는 단계 - 2치화 이미지에서 이미지의 높은 주파수 영역들에 대응하는 픽셀들은 제1 그레이 스케일을 가지고 있고 이미지에서 낮은 주파수 영역들에 대응하는 픽셀들은 제2 그레이 스케일을 가짐 -; 3치화 이미지를 생성하기 위해, 이미지 및 로컬 평균 이미지 사이의 비교에 기초하여, 2치화 이미지에서 제1 그레이 스케일을 가지는 영역들을 제1 그레이 스케일을 가지는 영역들 및 제3 그레이 스케일을 가지는 영역들로 분할하는 단계; 3치화 이미지에서 제2 그레이 스케일을 가지는 접속된 영역들을 인식하고, 접속된 영역들의 경계들에서 제3 그레이 스케일을 가지는 픽셀들의 양에 대한 제1 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 접속된 영역들을 제1 그레이 스케일로 필링하며, 접속된 영역들의 경계들에서 제1 그레이 스케일을 가지는 픽셀들의 양에 대한 제3 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 접속된 영역들을 제3 그레이 스케일로 필링하는 단계; 및 필링된 3치화 이미지의 오브젝트 경계들에서 그레이 스케일의 일관성에 따라 이미지에서 스트로크들 및 라인들을 인식하는 단계를 포함한다.
본 발명에 따른 이미지 처리 디바이스 및 방법은 예를 들면 이하의 특징들을 가지고 있다.
밝은 백그라운드 상의 어두운 텍스트 및 어두운 백그라운드 상의 밝은 텍스트 양쪽 모두를 인식할 수 있고, 다양한 크기들의 텍스트를 동시에 인식할 수 있으며 다양한 스트로크 두께를 가지는 텍스트를 동시에 인식할 수 있으며, 텍스트의 인식은 언어들에 의해 제한되지 않고, 형태들(forms) 또는 라인들을 인식할 수 있다.
도면들과 함께 본 발명의 설명들을 참조함으로써, 본 발명의 상기 및 다른 목적들, 특징들 및 장점들은 더 용이하게 이해될 것이다. 불필요한 세부사항들에 의해 본 발명을 모호하게 하는 것을 피하기 위해, 본 발명의 솔루션에 밀접하게 관련된 디바이스 구조들 및/또는 프로세스 단계들만이 도면들에 예시되어 있고, 본 발명에 밀접하게 관련되지 않은 다른 세부사항들은 생략된다.
도 1은 본 발명의 하나의 실시예에 따른 이미지 처리 디바이스의 구성의 예를 예시하고 있다.
도 2a는 이미지 처리 오브젝트의 예를 예시하고 있다.
도 2b는 도 2a에 도시된 이미지의 로컬 평균 이미지를 예시하고 있다.
도 2c는 도 2a에 도시된 이미지의 로컬 분산 이미지를 예시하고 있다.
도 2d는 도 2a에 도시된 이미지 및 그 로컬 평균 이미지에 기초하여 생성된 3치화 이미지를 예시하고 있다.
도 2e는 도 2d의 필링된 3치화 이미지를 예시하고 있다.
도 2f는 도 2e의 필링된 3치화 이미지로부터 인식된 오브젝트를 예시하고 있다.
도 3a는 밝은 백그라운드 상의 어두운 텍스트를 인식하는 특정 예를 예시하고 있다.
도 3b는 어두운 백그라운드 상의 밝은 텍스트를 인식하는 특정 예를 예시하고 있다.
도 4는 스트로크들 및 라인들을 포함하지 않은 이미지 부분의 처리 결과의 예를 예시하고 있다.
도 5는 본 발명의 또 하나의 실시예에 따른 이미지 처리 디바이스의 구성 예를 예시하는 블록도이다.
도 6a 내지 6c는 4치화 이미지에 대해 방향성 팽창(directed dilation)을 수행하는 예이다.
도 7a 및 7b는 4치화 이미지로부터 분리된 텍스트의 예를 예시하고 있다.
도 8a 및 8b는 본 발명의 하나의 실시예에 따라 이미지 처리 디바이스의 그림, 텍스트 및 라인들을 포함하는 이미지의 처리 결과의 예를 예시하고 있다.
도 9는 본 발명의 하나의 실시예에 따른 이미지 처리 방법의 플로우차트를 예시하고 있다.
도 10은 본 발명의 또 하나의 실시예에 따른 이미지 처리 방법의 플로우차트를 예시하고 있다.
도 11은 본 발명의 디바이스 및 방법이 구현되는 컴퓨터의 예로 든 구조를 예시하는 블록도이다.
본 발명의 실시예들은 도면들과 관련하여 이하에 설명된다. 유의할 점은, 본 발명에 관련되지 않고 본 기술분야의 통상의 기술자에게 공지된 컴포넌트들 및 프로세스들의 표현 및 설명은 명료성을 위해 도면들 및 상세한 설명에서 생략된다는 점이다.
도 1은 본 발명의 하나의 실시예에 따른 이미지 처리 디바이스의 구성의 하나의 예를 예시하고 있다. 이미지 처리 디바이스(100)는 로컬 평균 이미지 생성부(110), 2치화 이미지 생성부(120), 3치화 이미지 생성부(130), 필링부(140) 및 인식부(150)를 포함한다.
이미지 처리 디바이스(100)의 처리 오브젝트로서 이용되는 이미지는 그레이 스케일 이미지 또는 컬러 이미지일 수 있고(컬러 입력 이미지에 대해, 본 기술분야의 종래 방법에 의해 그레이 스케일 이미지로 변환될 수 있다), 이미지는 그림, 텍스트, 라인들, 등과 같은 컨텐트들을 포함할 수 있다. 입력 이미지가 고도로 압축된 이미지인 경우에, 이미지 처리 디바이스(100)는 압축으로 인한 노이즈를 방지하기 위해, 저대역통과 필터(예를 들면, 가우스 필터)를 이용하여 이미지에 대해 스무딩 프로세스(smoothing process)를 수행할 수 있다.
예를 들면, 도 2a는 이미지 처리 디바이스(100)의 처리 오브젝트로서 이용되는 입력 이미지의 예를 예시하고 있고, 여기에서 이미지는 좌측 상단부의 큰 텍스트, 좌측 하단부의 작은 텍스트, 및 우측의 그림을 포함한다.
입력 이미지는 로컬 평균 이미지 생성부(110)에 제공되고, 로컬 평균 이미지 생성부(110)는 입력 이미지에 기초하여 로컬 평균 이미지를 계산한다. 특히, 로컬 평균 이미지 생성부(110)는 로컬 평균 이미지를 생성하기 위해, 로컬 윈도우(예를 들면, 5개의 픽셀들 x 5개의 픽셀들 또는 7개의 픽셀들 x 7개의 픽셀들의 윈도우)를 이용하여 픽셀별로 로컬 평균 값들을 계산할 수 있다. 본 발명의 일부 실시예들에서, 로컬 평균 이미지 생성부(110)에 의해 이용되는 로컬 윈도우의 크기는 처리 오브젝트 이미지의 스트로크들 및/또는 라인들의 두께에 따라 설정될 수 있다.
예를 들면, 도 2b는 도 2a에 도시된 예로 든 입력 이미지로부터 로컬 평균 이미지 생성부(110)에 의해 생성된 로컬 평균 이미지를 예시하고 있다.
입력 이미지는 또한 2치화 이미지 생성부(120)에 제공된다. 2치화 이미지 생성부(120)는 입력 이미지로부터 2치화 이미지를 생성한다. 2치화 이미지에서, 입력 이미지의 높은 주파수 영역들에 대응하는 위치들에 로케이팅된 픽셀들은 제1 그레이 스케일을 가지고 있고, 입력 이미지에서 낮은 주파수 영역들에 대응하는 위치들에 로케이팅된 픽셀들은 제2 그레이 스케일을 가지고 있다. 예를 들면, 2치화 이미지는 로컬 분산 이미지 또는 로컬 그래디언트 이미지일 수 있고, 2치화 이미지 생성부(120)는 2치화 이미지를 생성하기 위해, 로컬 윈도우(예를 들면, 5개의 픽셀들 x 5개의 픽셀들 또는 7개의 픽셀들 x 7개의 픽셀들의 윈도우)를 이용하여 픽셀별로 로컬 분산 또는 그래디언트를 계산할 수 있다. 본 발명의 일부 실시예들에서, 2치화 이미지 생성부(120)에 의해 이용된 로컬 윈도우의 크기는 처리 오브젝트 이미지의 스트로크들 및/또는 라인들의 두께에 따라 설정될 수 있다.
본 발명의 특정 실시예에 따르면, 8-비트 그레이 스케일 이미지(전체 256개의 그레이 스케일 레벨들)를 이용하는 경우에, 제1 그레이 스케일을 0(블랙)으로, 제2 그레이 스케일을 255(화이트)로 취한다.
예를 들면, 도 2c는 도 2a에 도시된 예로 든 입력 이미지로부터 2치화 이미지 생성부(120)에 의해 생성된 로컬 분산을 예시하고 있다. 로컬 분산 이미지에서, 입력 이미지에서 높은 주파수 영역들(높은 분산을 가지는 영역들)에 대응하는 영역들은 그레이 스케일 0(블랙 부분)을 가지는데 대해, 입력 이미지의 낮은 주파수 영역들(낮은 분산을 가지는 영역들)에 대응하는 영역들은 그레이 스케일 255(화이트 부분)를 가지고 있다.
2치화 이미지 생성부(120)는 입력 이미지로부터 생성된 2치화 이미지를 3치화 이미지 생성부(130)에 제공한다. 3치화 이미지 생성부(130)는 3치화 이미지를 생성하기 위해, 입력 이미지와 로컬 평균 이미지 사이의 비교에 기초하여, 2치화 이미지 생성부(120)에 의해 제공된 2치화 이미지에서 제1 그레이 스케일을 가지는 영역들을, 제1 그레이 스케일을 가지는 영역들 및 제3 그레이 스케일을 가지는 영역들로 분할한다.
본 발명의 하나의 실시예에 따르면, 3치화 이미지 생성부(130)는 이하의 규칙들에 의해 2치화 이미지를 분할하여, 3치화 이미지를 생성한다.
Figure 112012056571629-pat00001
여기에서, V(i,j)는 2치화 이미지에서 픽셀(i,j)의 그레이 스케일 값을 나타내고, I(i,j)는 입력 이미지에서 픽셀(i,j)의 그레이 스케일 값들을 나타내며, M(i,j)는 로컬 평균 이미지에서 픽셀(i,j)의 그레이 스케일 값을 나타내고, T(i,j)는 3치화 이미지에서 픽셀(i,j)의 그레이 스케일 값을 나타낸다. 이러한 특정 실시예에서, 제3 그레이 스케일을 128로서 취한다.
즉, 입력 이미지와 로컬 평균 이미지 사이의 비교에 기초하여, 2치화 이미지에서 제1 그레이 스케일을 가지는 영역들의 부분들은 제3 그레이 스케일로 변환되고, 그러한 부분들의 대응하는 픽셀들에 대해, 입력 이미지의 그레이 스케일 값은 로컬 평균 이미지의 그레이 스케일 값보다 더 크다.
예를 들면, 도 2d는 도 2a의 입력 이미지와 도 2b의 로컬 평균 이미지 사이의 비교에 기초하여 도 2c의 2치화 이미지로부터 생성된 3치화 이미지를 예시하고 있다. 도 2d의 다크 그레이 영역들(제3 그레이 스케일, 즉 그레이 스케일이 128인 픽셀 영역들)은 도 2a의 입력 이미지의 그레이 스케일 값이 도 2b의 로컬 평균 이미지의 대응하는 픽셀들의 그레이 스케일 값보다 큰 픽셀 영역들에 대응한다.
3치화 이미지 생성부(130)는 생성된 3치화 이미지를 필링부(140)에 제공한다. 필링부(140)는 3치화 이미지에서 제2 그레이 스케일을 가지는 접속된 영역들을 인식하고, 제2 그레이 스케일을 가지는 접속된 영역들을, 미리결정된 규칙들에 의해 제1 그레이 스케일 또는 제3 그레이 스케일로 필링한다. 특히, 접속된 영역의 경계들에서 제3 그레이 스케일을 가지는 픽셀들의 양에 대한 제1 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에, 접속된 영역이 제1 그레이 스케일로 필링되고, 접속된 영역의 경계들에서 제1 그레이 스케일을 가지는 픽셀들의 양에 대한 제3 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에, 접속된 영역이 제3 그레이 스케일로 필링된다. 필링부(140)에 의해 수행되는 필링 프로세스는 3치화 이미지에서 더 두꺼운 스트로크들 또는 라인들 내부에 존재할 수 있는 제2 그레이 스케일을 가지는 영역을 필링하는 것을 목적으로 하고, 필링 프로세스는 스트로크 또는 라인 오브젝트가 3치화 이미지에서 경계 그레이 스케일의 더 높은 일관성을 대개는 가지고 있다는 특성을 이용한다.
본 발명의 하나의 실시예에 따라, 그레이 스케일 255(제2 그레이 스케일)의 접속된 영역의 경계를 접하는 픽셀들이 N0/(N0+N128)>Tratio를 만족하는 경우에, 접속된 영역은 그레이 스케일 0(제1 그레이 스케일)으로 필링되고, 접속된 영역의 경계를 접하는 픽셀들이 N128/(N0+N128)>Tratio를 만족하는 경우에, 접속된 영역은 그레이 스케일 128(제3 그레이 스케일)로 필링되며, 여기에서 N0 및 N128은 그레이 스케일 255의 접속된 영역의 경계를 접하는 그레이 스케일 0 및 그레이 스케일 128을 각각 가지는 픽셀들의 양을 나타내고, Tratio는 픽셀 양 비율의 임계를 나타낸다. 본 발명의 하나의 특정 실시예에 따르면, Tratio=95%이다. 뿐만 아니라, 상이한 입력 이미지들, 및 로컬 평균 이미지 생성부(110) 및 2치화 이미지 생성부(120)에 의해 이용되는 로컬 윈도우의 크기에 따라, 상이한 임계들이 설정될 수 있다.
예를 들면, 도 2e는 도 2d의 필링된 3치화 이미지의 예를 예시하고 있다. 도 2d의 좌측 상단부의 큰 문자들에서의 화이트 접속 영역들은 제1 그레이 스케일 필링 조건을 만족하기 때문에 도 2e에서 블랙으로 필링되고, 도 2d의 좌측 하단부의 작은 문자들의 화이트 접속된 영역들의 부분들은 제3 그레이 스케일 필링 조건을 만족하기 때문에 도 2e에서 다크 그레이로 필링되며, 도 2d의 우측의 그림 부분의 필링 조건을 만족하는 화이트 접속된 영역들의 부분들은 블랙 또는 다크 그레이로 각각 필링된다.
뿐만 아니라, 상기 언급된 바와 같이 경계에서 픽셀 양 비율의 기준뿐만 아니라 필링부(140)가 스트로크들 또는 라인들 내부에서 제2 그레이 스케일을 가지는 영역들만을 필링하는 것을 보장하기 위해, 필링부(140)는 이하의 기준들 중 하나 또는 모두에 따라 3치화 이미지에서 제2 그레이 스케일을 가지는 접속된 영역들을 필링할 지 여부를 더 결정할 수 있다.
(a) 접속된 영역의 면적은 미리결정된 임계보다 더 작다.
(b) 접속된 영역 내부의 그레이 스케일의 일관성은 미리결정된 기준에 도달하고, 즉, 영역 내부의 픽셀들의 그레이 스케일 변동 범위는 미리결정된 임계보다 더 작다.
필링부(140)는 필링된 3치화 이미지를 인식부(150)에 제공한다. 인식부(150)는 필링된 3치화 이미지에서 오브젝트 경계들에서 그레이 스케일의 일관성에 따라 이미지에서 스트로크들 및/또는 라인들을 인식한다. 특히, 인식부(150)는 필링된 3치화 이미지에서 제1 그레이 스케일을 가지는 픽셀들 및 제3 그레이 스케일을 가지는 픽셀들에 의해 구성되는 접속된 영역(오브젝트)의 경계에서 제3 그레이 스케일을 가지는 픽셀들의 양에 대한 제1 그레이 스케일을 가지는 픽셀들의 양의 비율에 따라 스트로크들 및/또는 라인들을 인식한다. 예를 들면, 경계에서의 픽셀 양 비율이 N128/(N0+N128)>Tratio를 만족하는 경우에, 오브젝트에서 그 그레이 스케일이 0인 부분을 스트로크 및/또는 라인으로 인식하고, N0/(N0+N128)>Tratio인 경우에, 오브젝트에서 그 그레이 스케일이 128인 부분을 스트로크 및/또는 라인으로 인식한다. 본 발명의 하나의 특정 실시예에 따르면, Tratio=95%이다. 뿐만 아니라, 상이한 입력 이미지들, 및 로컬 평균 이미지 생성부(110) 및 2치화 이미지 생성부(120)에 의해 이용되는 로컬 윈도우의 크기에 따라, 상이한 임계들이 설정될 수 있다.
예를 들면, 도 2f는 도 2e의 필링된 3치화 이미지로부터 인식부(150)에 의해 인식된 스트로크들 및/또는 라인들을 예시하고 있다. 여기에서, 좌측 상단부에서의 큰 문자들 및 좌측 하단부에서의 작은 문자들이 인식된다. 뿐만 아니라, 우측의 그림부에서 인식 조건을 만족하는 부분은 또한 스트로크들 및/또는 라인들로 인식된다.
도 3a는 밝은 배경 상의 어두운 텍스트를 인식하는 특정 예를 예시하고 있고, 도 3b는 어두운 배경 상의 밝은 텍스트를 인식하는 특정 예를 예시하고 있다. 도 3a 및 3b의 참조번호 1, 2, 3 및 4는 입력 이미지, 3치화 이미지, 필링된 3치화 이미지, 및 인식된 문자를 각각 나타낸다.
도 3a에서 참조번호 1의 입력 이미지에서 밝은 배경 상에 어두운 문자 "m"이 있다. 도 3a의 참조번호 2에서, 제2 그레이 스케일(화이트)을 가지는 접속된 영역의 경계를 접하는 픽셀들이 대부분 제1 그레이 스케일(블랙)을 가지는 픽셀들이므로, 도 3a의 참조번호 3에서, 접속된 영역은 제1 그레이 스케일로 필링된다. 뿐만 아니라, 필링된 오브젝트의 경계에서의 픽셀들이 대부분 제3 그레이 스케일을 가지고 있으므로, 도 3a의 참조번호 4에서 제1 그레이 스케일을 가지는 픽셀 영역이 문자로서 인식된다.
도 3b에서 참조번호 1의 입력 이미지에서 어두운 배경 상에 밝은 문자 "K"가 있다. 도 3b의 참조번호 2에서, 제2 그레이 스케일(화이트)을 가지는 접속된 영역의 경계를 접하는 픽셀들이 대부분 제3 그레이 스케일(다크 그레이)을 가지는 픽셀들이므로, 도 3b의 참조번호 3에서, 접속된 영역은 제3 그레이 스케일로 필링된다. 뿐만 아니라, 필링된 오브젝트의 경계에서의 픽셀들이 대부분 제1 그레이 스케일(블랙)을 가지고 있는 픽셀들이므로, 도 3a의 참조번호 4에서 제3 그레이 스케일을 가지는 픽셀 영역이 문자로서 인식된다.
그러므로, 본 발명에 따른 이미지 처리 디바이스는 밝은 배경 상의 어두운 텍스트 및 어두운 배경 상의 밝은 텍스트 양쪽 모두를 인식할 수 있다.
도 4는 어떠한 스트로크 또는 라인도 포함하지 않는 이미지 부분에 대한 본 발명의 실시예에 따른 이미지 처리 디바이스의 처리 결과의 예를 예시하고 있다. 오브젝트 경계에서 제3 그레이 스케일을 가지는 많은 픽셀들뿐만 아니라 제1 그레이 스케일을 가지는 많은 픽셀들이 있으므로 도 4의 좌측은 필링된 3치화 이미지이고, 오브젝트는 인식 기준을 만족하지 않으며, 따라서 어떠한 스트로크 또는 라인도 인식되지 않는다.
다음으로, 본 발명의 또 하나의 실시예에 따른 이미지 처리 디바이스(200)의 구성 예가 도 5를 참조하여 설명될 것이다.
이미지 처리 디바이스(200)는 로컬 평균 이미지 생성부(210), 2치화 이미지 생성부(220), 3치화 이미지 생성부(230), 필링부(240), 4치화부(250), 방향성 팽창부(260), 및 오브젝트 분리부(270)를 포함한다. 여기에서, 로컬 평균 이미지 생성부(210), 2치화 이미지 생성부(220), 3치화 이미지 생성부(230) 및 필링부(240)는 도 1을 참조하여 설명된 로컬 평균 이미지 생성부(110), 2치화 이미지 생성부(120), 3치화 이미지 생성부(130), 및 필링부(140)와 유사하고, 여기에서는 그 설명이 생략된다.
필링부(240)는 필링된 3치화 이미지를 4치화부(250)에 제공한다. 4치화부(250)는 4치화 이미지를 생성하기 위해, 입력 이미지의 대응하는 영역들 내의 픽셀들의 그레이 스케일 값에 기초하여, 3치화 이미지에서 제2 그레이 스케일을 가지는 영역들을 백그라운드 영역 및 그림 영역으로 분할하고, 여기에서 백그라운드 영역은 제2 그레이 스케일을 가지고 있으며 그림 영역은 제4 그레이 스케일을 가지고 있다. 하나의 실시예에 따르면, 4치화부(250)는 그레이 스케일 임계를 이용하여 필링된 3치화 이미지 내에서 제2 그레이 스케일을 가지는 영역들에 대응하는 입력 이미지의 영역들을 분할하고, 여기에서 더 높은 그레이 스케일 값을 가지고 있는 부분은 백그라운드 부분으로 분할되며, 더 낮은 그레이 스케일 값을 가지고 있는 부분은 그림 부분으로 분할된다. 뿐만 아니라, 4치화부(250)는 또한 입력 이미지의 대응하는 영역들의 그레이 스케일의 일관성, 즉 그 영역에서 픽셀들의 그레이 스케일 변동 범위에 따라 백그라운드 부분 및 그림 부분을 분할할 수 있다. 예를 들면, 더 작은 그레이 스케일 변동을 가지는 영역은 백그라운드 영역으로 분할되고, 더 큰 그레이 스케일 변동을 가지고 있는 영역은 그림 영역으로 분할된다. 특정 실시예에 따르면, 8 비트 그레이 스케일 이미지를 이용하는 경우에, 제4 그레이를 192(라이트 그레이)로서 취한다.
4치화부(250)는 4치화 이미지를 방향성 팽창부(260)에 제공한다. 방향성 팽창부(260)는 방향성 팽창을 통해, 4치화 이미지에서 백그라운드 영역들 및 그림 영역들의 경계들에서 제1 그레이 스케일 및 제3 그레이 스케일을 가지는 부분들을 제거하고, 그럼으로써 백그라운드 영역 및 그림 영역의 경계에서 리던던시(redundancy) 라인들을 제거한다.
하나의 특정 실시예에 따르면, 방향성 팽창부(260)는 이하의 규칙들에 따라 방향성 팽창을 수행한다.
(a) 백그라운드 영역과 그림 영역의 경계에서 제3 그레이 스케일을 가지는 픽셀 영역이 제2 그레이 스케일을 가지는 픽셀 영역과과 접속되는 경우에, 제3 그레이 스케일을 가지고 있는 픽셀 영역들을 제2 그레이 스케일로 변경한다(128→ 255).
(b) 백그라운드 영역과 그림 영역의 경계에서 제1 그레이 스케일을 가지는 픽셀 영역들이 제4 그레이 스케일을 가지는 픽셀 영역들과 접속되는 경우에, 제1 그레이 스케일을 가지는 픽셀 영역들을 제4 그레이 스케일로 변경한다(0→192).
(c) 백그라운드 영역과 그림 영역의 경계에서 제3 그레이 스케일을 가지는 픽셀 영역들이 제4 그레이 스케일을 가지는 픽셀 영역들과 접속되는 경우에, 제3 그레이 스케일을 가지는 픽셀 영역들을 제4 그레이 스케일로 변경한다(128→192).
도 6a 내지 6c는 상기 규칙들에 의해 4치화 이미지에 대해 방향성 팽창을 수행하는 예를 예시하고 있다. 도 6a는 입력 이미지이고, 도 6b는 4치화 이미지이며, 여기에서 화이트 부분은 백그라운드 영역으로 인식되는 부분이고, 라이트 그레이 부분은 그림 영역으로 인식되는 부분이다. 뿐만 아니라, 도 6b의 화살표들 a, b 및 c는 상기 규칙들 a-c에 의해 각각 방향성 팽창되는 부분들을 나타낸다. 도 6c는 방향성 팽창에 의해 처리되는 이미지를 예시하고 있고, 여기에서 제1 그레이 스케일(블랙) 및 제3 그레이 스케일(다크 그레이)을 가지는 부분들이 백그라운드 영역과 그림 영역의 경계로부터 제거된다.
방향성 팽창부(260)는 방향성 팽창된 4치화 이미지를 오브젝트 분리부(270)에게 제공한다. 오브젝트 분리부(270)는 방향성 팽창된 4치화 이미지로부터, 제1 그레이 스케일을 가지는 영역들 및/또는 제3 그레이 스케일을 가지는 영역들을 스트로크들 및/또는 라인들로 분리한다.
도 7a는 4치화 이미지로부터 분리된 스트로크들 및 라인들의 예를 예시하고 있다.
그림으로부터, 제1 또는 제3 그레이 스케일을 가지는 분리된 텍스트 부분들은 제3 또는 제1 그레이 스케일을 가지는 픽셀 부분들을 포함할 수 있다는 것을 알 수 있다. 그러므로, 하나의 실시예에 따르면, 오브젝트 분리부(270)는 방향성 팽창된 4치화 이미지에서 제1 그레이 스케일을 가지는 픽셀들 및 제3 그레이 스케일을 가지는 픽셀들로 구성된 접속된 영역들(오브젝트)을 이하의 규칙들에 의해 더 처리할 수 있다.
(1) 오브젝트를 접하는 제4 그레이 스케일을 가지는 픽셀들의 양에 대한 제2 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우(n255 > /(n192+n255) > Tratio), 오브젝트에서 제3 그레이 스케일을 가지는 픽셀들을 제2 그레이 스케일로 변환한다(128→255)(이러한 경우는 백그라운드 영역의 블랙 텍스트에 대응한다). 또는,
(2) 오브젝트 경계에서 제3 그레이 스케일을 가지는 픽셀들의 양에 대한 제1 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우(n0/(n0+n128) > Tratio), 오브젝트에서 제3 그레이 스케일을 가지는 픽셀들을 제4 그레이 스케일로 변환한다(128→192)(이러한 경우는 그림 영역의 블랙 텍스트에 대응한다).
(3) 오브젝트 경계에서 제1 그레이 스케일을 가지는 픽셀들의 양에 대한 제3 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우(n128/(n0+n128) > Tratio), 오브젝트에서 제1 그레이 스케일을 가지는 픽셀들을 제4 그레이 스케일로 변환한다(0→192)(이러한 경우는 그림 영역에서 다크 그레이 텍스트에 대응한다).
도 7b는 도 7a의 오브젝트들에 대해 상기 프로세스를 수행한 결과를 예시하고 있다.
하나의 특정 실시예에 따르면, Tratio=95%이다. 뿐만 아니라, 상이한 입력 이미지들, 및 로컬 평균 이미지 생성부(210) 및 2치화 이미지 생성부(220)에 의해 이용된 로컬 윈도우의 크기에 따라, 상이한 임계들이 설정될 수 있다.
도 8은 그림, 텍스트 및 라인들을 포함하는 이미지에 대해 본 발명의 하나의 실시예에 따른 이미지 처리 디바이스(200)의 처리 결과의 예를 예시하고 있다.
입력 이미지는 도 8a에 도시된 바와 같고, 여기에서 입력 이미지는 백그라운드, 백그라운드 상의 텍스트(
Figure 112012056571629-pat00002
), 그림(사진), 그림 영역의 텍스트() 및 라인들, 등을 포함한다.
출력 이미지는 도 8b에 도시된 바와 같고, 여기에서 출력 이미지는 4치화 이미지, 즉 그 픽셀들은 4개의 카테고리들: 어두운 텍스트 또는 라인(블랙, 그레이 스케일이 0이다), 밝은 텍스트 또는 라인(다크 그레이, 그레이 스케일은 128이다), 그림 영역(라이트 그레이, 그레이 스케일은 192이다), 및 백그라운드 영역(화이트, 그레이 스케일은 255이다)으로 분할된다.
도 8로부터, 본 발명의 하나의 실시예에 따른 이미지 처리 디바이스(200)는 그림 영역에서 텍스트 또는 라인들뿐만 아니라, 백그라운드 영역에서 텍스트 및 라인들을 분리할 수 있고, 밝은 백그라운드 상의 어두운 텍스트 및 어두운 백그라운드 상의 밝은 텍스트 양쪽 모두를 분리할 수 있다는 것을 알 수 있다.
도 9는 본 발명의 하나의 실시예에 따른 이미지 처리 방법의 플로우차트를 예시하고 있다.
단계 S110에서, 처리될 이미지의 로컬 평균 이미지를 생성한다.
단계 S120에서, 이미지의 2치화 이미지를 생성하고, 여기에서 이미지에서 높은 주파수 영역에 대응하는 픽셀들은 제1 그레이 스케일을 가지고 있으며 이미지에서 낮은 주파수 영역에 대응하는 픽셀들은 제2 그레이 스케일을 가지고 있다.
단계 S130에서, 3치화 이미지를 생성하기 위해, 이미지 및 로컬 평균 이미지 사이의 비교에 기초하여, 2치화 이미지에서 제1 그레이 스케일을 가지는 영역들을 제1 그레이 스케일을 가지는 영역들 및 제3 그레이 스케일을 가지는 영역들로 분할한다.
단계 S140에서, 3치화 이미지에서 제2 그레이 스케일을 가지는 접속된 영역들을 인식하고, 접속된 영역들의 경계들에서 제3 그레이 스케일을 가지는 픽셀들의 양에 대한 제1 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 접속된 영역들을 제1 그레이 스케일로 필링하며, 접속된 영역들의 경계들에서 제1 그레이 스케일을 가지는 픽셀들의 양에 대한 제3 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에, 접속된 영역들을 제3 그레이 스케일로 필링한다.
단계 S150에서, 필링된 3치화 이미지의 오브젝트 경계들에서 그레이 스케일의 일관성에 따라 이미지에서 스트로크들 및/또는 라인들을 인식한다.
도 10은 본 발명의 또 하나의 실시예에 따른 이미지 처리 방법의 플로우차트를 예시하고 있다.
단계 S210에서, 처리될 이미지의 로컬 평균 이미지를 생성한다.
단계 S220에서, 이미지의 2치화 이미지를 생성하고, 여기에서 이미지에서 높은 주파수 영역에 대응하는 픽셀들은 제1 그레이 스케일을 가지고 있으며, 이미지에서 낮은 주파수 영역에 대응하는 픽셀들은 제2 그레이 스케일을 가지고 있다.
단계 S230에서, 이미지의 3치화 이미지를 생성하기 위해, 이미지와 로컬 평균 이미지 사이의 비교에 기초하여, 2치화 이미지에서 제1 그레이 스케일을 가지는 영역들을 제1 그레이 스케일을 가지는 영역들 및 제3 그레이 스케일을 가지는 영역들로 분할한다.
단계 S240에서, 3치화 이미지에서 제2 그레이 스케일을 가지는 접속된 영역들을 인식하고, 접속된 영역들의 경계들에서 제3 그레이 스케일을 가지는 픽셀들의 양에 대한 제1 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 접속된 영역들을 제1 그레이 스케일로 필링하며, 접속된 영역들의 경계들에서 제1 그레이 스케일을 가지는 픽셀들의 양에 대한 제3 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에, 접속된 영역들을 제3 그레이 스케일로 필링한다.
단계 S250에서, 4치화 이미지를 생성하기 위해, 이미지의 대응하는 영역들의 픽셀들의 그레이 스케일 값들에 기초하여, 필링된 3치화 이미지에서 제2 그레이 스케일을 가지는 영역들을, 제2 그레이 스케일을 가지는 백그라운드 영역들 및 제4 그레이 스케일을 가지는 그림 영역들로 분할한다.
단계 S260에서, 방향성 팽창을 통해, 4치화 이미지에서 백그라운드 영역들 및 그림 영역들의 경계들에서 제1 그레이 스케일 및 제3 그레이 스케일을 가지는 영역들을 제거한다.
단계 S270에서, 방향성 팽창된 4치화 이미지로부터, 제1 그레이 스케일을 가지는 영역들 및/또는 제3 그레이 스케일을 가지는 영역들을 스트로크들 및/또는 라인들로 분리한다.
본 기술분야의 숙련자라면, 본 발명은 디바이스, 방법 또는 컴퓨터 프로그램 제품으로 실시될 수 있다는 것을 잘 알고 있을 것이다. 그러므로, 본 발명은 이하의 형태들로 구체적으로 구현될 수 있고, 즉 완전한 하드웨어, 완전한 소프트웨어(펌웨어, 상주 소프트웨어, 마이크로코드, 등을 포함함), 또는 소프트웨어 및 하드웨어의 조합일 수 있다. 뿐만 아니라, 본 발명은 컴퓨터에 가용한 프로그램 코드를 포함하는 임의의 유형 매체로 실시되는 컴퓨터 프로그램 제품의 형태로 되어 있을 수 있다.
하나 이상의 컴퓨터 판독가능 매체의 임의의 조합이 이용될 수 있다. 컴퓨터 판독가능 매체는 컴퓨터 판독가능 신호 매체 또는 컴퓨터 판독가능 저장 매체일 수 있고, 여기에서 컴퓨터 판독가능 저장 매체는 예를 들면, 전기, 자기, 광, 전자기, 적외선 또는 반도체 시스템, 디바이스, 컴포넌트 또는 전파 매체, 또는 상기 아이템들의 임의의 적절한 조합일 수 있고, 이들로 제한되지 않는다. 컴퓨터 판독가능 저장 매체의 더 구체적인 예들(비-소모적 리스트)은 하나 이상의 도전체들을 구비하는 전기적 접속, 휴대용 컴퓨터 디스크, 하드 디스크, 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 삭제가능 프로그램가능 판독전용 메모리(EPROM 또는 플래시 메모리), 광섬유, 휴대용 컴팩트 디스크 판독전용 메모리(CD-ROM), 광 메모리 디바이스, 자기 메모리 디바이스, 또는 상기 아이템들의 임의의 적절한 조합을 포함한다. 이러한 컨텍스트에서, 컴퓨터 판독가능 저장 매체는 명령 실행 시스템, 디바이스 또는 컴포넌트에 의해 이용되거나 이와 연관되는 프로그램들을 포함하거나 저장하는 임의의 유형 매체일 수 있다.
본 발명의 동작을 실행하는데 이용되는 컴퓨터 프로그램 코드는 하나 이상의 프로그램 언어들의 임의의 조합으로 컴파일링될 수 있고, 프로그램 언어들은 자바, 스몰토크, C++ 등과 같은 오브젝트 지향 프로그래밍 언어를 포함하고, "C"프로그래밍 언어 또는 유사한 프로그래밍 언어와 같은 종래의 절차적 프로그래밍 언어들을 더 포함한다. 프로그램 코드는 사용자의 컴퓨터 상에서 전적으로, 사용자의 컴퓨터 상에서 부분적으로, 독립적인 소프트웨어 패키지로서, 사용자의 컴퓨터 상에서 부분적으로 그리고 원격 컴퓨터 상에서 부분적으로, 또는 원격 컴퓨터 또는 서버 상에서 전적으로 실행될 수 있다. 후자의 경우에, 원격 컴퓨터는 로컬 영역 네트워크(LAN) 또는 와이드 영역 네트워크(WAN)를 포함하는 임의의 종류의 네트워크에 의해 사용자의 컴퓨터에 접속되거나, 외부 컴퓨터에 접속될 수 있다(예를 들면, 인터넷 서비스 제공자를 이용하여 인터넷을 통해).
도 11은 본 발명의 디바이스 및 방법을 구현하는 컴퓨터의 구조의 예를 예시하는 블록도이다.
도 11에서, 중앙 처리 유닛(CPU, 1101)은 판독 전용 메모리(ROM, 1102)에 저장된 프로그램 또는 저장부(1108)으로부터 랜덤 액세스 메모리(RAM, 1103)에 로딩된 프로그램들에 따라 다양한 프로세스들을 수행한다. RAM(1103)에서, CPU(1101)가 다양한 프로세스들을 수행할 때 요구되는 데이터는 또한 필요한 대로 저장된다.
CPU(1101), ROM(1102) 및 RAM(1103)은 버스(1104)를 통해 하나로부터 다른 하나에 접속된다. 입력/출력 인터페이스(1105)는 버스(1104)에 또한 접속된다.
이하의 컴포넌트들: 키보드, 마우스 등을 포함하는 입력부(1106), 음극선관(CRT), 액정 디스플레이(LCD), 등과 같은 디스플레이, 스피커, 등을 포함하는 출력부(1107), 하드 디스크 등을 포함하는 저장부(1108), LAN 카드들, 모뎀들 등과 같은 네트워크 인터페이스 카드들을 포함하는 통신 파트(1109)는 입력/출력 인터페이스(1105)에 접속된다. 통신부(1109)는 인터넷과 같은 네트워크를 통해 통신 프로세스를 수행한다.
요구조건들에 따르면, 드라이브(1110)는 또한 입력/출력 인터페이스(1105)에게 접속된다. 자기 디스크, 광 디스크, 자기-광 디스크, 반도체 메모리, 등과 같은 제거가능 매체(1111)는 요구되는 바와 같이 드라이브(1110) 상에 인스톨되어, 그로부터 판독된 컴퓨터 프로그램이 요구되는 대로 저장부(1108)에 인스톨된다.
소프트웨어에 의해 상기 단계들 및 프로세스들을 구현하는 경우에, 소프트웨어를 구성하는 프로그램들은 인터넷과 같은 네트워크로부터, 또는 제거가능 매체(1111)와 같은 저장 매체로부터 인스톨된다.
본 기술분야의 숙련자들이라면, 그러한 저장 매체는 도 11에 도시된 바와 같이, 제거가능 매체(1111)로 제한되지 않고, 이는 프로그램들과 함께 저장되고 사용자에게 프로그램을 제공하는 방법과는 분리되어 배포된다. 제거가능 매체(1111)의 예는 자기 디스크, 광 디스크(컴팩트 디스크 판독전용메모리(CD-ROM) 및 DVD(Digital Versatile Disc)), 자기-광 디스크(미니-디스크(MD)를 포함함), 및 반도체 메모리를 포함한다. 대안으로, 저장 매체는 ROM(1102), 또는 프로그램이 저장되고 프로그램이 그를 포함하는 방법으로 사용자에게 배포되는 저장부(1108)에 포함된 하드 디스크일 수 있다.
청구항들에서 모든 기능적으로 정의된 디바이스들 및 단계들의 대응하는 구조들, 동작들, 및 등가물들은 청구항들에서 구체적으로 표시된 다른 유닛들과 조합하여 기능을 실행하는데 이용되는 구조들 또는 동작들을 포함하려는 것이다. 상기 제공된 바와 같은 본 발명의 설명은 예시적이고 설명의 목적을 위한 것이지만, 소모적이지 않고 본 발명을 기재된 형태로 정의하는 것도 아니다. 본 기술분야의 숙련자들에 대해, 본 발명의 다수의 변경들 및 변동들이 청구항들의 범주 및 사상에서 벗어나지 않고서도 만들어질 수 있다는 것은 자명하다. 실시예들의 선택 및 설명은 본 발명의 원리들 및 실제적인 어플리케이션들을 더 잘 설명할 목적으로 되어 있고, 본 기술분야의 숙련자들은 본 발명이 특정 의도된 이용에 적합한 다양한 변경들을 가지는 다양한 실시예들을 가질 수 있다는 것을 이해할 수 있다.
110: 로컬 평균 이미지 생성부
120: 2치화 이미지 생성부
130: 3치화 이미지 생성부
140: 필링부
150: 인식부

Claims (10)

  1. 이미지 처리 디바이스로서,
    처리될 이미지의 로컬 평균 이미지를 생성하도록 구성된 로컬 평균 이미지 생성부;
    상기 처리될 이미지의 분산 또는 그래디언트에 따라 상기 처리될 이미지의 2치화(binarization) 이미지를 생성하도록 구성된 2치화 이미지 생성부 - 상기 2치화 이미지는 제1 그레이 스케일을 가지는 영역들 및 제2 그레이 스케일을 가지는 영역들을 포함하고, 제1 그레이 스케일을 가지는 영역들에 대응하는 상기 처리될 이미지 내의 영역들의 분산 또는 그래디언트는 제2 그레이 스케일을 가지는 영역들에 대응하는 상기 처리될 이미지 내의 영역들의 분산 또는 그래디언트보다 높음 -;
    상기 처리될 이미지의 3치화(ternarization) 이미지를 생성하기 위해, 상기 처리될 이미지와 로컬 평균 이미지 사이의 비교에 기초하여, 상기 2치화 이미지에서 제1 그레이 스케일을 가지는 영역들을 제1 그레이 스케일을 가지는 영역들 및 제3 그레이 스케일을 가지는 영역들로 분할하도록 구성된 3치화 이미지 생성부;
    상기 3치화 이미지에서 제2 그레이 스케일을 가지는 접속된 영역들을 인식하고, 상기 접속된 영역들의 경계들에서 제3 그레이 스케일을 가지는 픽셀들의 양에 대한 제1 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 상기 접속된 영역들을 제1 그레이 스케일로 필링(filling)하며, 상기 접속된 영역들의 경계들에서 제1 그레이 스케일을 가지는 픽셀들의 양에 대한 제3 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 상기 접속된 영역들을 제3 그레이 스케일로 필링하도록 구성된 필링부; 및
    상기 필링된 3치화 이미지의 오브젝트 경계들에서 그레이 스케일의 일관성에 따라 상기 처리될 이미지에서 스트로크(stroke)들 및 라인들을 인식하도록 구성된 인식부
    를 포함하는 이미지 처리 디바이스.
  2. 제1항에 있어서,
    상기 필링부는 상기 접속된 영역들의 면적이 미리결정된 임계보다 작고 그리고/또는 상기 접속된 영역들의 그레이 스케일의 일관성이 미리결정된 기준에 도달하는 조건 하에서 상기 필링을 수행하는 이미지 처리 디바이스.
  3. 제1항 또는 제2항에 있어서,
    4치화(quarternarization) 이미지를 생성하기 위해, 상기 처리될 이미지의 대응하는 영역들 내의 픽셀들의 그레이 스케일 값들에 기초하여, 상기 필링된 3치화 이미지에서 제2 그레이 스케일을 가지는 영역들을, 제2 그레이 스케일을 가지는 백그라운드 영역들 및 제4 그레이 스케일을 가지는 그림 영역들로 분할하도록 구성된 4치화부를 더 포함하는 이미지 처리 디바이스.
  4. 제3항에 있어서,
    방향성 팽창(directed dilation)을 통해, 상기 4치화 이미지에서 백그라운드 영역들 및 그림 영역들의 경계들에서 제1 그레이 스케일 및 제3 그레이 스케일을 가지는 영역들을 제거하도록 구성된 방향성 팽창부를 더 포함하는 이미지 처리 디바이스.
  5. 제4항에 있어서,
    상기 방향성 팽창된 4치화 이미지로부터 제1 그레이 스케일을 가지는 영역들 및/또는 제3 그레이 스케일을 가지는 영역들을 스트로크들 및/또는 라인들로서 분리하도록 구성된 오브젝트 분리부를 더 포함하는 이미지 처리 디바이스.
  6. 이미지 처리 방법으로서,
    처리될 이미지의 로컬 평균 이미지를 생성하는 단계;
    상기 처리될 이미지의 분산 또는 그래디언트에 따라 상기 처리될 이미지의 2치화 이미지를 생성하는 단계 - 상기 2치화 이미지는 제1 그레이 스케일을 가지는 영역들 및 제2 그레이 스케일을 가지는 영역들을 포함하고, 제1 그레이 스케일을 가지는 영역들에 대응하는 상기 처리될 이미지 내의 영역들의 분산 또는 그래디언트는 제2 그레이 스케일을 가지는 영역들에 대응하는 상기 처리될 이미지 내의 영역들의 분산 또는 그래디언트보다 높음 -;
    상기 처리될 이미지의 3치화 이미지를 생성하기 위해, 상기 처리될 이미지와 로컬 평균 이미지 사이의 비교에 기초하여, 상기 2치화 이미지에서 제1 그레이 스케일을 가지는 영역들을 제1 그레이 스케일을 가지는 영역들 및 제3 그레이 스케일을 가지는 영역들로 분할하는 단계;
    상기 3치화 이미지에서 제2 그레이 스케일을 가지는 접속된 영역들을 인식하고, 상기 접속된 영역들의 경계들에서 제3 그레이 스케일을 가지는 픽셀들의 양에 대한 제1 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 상기 접속된 영역들을 제1 그레이 스케일로 필링하며, 상기 접속된 영역들의 경계들에서 제1 그레이 스케일을 가지는 픽셀들의 양에 대한 제3 그레이 스케일을 가지는 픽셀들의 양의 비율이 미리결정된 임계보다 큰 경우에 상기 접속된 영역들을 제3 그레이 스케일로 필링하는 단계; 및
    상기 필링된 3치화 이미지의 오브젝트 경계들에서 그레이 스케일의 일관성에 따라 상기 처리될 이미지에서 스트로크들 및 라인들을 인식하는 단계
    를 포함하는 이미지 처리 방법.
  7. 제6항에 있어서, 상기 접속된 영역들을 필링하는 단계에서, 상기 접속된 영역들의 면적이 미리결정된 임계보다 작고 그리고/또는 상기 접속된 영역들의 그레이 스케일의 일관성이 미리결정된 기준에 도달한다는 조건 하에서 상기 필링이 수행되는 이미지 처리 방법.
  8. 제6항 또는 제7항에 있어서,
    4치화 이미지를 생성하기 위해, 상기 처리될 이미지의 대응하는 영역들 내의 픽셀들의 그레이 스케일 값들에 기초하여, 상기 필링된 3치화 이미지에서 제2 그레이 스케일을 가지는 영역들을, 제2 그레이 스케일을 가지는 백그라운드 영역들 및 제4 그레이 스케일을 가지는 그림 영역들로 분할하는 단계를 더 포함하는 이미지 처리 방법.
  9. 제8항에 있어서,
    방향성 팽창을 통해, 상기 4치화 이미지 내의 백그라운드 영역들 및 그림 영역들의 경계들에서 제1 그레이 스케일 및 제3 그레이 스케일을 가지는 영역들을 제거하는 단계를 더 포함하는 이미지 처리 방법.
  10. 제9항에 있어서,
    상기 방향성 팽창된 4치화 이미지로부터 제1 그레이 스케일을 가지는 영역들 및/또는 제3 그레이 스케일을 가지는 영역들을 스트로크들 및/또는 라인들로서 분리하는 단계를 더 포함하는 이미지 처리 방법.
KR1020120077184A 2011-07-19 2012-07-16 이미지 처리 디바이스 및 방법 KR101402442B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110209866.XA CN102890780B (zh) 2011-07-19 2011-07-19 图像处理装置和方法
CN201110209866.X 2011-07-19

Publications (2)

Publication Number Publication Date
KR20130010841A KR20130010841A (ko) 2013-01-29
KR101402442B1 true KR101402442B1 (ko) 2014-06-03

Family

ID=46640535

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120077184A KR101402442B1 (ko) 2011-07-19 2012-07-16 이미지 처리 디바이스 및 방법

Country Status (5)

Country Link
US (1) US8907972B2 (ko)
EP (1) EP2549736B1 (ko)
JP (1) JP5900208B2 (ko)
KR (1) KR101402442B1 (ko)
CN (1) CN102890780B (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473785B (zh) * 2013-09-29 2016-04-20 哈尔滨工业大学 一种基于三值化图像聚类的快速多目标分割方法
CN106611406B (zh) * 2015-10-27 2019-08-16 富士通株式会社 图像校正方法和图像校正设备
US10909406B2 (en) * 2018-01-08 2021-02-02 Newgen Software Technologies Limited Image processing system and method
JP6434180B1 (ja) * 2018-04-20 2018-12-05 株式会社ノエビア 弾性線維形成促進剤
CN109993761B (zh) * 2018-06-29 2021-04-09 长城汽车股份有限公司 一种三值图像获取方法、装置及车辆
CN112037124A (zh) * 2019-06-04 2020-12-04 中国石油化工股份有限公司 基于图像纹理合成的特征可调控的数字岩心重构方法
CN110390698B (zh) * 2019-06-21 2021-09-17 深圳市优必选科技股份有限公司 一种灰度传感器模组及其数据处理方法和机器人
CN111063029B (zh) * 2019-12-11 2023-06-09 深圳市优必选科技股份有限公司 地图构建方法、装置、计算机可读存储介质及机器人
CN112150385B (zh) * 2020-09-29 2023-05-12 四川虹美智能科技有限公司 红外图像滤波方法及装置
KR102561360B1 (ko) * 2021-06-04 2023-08-01 한국과학기술연구원 보정을 사용하지 않고 파이버스코프 이미지를 처리하는 방법 및 이를 수행하는 파이버스코프 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4596174B2 (ja) 2005-09-16 2010-12-08 富士フイルム株式会社 画像処理方法及び画像記録装置
JP4902569B2 (ja) 2008-02-19 2012-03-21 キヤノン株式会社 画像符号化装置及びその制御方法
JP4986976B2 (ja) 2007-12-20 2012-07-25 キヤノン株式会社 画像処理装置、画像形成装置および画像処理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4118749B2 (ja) * 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体
KR100977713B1 (ko) * 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
CN100416597C (zh) * 2004-12-23 2008-09-03 佳能株式会社 用于文档的自适应二值化的方法和设备
JP2006309650A (ja) * 2005-05-02 2006-11-09 Calsonic Kansei Corp ナンバー認識装置及方法
CN100517374C (zh) * 2005-12-29 2009-07-22 佳能株式会社 从复杂背景文档图像提取文本的装置、方法
JP5045619B2 (ja) 2008-09-08 2012-10-10 ソニー株式会社 画像処理装置および方法、並びにプログラム
CN101888469B (zh) * 2009-05-13 2013-03-13 富士通株式会社 图像处理方法和图像处理设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4596174B2 (ja) 2005-09-16 2010-12-08 富士フイルム株式会社 画像処理方法及び画像記録装置
JP4986976B2 (ja) 2007-12-20 2012-07-25 キヤノン株式会社 画像処理装置、画像形成装置および画像処理方法
JP4902569B2 (ja) 2008-02-19 2012-03-21 キヤノン株式会社 画像符号化装置及びその制御方法

Also Published As

Publication number Publication date
JP2013025807A (ja) 2013-02-04
US20130027419A1 (en) 2013-01-31
JP5900208B2 (ja) 2016-04-06
EP2549736A2 (en) 2013-01-23
EP2549736A3 (en) 2013-11-06
CN102890780A (zh) 2013-01-23
CN102890780B (zh) 2015-07-22
KR20130010841A (ko) 2013-01-29
US8907972B2 (en) 2014-12-09
EP2549736B1 (en) 2015-11-18

Similar Documents

Publication Publication Date Title
KR101402442B1 (ko) 이미지 처리 디바이스 및 방법
JP3345350B2 (ja) 文書画像認識装置、その方法、及び記録媒体
CN111767920B (zh) 感兴趣区域的提取方法、装置、电子设备及存储介质
JP7244223B2 (ja) 電子文書における強調テキストの識別
CN113096140B (zh) 实例分割方法及装置、电子设备及存储介质
US10198628B2 (en) Method and apparatus for determining a document suitability for server-based optical character recognition (OCR) processing
CN110533046B (zh) 一种图像实例分割方法、装置、计算机可读存储介质及电子设备
CN108830780A (zh) 图像处理方法及装置、电子设备、存储介质
US10885308B2 (en) Method and apparatus for evaluating illumination condition in face image
KR101396678B1 (ko) 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시시스템 및 방법
JP4748234B2 (ja) 画像処理装置および画像形成装置
CN115131797A (zh) 一种基于特征增强金字塔网络的场景文本检测方法
CN114218889A (zh) 文档处理及文档模型的训练方法、装置、设备和存储介质
CN103455816B (zh) 一种笔画宽度提取方法、装置及一种文字识别方法、系统
JP2008210387A (ja) 文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラム
KR101571681B1 (ko) 동질 영역을 이용한 문서 구조의 분석 방법
KR101887929B1 (ko) 이미지 처리 장치, 이미지 처리 방법, 컴퓨터 판독가능 기록매체 및 화상형성장치
CN116863017A (zh) 图像处理方法、网络模型训练方法、装置、设备、介质
KR20130124659A (ko) 객체 분리 시스템 및 방법
CN113963166B (zh) 特征提取模型的训练方法、装置和电子设备
KR101048399B1 (ko) 문자 검출 방법 및 장치
CN115359502A (zh) 一种图像处理方法、装置、设备以及存储介质
CN114529469A (zh) 图像增强模型的训练和图像增强方法、装置、设备及介质
CN114841906A (zh) 一种图像合成方法、装置、电子设备和存储介质
EP4276676A1 (en) Information processing apparatus, information processing method, program, and storage medium for extracting a named entity from a document

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170504

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee