KR100537827B1 - Method for the Separation of text and Image in Scanned Documents using the Distribution of Edges - Google Patents

Method for the Separation of text and Image in Scanned Documents using the Distribution of Edges Download PDF

Info

Publication number
KR100537827B1
KR100537827B1 KR10-2003-0026046A KR20030026046A KR100537827B1 KR 100537827 B1 KR100537827 B1 KR 100537827B1 KR 20030026046 A KR20030026046 A KR 20030026046A KR 100537827 B1 KR100537827 B1 KR 100537827B1
Authority
KR
South Korea
Prior art keywords
block
image
brightness
area
boundary
Prior art date
Application number
KR10-2003-0026046A
Other languages
Korean (ko)
Other versions
KR20040092564A (en
Inventor
전승홍
홍두의
조남익
Original Assignee
주식회사신도리코
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사신도리코 filed Critical 주식회사신도리코
Priority to KR10-2003-0026046A priority Critical patent/KR100537827B1/en
Publication of KR20040092564A publication Critical patent/KR20040092564A/en
Application granted granted Critical
Publication of KR100537827B1 publication Critical patent/KR100537827B1/en

Links

Classifications

    • G06T5/70
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야1. TECHNICAL FIELD OF THE INVENTION

본 발명은 경계선 분포를 이용한 스캔 영상의 상역 분리 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임.The present invention relates to a method for separating a scan image using boundary distribution and a computer-readable recording medium having recorded thereon a program for realizing the method.

2. 발명이 해결하려고 하는 기술적 과제2. The technical problem to be solved by the invention

본 발명은 스캔 영상의 배경 밝기를 구하고 상기 스캔 영상을 소정의 크기로 블록화하여 구한 상기 각 블록들의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 이용하여 상기 스캔 영상을 배경영역 또는 화상영역 또는 문자영역으로 분리하기 위한 경계선 분포를 이용한 스캔 영상의 상역 분리 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있음.The present invention obtains a background brightness of a scanned image, blocks the scanned image into a predetermined size, and divides the scanned image into a background area, an image area, or a character by using an average brightness and a dispersion of brightness and a boundary line and a boundary line dispersion. It is an object of the present invention to provide a method of separating a scanned image using a boundary distribution for dividing into regions and a computer-readable recording medium recording a program for realizing the method.

3. 발명의 해결방법의 요지3. Summary of Solution to Invention

본 발명은, 경계선 분포를 이용한 스캔 영상의 상역 분리 방법에 있어서, 화상영역과 문자영역이 포함된 영상을 입력받아 상기 영상의 배경 밝기를 구하는 제 1 단계; 상기 입력받은 영상을 소정의 크기로 블록화하는 제 2 단계; 상기 블록화된 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구하는 제 3 단계; 상기 구한 밝기의 분산, 평균 밝기 및 경계선 분산을 이용하여 각 블록을 배경영역, 화상영역 또는 문자영역으로 분리하는 제 4 단계; 및 상기 분리된 배경영역, 화상영역, 문자영역에 대한 후처리 과정을 수행하여 오류를 보정하는 제 5 단계를 포함한다.According to another aspect of the present invention, there is provided a method for separating a scanned image using a boundary line distribution, the method comprising: a first step of receiving an image including an image region and a text region to obtain a background brightness of the image; A second step of blocking the received image into a predetermined size; Obtaining a mean brightness and a dispersion of the brightness and a boundary line and a boundary line dispersion of each blocked block; A fourth step of dividing each block into a background area, an image area, or a text area by using the obtained brightness dispersion, average brightness, and boundary line dispersion; And a fifth step of correcting errors by performing post-processing on the separated background area, image area, and text area.

4. 발명의 중요한 용도4. Important uses of the invention

본 발명은 복합기, 복사기, 스캐너 등에 이용됨.The present invention is used for a multifunction machine, a copier, a scanner, and the like.

Description

경계선 분포를 이용한 스캔 영상의 상역 분리 방법{Method for the Separation of text and Image in Scanned Documents using the Distribution of Edges} Method for the Separation of text and Image in Scanned Documents using the Distribution of Edges}

본 발명은 경계선 분포를 이용한 스캔 영상의 상역 분리 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 더욱 상세하게는 광전 변환소자(CCD : Charge Coupled Device) 또는 접촉 이미지 센서(CIS : Contact Image Sensor) 등에 의해 스캐닝된 문서영상을 배경영역과 화상영역 및 문자영역으로 분리하기 위한 스캔 영상의 상역 분리 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention [0001] The present invention relates to a method for performing phase separation of a scanned image using a borderline distribution and a computer readable recording medium having recorded thereon a program for realizing the method. More particularly, the present invention relates to a charge coupled device (CCD) or a contact. A computer-readable recording method for separating the scanned image into a background region, an image region, and a character region by scanning a document image scanned by an image sensor (CIS) or the like and a program for realizing the method. It is about the medium.

그림이 포함된 문서를 일반 문서저장 시스템이나 팩스에서와 같이 이진 처리 및 압축을 하게 되면 심각한 정보의 손실이 생긴다. 이를 해결하기 위하여 256 그레이-레벨(Gray-Level) 또는 컬러 화상 자체로 압축해야 하는데 이것은 이진압축과 비교하면 화상에서의 정보의 손실은 적지만 압축의 효율면에서 크게 떨어진다. 반면, 압축률을 높이기 위하여 JPEG(Joint Photographic Coding Experts Group) 방식으로 저장할 때 양자화를 크게 하면 문자 부분에 많은 에러가 발생한다. Binary processing and compression of documents containing pictures, as in normal document storage systems or fax machines, can lead to serious loss of information. In order to solve this problem, compression to 256 gray-level or color images itself is required. This is less loss of information in the image compared to binary compression, but is greatly reduced in terms of compression efficiency. On the other hand, if the quantization is increased when the image is stored in the Joint Photographic Coding Experts Group (JPEG) method to increase the compression rate, many errors occur in the character portion.

따라서, 화상이 포함된 문서영상을 효율적으로 처리하고 압축하기 위해서는 화상 부분은 그레이-레벨(Gray-Level)이나 컬러로 JPEG 방식의 압축을 하고, 문자 부분은 JBIG(Joint Bi-level Image Group) 방식으로 압축해야 한다. 이를 위해서는 문서영상에서 화상영역과 문자영역을 분리하는 방법이 필요하다.Therefore, in order to efficiently process and compress a document image including an image, the image part is compressed in a gray level or color in the JPEG method, and the character part is a JBIG (Joint Bi-level Image Group) method. Should be compressed. To this end, a method of separating the image area and the text area from the document image is required.

보통, 주어진 영상을 분석하여 화상영역과 문자영역으로 분리하는 방법으로는 주파수 분석을 이용한 방법이 주로 사용된다. 이를 위해서, FFT(Fast Fourier Transform)를 사용하거나 혹은 N(가로)*M(세로)개의 화소로 이루어진 국소영역에서 이웃하는 화소(가로 방향 혹은 세로 방향)와의 계조차를 계산하여, 이 계조차값의 분포를 이용하는 방법 등이 주로 사용된다.In general, a method using frequency analysis is mainly used as a method of analyzing a given image and dividing it into an image area and a text area. To do this, use a Fast Fourier Transform (FFT) or calculate a system even with neighboring pixels (horizontal or vertical) in a local region of N (horizontal) * M (vertical) pixels. The method using the distribution of is mainly used.

사진 등과 같이 연속계조를 가지는 화상은 그 특성상 계조가 완만하게 변화하는 저주파 특성을 가지고 있다. 따라서, 이러한 연속계조 영상을 N*M개의 국소영역으로 나누어 이 국소영역을 FFT 변환하면 문자영역에 비해서 자주파의 값이 크게 나타나게 된다. 반대로 문자영역의 경우는 문자 획의 경계 부분에서 계조가 급격하게 변화하기 때문에, FFT 변환시 사진 등의 연속계조 화상영역에 비해서 고주파 부분의 값이 크게 나타난다.An image having continuous gradation, such as a photograph, has a low frequency characteristic in which the gradation gradually changes due to its characteristics. Therefore, when the continuous grayscale image is divided into N * M local regions and FFT transformed, the value of the self-producing wave is larger than that of the character region. On the contrary, in the case of the character area, the gray level changes abruptly at the boundary of the character stroke, so that the value of the high frequency part appears larger than the continuous gray image area such as a photograph during FFT conversion.

그러나, FFT는 계산 특성상 상당히 많은 수학적 연산을 필요로 하기 때문에 실시간으로 화상을 분석하기에는 적절하지 못하다. 따라서, 계조차를 이용하여 주파수 분석을 대신하는 방법이 많이 사용되는데, 이는 해당 국소영역에서 이웃하는 화소와의 계조차를 계산하여, 이 값의 분포(Histogram)에 있어서 0에 가까운 작은 값들이 많다면 저주파가 강한 화상 즉, 사진 등의 연속계조 화상영역으로 판별할 수 있고, 반대로 이웃하는 화소와의 계조차값 분포에 큰 값들이 다수 존재하고 나머지 계조차값이 0인 것이 전체 분포의 대다수를 차지한다면 고주파가 강한 것이므로 문자영역으로 판별한다. However, FFTs are not suitable for analyzing images in real time because they require quite a lot of mathematical operations due to their computational characteristics. Therefore, many methods are used in place of frequency analysis using even the system, which calculates even the system with neighboring pixels in the local area, and there are many small values close to 0 in the histogram of this value. The image can be distinguished by an image having strong surface low frequency, that is, a continuous gradation image region such as a photograph. On the contrary, a large number of large values exist in the distribution of values even with neighboring pixels and a value of 0 even in the rest of the total distribution indicates If it is occupied, the high frequency is strong, so it is determined by the character area.

여기서, 문자영역의 계조차값이 0인 것이 전체 분포의 대다수를 차지하는 이유는, 문자의 배경이 대개의 경우 흰색이거나 흰색이 아니더라도 일정한 밝기를 가지는 경우가 대부분이며, 문자 또한 획의 경계 부분을 제외한 획 내부는 일정한 색 즉, 대부분의 경우 검정색이기 때문이다.In this case, the reason why the value of the text area is 0 is the most part of the entire distribution, because the background of the text is usually white or non-white. This is because the inside of the stroke is a constant color, in most cases black.

최근 인쇄기술의 발전으로 많은 서적, 신문, 잡지 등에서 이진 출력화상이 사용되고 있고 집집마다 보급된 잉크젯 프린터나 레이저 프린터의 출력물 또한 이진 출력화상이다. 이러한 이진 출력화상은 오차 확산법이나 디더 스크린을 사용한 이진화를 통해서 연속계조 영상을 망처리하여 출력하기 때문에 사람의 눈에는 연속계조 화상으로 보이나 실제로는 이진 화상으로 FFT 변환시 연속계조 화상과 달리 고주파 성분이 매우 강하게 나타난다. 따라서, 종래의 방법으로는 문자영역에 포함되어 있는 이진 화상을 분리하는데 용이하지 못하다는 문제점이 있다.With the development of printing technology, binary output images are used in many books, newspapers, magazines, etc., and the outputs of inkjet printers and laser printers spread from house to house are also binary output images. The binary output image is processed by error diffusion or dither screening to process the continuous grayscale image as a network, and therefore, it is seen as a continuous grayscale image to the human eye. Appears strong. Therefore, there is a problem in that the conventional method is not easy to separate the binary image included in the character area.

본 발명은 상기 문제점을 해결하기 위하여 제안된 것으로, 스캔 영상의 배경 밝기를 구하고 상기 스캔 영상을 소정의 크기로 블록화하여 구한 상기 각 블록들의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 이용하여 상기 스캔 영상을 배경영역 또는 화상영역 또는 문자영역으로 분리하기 위한 경계선 분포를 이용한 스캔 영상의 상역 분리 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.The present invention has been proposed in order to solve the above problems, by using the average brightness and brightness distribution of each of the blocks obtained by obtaining the background brightness of the scan image and blocking the scan image to a predetermined size by using the boundary and boundary line dispersion SUMMARY OF THE INVENTION An object of the present invention is to provide a method for separating a scanned image using a boundary distribution for separating the scanned image into a background region, an image region, or a character region, and a computer-readable recording medium having recorded thereon a program for realizing the method. Other objects and advantages of the present invention can be understood by the following description, and will be more clearly understood by the embodiments of the present invention. Also, it will be readily appreciated that the objects and advantages of the present invention may be realized by the means and combinations thereof indicated in the claims.

상기 목적을 달성하기 위한 본 발명의 방법은, 경계선 분포를 이용한 스캔 영상의 상역 분리 방법에 있어서, 화상영역과 문자영역이 포함된 영상을 입력받아 상기 영상의 배경 밝기를 구하는 제 1 단계; 상기 입력받은 영상을 소정의 크기로 블록화하는 제 2 단계; 상기 블록화된 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구하는 제 3 단계; 상기 구한 밝기의 분산, 평균 밝기 및 경계선 분산을 이용하여 각 블록을 배경영역, 화상영역 또는 문자영역으로 분리하는 제 4 단계; 및 상기 분리된 배경영역, 화상영역, 문자영역에 대한 후처리 과정을 수행하여 오류를 보정하는 제 5 단계를 포함하는 것을 특징으로 한다.According to an aspect of the present invention, there is provided a method for separating a scanned image using a boundary line distribution, the method comprising: a first step of receiving an image including an image region and a text region to obtain a background brightness of the image; A second step of blocking the received image into a predetermined size; Obtaining a mean brightness and a dispersion of the brightness and a boundary line and a boundary line dispersion of each blocked block; A fourth step of dividing each block into a background area, an image area, or a text area by using the obtained brightness dispersion, average brightness, and boundary line dispersion; And a fifth step of correcting errors by performing post-processing on the separated background area, image area, and text area.

한편, 본 발명은, 경계선 분포를 이용하여 스캔 영상의 상역을 분리하기 위하여, 프로세서를 구비한 스캔 영상의 상역 분리 장치에, 화상영역과 문자영역이 포함된 영상을 입력받아 상기 영상의 배경 밝기를 구하는 제 1 기능; 상기 입력받은 영상을 소정의 크기로 블록화하는 제 2 기능; 상기 블록화된 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구하는 제 3 기능; 상기 구한 밝기의 분산, 평균 밝기 및 경계선 분산을 이용하여 각 블록을 배경영역, 화상영역 또는 문자영역으로 분리하는 제 4 기능; 및 상기 분리된 배경영역, 화상영역, 문자영역에 대한 후처리 과정을 수행하여 오류를 보정하는 제 5 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.On the other hand, the present invention, in order to separate the upper and lower portions of the scanned image by using a boundary line distribution, to receive the image containing the image region and the character region to the image separation apparatus of the scan image having a processor to receive the background brightness of the image Obtaining a first function; A second function of blocking the input image into a predetermined size; A third function of obtaining an average brightness and a dispersion of brightness and a boundary line and a boundary line dispersion of each blocked block; A fourth function of dividing each block into a background area, an image area, or a text area using the obtained brightness dispersion, average brightness, and boundary line dispersion; And a computer-readable recording medium having recorded thereon a program for realizing a fifth function of correcting errors by performing post-processing on the separated background area, image area, and text area.

상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.The above objects, features and advantages will become more apparent from the following detailed description taken in conjunction with the accompanying drawings, whereby those skilled in the art may easily implement the technical idea of the present invention. There will be. In addition, in describing the present invention, when it is determined that the detailed description of the known technology related to the present invention may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1 은 본 발명에 따른 경계선 분포를 이용한 스캔 영상의 상역 분리 방법에 대한 일실시예 전체 흐름도이다.1 is a flowchart illustrating an embodiment of a phase separation method of a scanned image using a borderline distribution according to the present invention.

먼저, 입력된 전체 영상에 포함된 배경의 밝기(Intensity)를 구하고, 입력된 전체 영상을 16*16 픽셀(Pixel) 크기의 블록으로 나눈다. 그리고, 나누어진 다수 블록들에 대한 경계선과 경계선의 분산, 밝기의 평균과 분산을 구한다. 이후, 이를 이용하여 각 블록들을 배경블록 또는 화상블록 또는 문자블록으로 분류한다. First, the brightness of the background included in the entire input image is obtained, and the entire input image is divided into blocks having a size of 16 * 16 pixels. Then, the boundary and the variance of the divided blocks, the average and the variance of the brightness are obtained. Thereafter, each block is classified into a background block, an image block, or a character block using this.

그리고, 분류 과정에서 포함된 노이즈를 비롯하여 화상, 문자의 일부분이 부분적인 특성에 의해 잘못 분류된 것을 수정한다. 이를 위하여 문맥적 판단 방식을 이용한다. 또한, 문서에 포함되는 대부분의 화상은 직사각형의 형태임을 이용하여 분류된 화상을 직사각형으로 만들어 주어 부분적으로 잘못 분류된 화상을 바로 잡고 화상의 경계가 확실히 화상에 포함되도록 만든다. 이를 위하여 선행적으로 화상에 대해 블랍 컬러링(Blob Coloring)을 수행하여 화상마다 다른 번호를 부여한다. 이 과정으로 인하여 문서에 포함된 화상을 따로 추출할 수도 있다.Then, the noises included in the classification process, as well as the parts of the image and the text are incorrectly classified by the partial characteristics. To do this, we use contextual judgment. In addition, most of the images included in the document are used in the form of rectangles to make the classified images into rectangles, thereby correcting partially misclassified images so that the boundaries of the images are surely included in the images. To this end, blob coloring is performed on an image in advance, and a different number is assigned to each image. Due to this process, the images included in the document can be extracted separately.

여기서, 화상과 문자가 포함되어 있는 영상을 분류하는 방법에 대해 좀 더 상세히 살펴보면, 일반적으로 화상은 연속적인 톤을 가지고 문자는 밝기(Intensity)의 차이가 큰 화이트(White)와 블랙(Black)이 계속 교차한다. 따라서, 화상은 전반적으로 작은 경계선(Edge)을 갖고 문자는 화이트와 블랙이 교차하는 부분에서 큰 경계선을 가지게 된다. Herein, in more detail, a method of classifying an image including images and characters includes images in which white and black have a continuous tone and characters have a large difference in intensity. Keep crossing. Therefore, the image generally has a small edge and the character has a large boundary at the intersection of white and black.

하지만, 단지 블록내 경계선의 총합이나 평균 등으로는 화상 블록과 문자 블록을 확실히 분류하기가 어렵다. 그 이유는 화상 블록은 각 픽셀의 경계선이 작지만 모든 픽셀이 어느 정도 크기의 값을 가지고 있는 반면, 문자 블록은 화이트와 블랙이 교차하는 부분에서의 경계선이 크지만 그 범위가 매우 좁고 나머지 부분은 화이트의 단색이므로 경계선이 0 또는 극히 작은 값을 가져, 단순한 합에서는 분리에 이용할 수 있을 만큼의 뚜렷한 차이를 얻을 수 없기 때문이다.However, it is difficult to reliably classify an image block and a character block only by the sum or average of the boundary lines in the block. The reason is that the image block has a small boundary of each pixel, but all pixels have a value of some size, whereas the character block has a large boundary at the intersection of white and black, but the range is very narrow, and the rest is white. Because the solid color of, the boundary has a value of 0 or extremely small, and a simple sum does not give a clear difference enough to be used for separation.

이러한 화상 블록과 문자 블록에서의 경계선 특성을 잘 반영할 지표로 제시된 것이 바로 경계선의 분산이다. 비슷한 경계선이 계속되는 화상 블록은 분산이 매우 작고, 반대로 경계선이 0에 가까운 부분과 매우 큰 부분이 같이 존재하는 문자 블록의 경우는 분산이 매우 크다. 도 2 에 도시된 바와 같이, 화상의 경계선 분산이 문자의 경계선 분산에 비해 작은 쪽으로 몰려 분포하는 경향을 가진다는 것을 알 수 있다. 따라서, 일정한 기준을 정하여 그보다 큰 값을 가지는 블록은 문자로, 작은 값을 가지는 블록은 화상으로 분류할 수 있다. 이 때, 화상이 문자보다 큰 값을 가져 글자로 잘못 분류되는 경우를 가능한 적게 하기 위해서 기준을 약간 크게 잡아야 한다.It is the dispersion of the boundary line that is suggested as an index that will reflect the boundary line characteristics in the image block and the character block. Dispersion is very small in an image block in which a similar boundary line continues, whereas in the case of a character block in which a boundary line close to zero and a very large portion coexist, dispersion is very large. As shown in Fig. 2, it can be seen that the boundary variance of the image tends to be distributed in a smaller direction than the boundary variance of the character. Accordingly, a block having a larger value than a predetermined value may be classified into a letter, and a block having a small value may be classified into an image. At this time, the criterion should be set slightly larger so that the case where an image has a value larger than a character and is misclassified as a character as little as possible.

하지만, 이러한 방식만으로는 잘못 분류되는 경우가 생긴다. 우선, 화상 블록의 경계선 분산이 큰 경우 글자로 잘못 분류된다. 이는 주로 화상에서 밝은색과 어두운색의 경계를 포함하는 블록이나 화상과 배경의 경계에 속하는 블록에 해당되는데, 이러한 블록은 경계를 나타내는 것이므로 대부분 두께가 1~2블록인 선을 이루어 분포한다. However, this method alone can be misclassified. First, when the boundary distribution of an image block is large, it is incorrectly classified as a letter. This mainly corresponds to a block including light and dark boundaries in the image or a block belonging to the boundary between the image and the background. Since these blocks represent a boundary, they are mostly distributed in a line having a thickness of 1 to 2 blocks.

즉, 화상으로 분류된 블록들 사이에 문자로 분류된 블록이 포함된 형태이다. 하지만, 경계선의 분산으로 분류할 시에 이미 화상이 문자로 분류되는 경우가 적도록 기준값을 높게 잡았으므로 그 수가 많지 않다. 따라서, 후처리 과정인 문맥적 판단(Context-Based Determination)에서 대부분 수정이 가능하다.That is, the blocks classified by the letter are included among the blocks classified into the image. However, since the reference value is set high so that the image is not classified into characters at the time of classifying by variance of the boundary line, the number is not large. Therefore, most modifications can be made in context-based Determination.

문제가 되는 것은 기준보다 작은 경우에 문자가 속하는 것이다. 이는 블록 내에 문자가 일부분만이 포함되는 경우 즉, 문자와 여백 사이, 문자와 문자 사이뿐만 아니라 문자 내의 획과 획 사이에서 생기기도 하고, 문자가 제대로 포함되더라도 블랙의 밝기가 충분히 작지 않은 경우에 발생하기도 한다.The problem is that the characters belong when they are smaller than the standard. This occurs when a block contains only a portion of the character, that is, between the character and the margin, between the character and the character, as well as between the stroke and the stroke within the character, and even if the character is included correctly, the brightness of the black is not small enough. Sometimes.

이를 해결하기 위하여 블록의 경계선 분산을 그 블록의 평균 밝기를 반전시킨 값으로 정규화한 값을 이용한다. 여기서, 정규화는 평균 밝기를 반전시킨 값으로 여러번 나눌수록 화상의 경계선 분산과 문자의 경계선 분산의 차이가 조금씩 뚜렷해지지만 그 차이가 매우 작다. 따라서, 한번의 정규화 과정으로 충분히 정확한 분류가 가능하다. In order to solve this problem, the boundary variance of a block is normalized to a value obtained by inverting the average brightness of the block. Here, the normalization is a value obtained by inverting the average brightness, and as the number of times is divided, the difference between the boundary variance of the image and the boundary variance of the character becomes slightly clear, but the difference is very small. Thus, a single normalization process allows a sufficiently accurate classification.

각 화상 블록과 문자 블록에 대해 경계선의 분산이 작은 경우에 이용되는 경계선의 분산을 평균 밝기를 반전시킨 값으로 정규화한 값을 누적시킨 누적분포는 도 3 에 도시되어 있다. 도 3 에 도시된 바와 같이, 문자 블록의 경계선 분산값이 화상 블록의 값에 비해 매우 큰 것을 알 수 있다. 이러한 특성을 이용하여 경계선의 분산이 작은 블록을 영상과 문자로 쉽게 분류할 수 있다.The cumulative distribution in which the dispersion of the boundary line used when the dispersion of the boundary line is small for each image block and the character block is accumulated is normalized to a value in which the average brightness is inverted. As shown in Fig. 3, it can be seen that the boundary line dispersion value of the character block is very large compared to the value of the image block. By using these characteristics, blocks with small dispersion of boundaries can be easily classified into images and texts.

여기서, 블록의 평균 밝기를 반전시킨 값은 문서의 256 그레이-레벨(Gray-Level) 영상을 예로 들었을 때, 255에서 평균 밝기를 뺀 값을 의미한다.Here, the value in which the average brightness of the block is inverted means 255 minus the average brightness when a 256 gray-level image of the document is taken as an example.

다음으로, 화상과 문자가 포함되어 있는 영상에서 배경을 분류하는 방법에 대해 살펴보겠다.Next, we will look at how to classify a background in an image that includes images and text.

문서의 배경은 일반적으로 화이트에 가까운 단색으로 이루어져 있다. 따라서, 이를 경계선만을 고려하여 분류하면 경계선의 분산값이 매우 작으므로 화상으로 분류된다. 그러나, 배경은 전체문서의 상당한 영역을 차지하고 있으므로 문자와 같이 이진 압축되거나 따로 분리되어야 압축의 효율이 커지므로 배경을 따로 분류해야 한다.The background of the document is usually a solid color close to white. Therefore, if the classification is made in consideration of only the boundary line, it is classified as an image because the dispersion value of the boundary line is very small. However, since the background occupies a considerable area of the entire document, it is necessary to classify the background separately because the compression efficiency increases when the binary compression or separation is performed like the character.

이를 위하여, 배경은 흰색에 가깝다는 점과 단색으로 이루어져 있다는 점을 이용하여 문서영상에 대해 밝기가 큰(256 그레이-레벨을 예로 들었을 때 206이상) 픽셀에 대해 밝기에 따른 히스토그램을 그리고 그 중 최빈값을 주어진 문서영상의 배경 밝기로 정한다. 그리고, 분류 과정에서 경계선에 따른 분류를 하기 이전에 블록내의 밝기의 분산이 충분히 작고 밝기의 평균이 미리 구해둔 배경의 밝기와 가깝거나 더 밝으면 이를 배경으로 분류한다.To do this, a histogram according to brightness is used for pixels with large brightness (more than 206 in the case of 256 gray-levels) for the document image, taking advantage of the fact that the background is close to white and monochromatic. Is set to the background brightness of a given document image. In the classification process, if the dispersion of the brightness in the block is small enough and the average of the brightness is close to or brighter than the previously obtained background, it is classified as the background before the classification according to the boundary line.

도 4 는 본 발명에 따른 입력 영상의 상역 분리 과정에 대한 일실시예 흐름도이다.4 is a flowchart illustrating a phase separation process of an input image according to the present invention.

도 4 에 도시된 바와 같이, 영상이 입력되면 입력된 전체 영상에 포함된 배경의 밝기(Intensity)를 구하고, 입력된 전체 영상을 16*16 픽셀(Pixel) 크기의 블록으로 나눈다. 그리고, 나누어진 다수 블록들에 대한 경계선과 경계선의 분산, 밝기의 평균과 분산을 구한다. 이후, 이를 이용하여 각 블록들을 배경블록 또는 화상블록 또는 문자블록으로 분류한다. As shown in FIG. 4, when the image is input, the brightness of the background included in the entire input image is obtained, and the entire input image is divided into blocks having a size of 16 * 16 pixels. Then, the boundary and the variance of the divided blocks, the average and the variance of the brightness are obtained. Thereafter, each block is classified into a background block, an image block, or a character block using this.

도 5 는 본 발명에 따른 배경의 밝기를 구하는 과정에 대한 일실시예 흐름도이다.5 is a flowchart illustrating a process of obtaining a brightness of a background according to the present invention.

도 5 에 도시된 바와 같이, 256 그레이-레벨(Gray-Level)로 된 문서 영상을 입력으로 받아 전체 영상의 픽셀중 205보다 큰 밝기를 가지는 픽셀들만을 대상으로 밝기에 관한 히스토그램(Histogram)을 그린다. 그리고, 완성된 히스토그램으로부터 가장 많이 나타나는 밝기(최빈값)를 찾아 이를 배경의 밝기로 정한다.As shown in FIG. 5, a histogram of brightness is drawn for only pixels having a brightness greater than 205 among the pixels of the entire image by receiving a document image having 256 gray-levels as an input. . Then, find the brightness (mode) that appears the most from the completed histogram and set it as the brightness of the background.

도 6 은 본 발명에 따른 경계선의 분산을 구하는 과정에 대한 일실시예 흐름도이다.6 is a flowchart illustrating an embodiment of a process for obtaining a variance of a boundary line according to the present invention.

도 6 에 도시된 바와 같이, 16*16 픽셀 크기의 블록을 입력으로 받아 경계선 분산을 구하는데 이용되는 경계선을 먼저 구한 후, 경계선의 분산을 구한다. 그리고, 이 과정에서 부가적으로 밝기의 평균과 분산도 구한다. 반면, 블록의 모든 픽셀의 밝기는 이미 가지고 있는 값으로 따로 구하지 않는다. 여기서, 경계선의 분산을 구하는 방법으로는 가장 널리 사용되는 방식인 소벨 오퍼레이터(Sobel Operator)를 이용한다.As shown in FIG. 6, the boundary line used to obtain the boundary line variance is first obtained by receiving a 16 * 16 pixel block as an input, and then the dispersion of the boundary line is obtained. In this process, the average and variance of brightness are additionally calculated. On the other hand, the brightness of all the pixels in the block is not obtained separately. Here, the Sobel Operator, which is the most widely used method, is used to calculate the variance of the boundary line.

이를 좀 더 상세히 살펴보면, 하나의 픽셀에 대응하는 경계선은 가로방향과 세로방향의 두가지인데 글자의 획은 가로 방향일 수도, 세로 방향일 수도 또는 대각선 방향일 수도 있기 때문에 이 세 방향을 모두 커버할 수 있도록 가로방향 경계선과 세로방향 경계선을 모두 구한다. 따라서, 한 블록 내에서 구할 수 있는 경계선은 모두 16*16*2 = 512개이며, 이로부터 경계선의 분산을 구한다. Looking more closely at this, there are two boundary lines corresponding to one pixel, horizontal and vertical, and since the stroke of the letter may be horizontal, vertical, or diagonal, it may cover all three directions. Find both the horizontal and vertical boundaries. Therefore, the boundary lines that can be obtained in one block are all 16 * 16 * 2 = 512, and the variance of the boundary lines is obtained from this.

여기서, 좌표(x, y)에서의 경계선(edge)은 하기의 [수학식 1]과 같이 정의한다. 단 는 픽셀(x, y)의 밝기이다.Here, the edge at the coordinates (x, y) is defined as shown in Equation 1 below. only Is the brightness of pixels (x, y).

또한, 경계선의 분산은 하기의 [수학식 2]와 같이 정의한다. 여기서, 블록이 시작되는 픽셀을 좌표 (0, 0)이라 할때 i열 j행에 위치한 블록이라면 전체 영상에서 그 블록이 시작되는 픽셀은 (j*16, i*16)이 된다.In addition, the dispersion of the boundary line is defined as in Equation 2 below. Here, if the pixel at which the block starts is a coordinate (0, 0), and the block is located at row j of column i, the pixel at which the block starts in the entire image becomes (j * 16, i * 16).

또한, 블록의 평균 밝기와 블록의 분산은 하기의 [수학식 3]과 같이 정의한다.In addition, the average brightness of the block and the dispersion of the block are defined as shown in Equation 3 below.

도 7 은 본 발명에 따른 경계선 분포를 이용한 스캔 화상의 상역 분리 방법에 대한 일실시예 상세 흐름도이다.7 is a detailed flowchart illustrating a phase separation method of a scanned image using a borderline distribution according to the present invention.

먼저, 화상영역과 문자영역이 포함된 영상이 입력되면(701) 전체 영상의 배경 밝기를 구한다(702). 이후, 전체 영상을 16*16 픽셀 크기의 블록으로 나눈다(703). 그리고, 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구한다(704).First, when an image including an image area and a text area is input (701), the background brightness of the entire image is obtained (702). Thereafter, the entire image is divided into blocks having a size of 16 * 16 pixels (703). Then, the average brightness and the dispersion of the brightness and the boundary line and boundary line dispersion of each block are obtained (704).

이후, 전체 영상의 배경 밝기와 각 블록의 평균 밝기와 밝기의 분산 및 경계선 분산을 이용하여 다음과 같은 분류 과정을 진행한다.Subsequently, the following classification process is performed using the background brightness of the entire image, the average brightness of each block, the dispersion of the brightness, and the boundary distribution.

먼저, 경계선 분산에 의한 분류를 하기 이전에 블록내의 밝기의 분산이 충분히 작고 즉, 소정의 임계치보다 작고 블록의 밝기의 평균이 배경의 밝기보다 더 밝거나 비슷하면(705, 706) 이를 배경영역으로 분류한다(707). 반면, 블록내의 밝기의 분산이 소정의 임계치보다 작고 블록의 평균 밝기가 배경의 밝기보다 밝지 않으면(705, 706) 이를 화상영역으로 분류한다(710). First, before the classification by boundary variance, the variance of the brightness in the block is sufficiently small, i.e., less than the predetermined threshold and the average of the brightness of the block is brighter or similar to the brightness of the background (705, 706). Classify (707). On the other hand, if the distribution of brightness in the block is smaller than the predetermined threshold and the average brightness of the block is not brighter than the brightness of the background (705, 706), it is classified as an image area (710).

한편, 블록내의 밝기의 분산이 소정의 임계치보다 크고(705) 경계선의 분산이 소정의 임계치보다 크면(708) 이를 문자영역으로 분류한다(711). 반면, 블록내의 밝기의 분산이 소정의 임계치보다 크고(705) 경계선의 분산이 소정의 임계치보다 크지 않으면(708) 화상영역내에 문자영역이 포함되어 있는 경우이므로 블록의 분산을 그 블록의 평균 밝기를 반전시킨 값으로 정규화한 값을 이용한다.On the other hand, if the variance of the brightness in the block is greater than the predetermined threshold (705) and the variance of the boundary is greater than the predetermined threshold (708), it is classified as a character area (711). On the other hand, if the variance of the brightness in the block is greater than the predetermined threshold (705) and the variance of the boundary is not greater than the predetermined threshold (708), then the character area is included in the image area. Use the normalized value as the inverted value.

즉, 정규화된 값이 소정의 임계치보다 큰가를 비교하여(709) 크면 문자영역으로 분류하고(711) 크지 않으면 화상영역으로 분류한다(710).In other words, if the normalized value is greater than a predetermined threshold, the comparison is made (709), and if it is large, it is classified as a character area (711). If not, it is classified as an image area (710).

상기와 같은 과정을 통하여 화상과 문자가 포함된 영상을 쉽게 배경영역, 화상영역, 문자영역으로 분리할 수 있다.Through the above process, an image including an image and a text can be easily divided into a background area, an image area, and a text area.

다음으로, 후처리 과정인 문맥적 판단, 블랍 컬러링, 그림의 사각화 과정에 대해 좀 더 살펴보겠다.Next, we will look into the post-processing process of contextual judgment, blob coloring, and squareting of pictures.

영상의 분류 단계에서 분류된 블록들은 어느 정도의 오류를 포함하는데, 이는 주로 배경이나 문자 부분에 섞인 노이즈로 인한 경우, 굵은 문자의 일부분이 화상으로 분류된 경우, 화상중 밝은색과 어두운색의 경계부가 문자로 분류되는 경우 등이 대부분이다. 이러한 블록들은 대체로 혼자 떨어져 점점이 존재하거나 선을 이루어 존재하는 것이 보통이다. 따라서, 이를 바로잡기 위해서 주변 블록이 무엇으로 분류되었는지 참고하여 자신을 다시 분류하는 문맥적 판단 방법(Context-based Determinition)을 이용한다. 여기서, 오류를 포함하는 블록들이 선으로 존재하는 경우가 있으므로 가로 방향과 세로 방향의 블록들을 동시에 참고하는 것보다 각 방향에 대해 각각 시행해야 한다.Blocks classified in the classification stage of the image contain some error, mainly due to noise mixed in the background or text part, and when a part of the bold text is classified as the image, the boundary between light and dark in the image Are mostly classified as letters. These blocks are usually separated by oneself and exist in a line or line. Therefore, in order to correct this, a context-based determinition method of reclassifying itself by referring to what is classified as a neighboring block is used. In this case, since blocks containing errors may exist as lines, each block should be implemented in each direction rather than referring to the blocks in the horizontal direction and the vertical direction at the same time.

이를 좀 더 상세히 살펴보면, 상역 분리가 완료된 영상에서 배경블록과 문자블록은 0, 화상블록은 1 로 표시되어 있다. 이 때, i열 j행에 위치한 블록의 종류를 =0, 1 이라고 할 때 가로 방향의 문맥적 판단은 하기의 [수학식 4]와 같다.Looking at this in more detail, the background block and the character block is represented by 0 and the image block is represented by 1 in the image of which phase separation has been completed. At this time, the type of the block located in row j of column i When = 0 and 1, the contextual judgment in the horizontal direction is given by Equation 4 below.

또한, 세로 방향의 문맥적 판단은 하기의 [수학식 5]와 같다.In addition, the contextual judgment in the vertical direction is as shown in Equation 5 below.

한편, 상기와 같은 문맥적 판단 과정을 거친 영상은 블랍 컬러링에 의해 각각의 연속적인 번호가 부여된다. 그러면, 그림의 사각화 과정에서 블랍 컬러링에 의해 부여된 연속적인 번호를 이용하여 그림 모양을 직사각형 모양으로 맞춰준다.On the other hand, the image which has undergone the above contextual determination process is assigned each consecutive number by blob coloring. Then, the shape of the picture is made into a rectangular shape by using the consecutive numbers given by the blob coloring during the squareization of the picture.

블랍 컬러링에 의해 배경영역 및 문자영역은 0으로 표시되고 그림에는 1,2,3...의 번호가 부여된 상태이다. 미리 각 화상의 상하좌우의 좌표를 저장할 공간을 만들고 번호가 부여된 블록들을 하나하나 확인하여 화상을 만날 때마다 그 번호에 해당하는 좌표를 계속 갱신하면 그 화상의 상하좌우의 마지막에 해당하는 좌표를 쉽게 알 수 있다. 이렇게 구한 좌표로 구성되는 직사각형의 내부의 블록에 모두 같은 번호를 할당하면 화상을 직사각형으로 바꾸는 작업이 끝난다. 이 작업을 통해 화상내에 여전히 존재할 수 있었던 잘못 분류된 문자블록(실제로 문자일 수도 있다. 다만 화상을 배경으로 하는 문자라면 화상으로 분류되는 것이 옳을 것이다.)을 제거하고 화상의 경계부가 확실히 화상에 포함되도록 할 수 있다. 이 때, 배경, 문자의 일부가 256 그레이-레벨(Gray-Level)로 압축되는 것은 정보 손실의 측면에서 문제될 것이 없지만, 화상이 이진압축되는 것은 심각한 문제이다. 따라서, 직사각형을 맞추면서 화상이 약간 더 넓어지는 것은 큰 문제는 아니다.The background area and the text area are displayed as 0 by the blob coloring and the numbers 1, 2, 3 ... are assigned to the picture. Create a space to store the coordinates of the top, bottom, left, and right of each image in advance, and check the numbered blocks one by one, and continuously update the coordinates corresponding to the number each time the image is encountered. It is easy to see. When all the same numbers are assigned to the blocks inside the rectangle composed of the coordinates thus obtained, the work of converting the image into the rectangle is completed. This operation removes the misclassified character blocks that might still exist in the image (actually they may be characters, but if they are characters in the background, it would be right to classify them as images) and ensure that the boundaries of the image are included in the image. You can do that. At this time, it is not a problem in terms of information loss that the background and some of the characters are compressed to 256 gray-levels, but binary compression of the images is a serious problem. Therefore, it is not a big problem that the image is slightly wider while fitting the rectangle.

또한, 부가적으로 작은 화상은 오류로 보고 배경, 문자로 다시 분류할 수 있다. 이는 앞에서 구한 화상의 좌표를 이용하면 화상의 면적을 쉽게 구할 수 있고, 이를 전체 문서영상의 면적과 비교함으로써 가능하다. 본 발명에서는 일실시예로 화상의 면적이 전체 면적의 1/700 보다 작으면 화상을 삭제하도록 하였다. 물론 화상은 삭제되더라도 번호는 계속 연속적으로 유지된다.Additionally, small images can be viewed as errors and reclassified as background, text. This can be easily obtained by using the coordinates of the image obtained above, and comparing this with the area of the entire document image. In one embodiment of the present invention, the image is deleted if the area of the image is smaller than 1/700 of the total area. Of course, even if an image is deleted, the number is kept continuously.

도 8 은 본 발명을 수행한 후에 후처리 과정을 수행한 결과를 나타내는 일예시도이다. 8 is an exemplary view showing a result of performing a post-treatment process after performing the present invention.

원래의 문서영상(81)을 상역 분리한 후, 후처리 과정인 문맥적 판단 과정을 거친 결과(82)를 최종적으로 사각화하여 얻은 결과(83)를 나타낸다.After the original document image 81 is separated and separated, the result 83 obtained by finally quadrangling the result 82 through the contextual judgment process, which is a post-processing process, is shown.

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.As described above, the method of the present invention may be implemented as a program and stored in a recording medium (CD-ROM, RAM, ROM, floppy disk, hard disk, magneto-optical disk, etc.) in a computer-readable form. Since this process can be easily implemented by those skilled in the art will not be described in more detail.

이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.The present invention described above is capable of various substitutions, modifications, and changes without departing from the technical spirit of the present invention for those skilled in the art to which the present invention pertains. It is not limited by the drawings.

상기와 같은 본 발명은, 전자 입력 화상뿐만 아니라, 다양한 해상도를 지원하는 복합기나 복사기 및 스캐너 등에 적용되어 스캐닝된 화상에 대해서도 전자화상과 동일하게 처리할 수 있는 효과가 있다.As described above, the present invention has the effect of being processed in the same way as the electronic image not only for the electronic input image but also for the scanned image applied to a multifunction apparatus, a copier, a scanner, and the like that support various resolutions.

또한, 본 발명은, 다양한 해상도를 지원하는 복합기나 복사기 및 스캐너 등에 적용되어 화상영역들 중에서 특정 화상영역을 독취할 수 있게 할뿐만 아니라, 분리된 영역의 특성에 맞는 알고리즘을 적용하여 화상의 품질을 높이고 처리속도를 단축시킬 수 있는 효과가 있다.In addition, the present invention is applied to a multifunction device, a copier, a scanner, and the like, which supports various resolutions, to not only read a specific image area among image areas, but also to apply an algorithm suitable for the characteristics of the separated area to improve image quality. There is an effect that can increase the processing speed.

또한, 본 발명은, 연산 능력이 떨어지는 임베디드 시스템에 적용되어 가능한 빠른 시간에 간단한 연산으로 상역을 분리하여 임베디드 시스템의 성능을 향상시킬 수 있는 효과가 있다. In addition, the present invention has an effect that can be applied to an embedded system with low computational capability to improve the performance of the embedded system by separating the station by simple operation as soon as possible.

도 1 은 본 발명에 따른 경계선 분포를 이용한 스캔 영상의 상역 분리 방법에 대한 일실시예 전체 흐름도,1 is a flowchart illustrating an embodiment of a phase separation method of a scanned image using a borderline distribution according to the present invention;

도 2 는 본 발명에 따른 화상과 문자에 대한 경계선 분산의 누적분포그래,2 is a cumulative distribution graph of boundary variances for images and characters according to the present invention;

도 3 은 본 발명에 따른 화상과 문자에 대한 경계선의 분산을 평균 밝기를 반전시킨 값으로 정규화한 값의 누적분포그래프,3 is a cumulative distribution graph of values obtained by normalizing the variance of the boundary lines for images and characters according to the present invention with a value inverting the average brightness;

도 4 는 본 발명에 따른 입력 영상의 상역 분리 과정에 대한 일실시예 흐름도,4 is a flow chart of an embodiment of a phase separation process of an input image according to the present invention;

도 5 는 본 발명에 따른 배경의 밝기를 구하는 과정에 대한 일실시예 흐름도,5 is a flowchart illustrating a process of obtaining a brightness of a background according to the present invention;

도 6 은 본 발명에 따른 경계선의 분산을 구하는 과정에 대한 일실시예 흐름도,6 is a flow chart of an embodiment of a process for obtaining a variance of a boundary line according to the present invention;

도 7 은 본 발명에 따른 경계선 분포를 이용한 스캔 화상의 상역 분리 방법에 대한 일실시예 상세 흐름도,7 is a detailed flowchart illustrating a phase separation method of a scanned image using a borderline distribution according to the present invention;

도 8 은 본 발명을 수행한 후에 후처리 과정을 수행한 결과를 나타내는 일예시도이다.8 is an exemplary view showing a result of performing a post-treatment process after performing the present invention.

* 도면의 주요 부분에 대한 부호의 설명* Explanation of symbols for the main parts of the drawings

21 : 화상에 대한 경계선 분산의 누적분포그래프21: Cumulative distribution graph of boundary variances for an image

22 : 문자에 대한 경계선 분산의 누적분포그래프22: cumulative distribution graph of boundary variances for characters

31 : 화상에 대한 경계선 분산을 정규화시킨 누적분포그래프31: Cumulative distribution graph normalizing boundary variance for an image

32 : 문자에 대한 경계선 분산을 정규화시킨 누적분포그래프32: Cumulative distribution graph normalizing the boundary variance for characters

Claims (4)

경계선 분포를 이용한 스캔 영상의 상역 분리 방법에 있어서,In the phase separation method of the scanned image using the boundary distribution, 화상영역과 문자영역이 포함된 영상을 입력받아 상기 영상의 배경 밝기를 구하는 제 1 단계;A first step of receiving an image including an image area and a text area to obtain a background brightness of the image; 상기 입력받은 영상을 소정의 크기로 블록화하는 제 2 단계;A second step of blocking the received image into a predetermined size; 상기 블록화된 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구하는 제 3 단계;Obtaining a mean brightness and a dispersion of the brightness and a boundary line and a boundary line dispersion of each blocked block; 상기 구한 밝기의 분산, 평균 밝기 및 경계선 분산을 이용하여 각 블록을 배경영역, 화상영역 또는 문자영역으로 분리하는 제 4 단계; 및A fourth step of dividing each block into a background area, an image area, or a text area by using the obtained brightness dispersion, average brightness, and boundary line dispersion; And 상기 분리된 배경영역, 화상영역, 문자영역에 대한 후처리 과정을 수행하여 오류를 보정하는 제 5 단계A fifth step of correcting an error by performing a post-processing process on the separated background area, image area, and text area 를 포함하는 경계선 분포를 이용한 스캔 영상의 상역 분리 방법.Phase separation method of the scanned image using a boundary distribution including a. 제 1 항에 있어서,The method of claim 1, 상기 제 4 단계는,The fourth step, 상기 제 3 단계에서 구한 블록의 밝기 분산이 제 1 임계치보다 작고, 상기 블록의 평균 밝기가 배경의 밝기에서 소정의 값을 뺀 값보다 클 경우, 상기 블록을 배경영역으로 판별하는 제 6 단계;A sixth step of determining the block as the background area when the brightness variance of the block obtained in the third step is smaller than the first threshold and the average brightness of the block is greater than a value obtained by subtracting a predetermined value from the brightness of the background; 상기 제 3 단계에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작고, 상기 블록의 평균 밝기가 배경의 밝기에서 소정의 값을 뺀 값보다 크지 않을 경우, 상기 블록을 화상영역으로 판별하는 제 7 단계;A seventh step of determining the block as an image area when the brightness variance of the block obtained in the third step is smaller than the first threshold and the average brightness of the block is not greater than a value obtained by subtracting a predetermined value from the brightness of the background. ; 상기 제 3 단계에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 제 2 임계치보다 큰 경우, 상기 블록을 문자영역으로 판별하는 제 8 단계;An eighth step of determining the block as a character area when the brightness variance of the block obtained in the third step is not smaller than the first threshold and the boundary variance of the block is larger than the second threshold; 상기 제 3 단계에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 상기 제 2 임계치보다 크지 않으면서, 상기 블록의 경계선 분산을 상기 블록의 평균밝기를 반전시킨 값으로 정규화한 값이 제 3 임계치보다 크지 않을 경우, 상기 블록을 화상영역으로 판별하는 제 9 단계; 및The boundary variance of the block is inverted to the average brightness of the block without the brightness variance of the block obtained in the third step being less than the first threshold and the boundary variance of the block not greater than the second threshold. A ninth step of discriminating the block as an image area when the normalized value is not larger than a third threshold; And 상기 제 3 단계에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 상기 제 2 임계치보다 크지 않으면서, 상기 블록의 경계선 분산을 상기 블록의 평균밝기를 반전시킨 값으로 정규화한 값이 상기 제 3 임계치보다 클 경우, 상기 블록을 문자영역으로 판별하는 제 10 단계The boundary variance of the block is inverted to the average brightness of the block without the brightness variance of the block obtained in the third step being less than the first threshold and the boundary variance of the block not greater than the second threshold. A tenth step of determining the block as a character area when the normalized value is larger than the third threshold 를 포함하는 경계선 분포를 이용한 스캔 영상의 상역 분리 방법.Phase separation method of the scanned image using a boundary distribution including a. 경계선 분포를 이용하여 스캔 영상의 상역을 분리하기 위하여, 프로세서를 구비한 스캔 영상의 상역 분리 장치에,In order to separate the upper and lower portions of the scanned image by using the boundary distribution, in the reverse separation apparatus of the scanned image having a processor, 화상영역과 문자영역이 포함된 영상을 입력받아 상기 영상의 배경 밝기를 구하는 제 1 기능;A first function of receiving an image including an image area and a text area to obtain a background brightness of the image; 상기 입력받은 영상을 소정의 크기로 블록화하는 제 2 기능;A second function of blocking the input image into a predetermined size; 상기 블록화된 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구하는 제 3 기능;A third function of obtaining an average brightness and a dispersion of brightness and a boundary line and a boundary line dispersion of each blocked block; 상기 구한 밝기의 분산, 평균 밝기 및 경계선 분산을 이용하여 각 블록을 배경영역, 화상영역 또는 문자영역으로 분리하는 제 4 기능; 및A fourth function of dividing each block into a background area, an image area, or a text area using the obtained brightness dispersion, average brightness, and boundary line dispersion; And 상기 분리된 배경영역, 화상영역, 문자영역에 대한 후처리 과정을 수행하여 오류를 보정하는 제 5 기능A fifth function of correcting errors by performing post-processing on the separated background area, image area, and text area 을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium having recorded thereon a program for realizing this. 제 3 항에 있어서,The method of claim 3, wherein 상기 제 4 기능은, The fourth function is, 상기 제 3 기능에서 구한 블록의 밝기 분산이 제 1 임계치보다 작고, 상기 블록의 평균 밝기가 배경의 밝기에서 소정의 값을 뺀 값보다 클 경우, 상기 블록을 배경영역으로 판별하는 제 6 기능;A sixth function of discriminating the block as a background area when the brightness variance of the block obtained by the third function is smaller than a first threshold and the average brightness of the block is greater than a value obtained by subtracting a predetermined value from the brightness of the background; 상기 제 3 기능에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작고, 상기 블록의 평균 밝기가 배경의 밝기에서 소정의 값을 뺀 값보다 크지 않을 경우, 상기 블록을 화상영역으로 판별하는 제 7 기능;A seventh function of discriminating the block as an image area when the brightness distribution of the block obtained by the third function is smaller than the first threshold and the average brightness of the block is not greater than a value obtained by subtracting a predetermined value from the brightness of the background; ; 상기 제 3 기능에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 제 2 임계치보다 큰 경우, 상기 블록을 문자영역으로 판별하는 제 8 기능;An eighth function of discriminating the block as a text area when the brightness variance of the block obtained by the third function is not smaller than the first threshold and the boundary variance of the block is larger than a second threshold; 상기 제 3 기능에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 상기 제 2 임계치보다 크지 않으면서, 상기 블록의 경계선 분산을 상기 블록의 평균밝기를 반전시킨 값으로 정규화한 값이 제 3 임계치보다 크지 않을 경우, 상기 블록을 화상영역으로 판별하는 제 9 기능; 및The brightness distribution of the block obtained by the third function is not smaller than the first threshold, and the boundary distribution of the block is not greater than the second threshold, and the boundary distribution of the block is a value inverted the average brightness of the block. A ninth function of discriminating the block as an image area when the normalized value is not larger than a third threshold; And 상기 제 3 기능에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 상기 제 2 임계치보다 크지 않으면서, 상기 블록의 경계선 분산을 상기 블록의 평균밝기를 반전시킨 값으로 정규화한 값이 상기 제 3 임계치보다 클 경우, 상기 블록을 문자영역으로 판별하는 제 10 기능The brightness distribution of the block obtained by the third function is not smaller than the first threshold, and the boundary distribution of the block is not greater than the second threshold, and the boundary distribution of the block is a value inverted the average brightness of the block. A tenth function of discriminating the block as a text area when a normalized value is larger than the third threshold 을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium having recorded thereon a program for realizing this.
KR10-2003-0026046A 2003-04-24 2003-04-24 Method for the Separation of text and Image in Scanned Documents using the Distribution of Edges KR100537827B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2003-0026046A KR100537827B1 (en) 2003-04-24 2003-04-24 Method for the Separation of text and Image in Scanned Documents using the Distribution of Edges

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2003-0026046A KR100537827B1 (en) 2003-04-24 2003-04-24 Method for the Separation of text and Image in Scanned Documents using the Distribution of Edges

Publications (2)

Publication Number Publication Date
KR20040092564A KR20040092564A (en) 2004-11-04
KR100537827B1 true KR100537827B1 (en) 2005-12-19

Family

ID=37372930

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-0026046A KR100537827B1 (en) 2003-04-24 2003-04-24 Method for the Separation of text and Image in Scanned Documents using the Distribution of Edges

Country Status (1)

Country Link
KR (1) KR100537827B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100895622B1 (en) 2007-05-14 2009-05-06 주식회사신도리코 Image forming apparatus and image forming method

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100648350B1 (en) * 2004-11-15 2006-11-23 엘지전자 주식회사 Apparatus reversing character image and character image reversing method
KR101215987B1 (en) 2008-12-22 2012-12-28 한국전자통신연구원 Apparatus for separating foreground from back ground and method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100895622B1 (en) 2007-05-14 2009-05-06 주식회사신도리코 Image forming apparatus and image forming method

Also Published As

Publication number Publication date
KR20040092564A (en) 2004-11-04

Similar Documents

Publication Publication Date Title
US6393150B1 (en) Region-based image binarization system
US7894683B2 (en) Reformatting binary image data to generate smaller compressed image data size
JP4423298B2 (en) Text-like edge enhancement in digital images
US7292375B2 (en) Method and apparatus for color image processing, and a computer product
EP1173003B1 (en) Image processing method and image processing apparatus
US7899248B2 (en) Fast segmentation of images
US6766053B2 (en) Method and apparatus for classifying images and/or image regions based on texture information
US20040096102A1 (en) Methodology for scanned color document segmentation
US20120120453A1 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
US7437002B2 (en) Image recognition system utilizing an edge image and a binary image
JP6743092B2 (en) Image processing apparatus, image processing control method, and program
JP4093413B2 (en) Image processing apparatus, image processing program, and recording medium recording the program
US7724981B2 (en) Adaptive contrast control systems and methods
EP2184712A2 (en) Noise reduction for digital images
US9167129B1 (en) Method and apparatus for segmenting image into halftone and non-halftone regions
KR100537827B1 (en) Method for the Separation of text and Image in Scanned Documents using the Distribution of Edges
JP2005275854A (en) Image processor, image processing method, image processing program and recording medium with this program stored thereon
JPH0879517A (en) Method for identifying type of image
EP0870276B1 (en) A method for transforming a gray-level image into a black-and-white image
US11800036B2 (en) Determining minimum scanning resolution
US10931852B2 (en) Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region
KR100537829B1 (en) Method for segmenting Scan Image
US20050265600A1 (en) Systems and methods for adjusting pixel classification using background detection
JP2004048130A (en) Image processing method, image processing apparatus, and image processing program
JP2004228745A (en) Image processing apparatus

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111213

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20121213

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee