KR19990005294A - Input Image Binarization Method of Pattern Recognition System - Google Patents
Input Image Binarization Method of Pattern Recognition System Download PDFInfo
- Publication number
- KR19990005294A KR19990005294A KR1019970029489A KR19970029489A KR19990005294A KR 19990005294 A KR19990005294 A KR 19990005294A KR 1019970029489 A KR1019970029489 A KR 1019970029489A KR 19970029489 A KR19970029489 A KR 19970029489A KR 19990005294 A KR19990005294 A KR 19990005294A
- Authority
- KR
- South Korea
- Prior art keywords
- threshold
- value
- threshold value
- input image
- local
- Prior art date
Links
Abstract
본 발명은 패턴 인식 시스템에서 사용하는 입력 영상에 대한 이진화 방법에 관한 것으로, 본 발명의 방법은 상기 입력 영상의 화소 값 분포를 이용하여 전역적 임계값을 구하고, 상기 입력 영상을 3*3 마스크를 이용하여 지엽적 임계값을 구하고, 상기 전역적 임계값과 상기 지엽적 임계값을 비교하여 상기 전역적 임계값이 상기 지엽적 임계값보다 크면 상기 전역적 임계값을 최종 임계값으로서 선택하고, 상기 전역적 임계값이 상기 지엽적 임계값보다 작거나 같으면 상기 지엽적 임계값을 최종 임계값으로서 선택하며, 상기 중심 화소의 화소 값과 상기 최종 임계값의 비교에 따라 상기 중심 화소값을 이진수의 한 값으로 설정하는 단계를 포함한다. 따라서, 전역적인 임계값 결정과 지엽적 임계값 결정을 적응적으로 채택함으로써 패턴 인식에 필요한 보다 정확한 이진화 영상을 제공할 수 있다.The present invention relates to a binarization method for an input image used in a pattern recognition system. The method of the present invention obtains a global threshold value using a distribution of pixel values of the input image, and extracts a 3 * 3 mask from the input image. Calculates a local threshold value, compares the global threshold value with the local threshold value, and selects the global threshold value as the final threshold value if the global threshold value is greater than the local threshold value value; If the value is less than or equal to the local threshold, selecting the local threshold as a final threshold, and setting the central pixel value to one of binary values according to a comparison of the pixel value of the central pixel and the final threshold value. It includes. Therefore, by adopting global threshold determination and local threshold determination adaptively, it is possible to provide a more accurate binarized image required for pattern recognition.
Description
본 발명은 패턴 인식 시스템에서 입력 영상에 대한 패턴 인식을 위하여 영상을 이진화하는 방법에 관한 것으로, 보다 상세하게는 패턴 인식 시스템에서 전역적 임계값과 지엽적 임계값을 적응적으로 이용한 입력 영상 이진화 방법에 관한 것이다.The present invention relates to a method for binarizing an image for pattern recognition of an input image in a pattern recognition system. More particularly, the present invention relates to an input image binarization method using an adaptive global threshold and a local threshold in a pattern recognition system. It is about.
영상 처리와 컴퓨터 비젼 분야에서 컴퓨터를 이용한 물체의 자동 패턴 인식 기법은 중요한 문제중의 하나이다. 패턴 인식은 입력 영상에 존재하는 패턴들에 대한 특징들과 미리 저장된 패턴인 모델에 대한 특징들의 비교를 통하여 이루어진다. 패턴 인식을 위해서는 입력 영상을 디지탈화한 이진 영상 신호로 변환하는 과정이 필요하다. 이러한 이진화 변환은 크게 전역적인 임계값(global threshold)를 사용하는 방법과 지엽적인 임계값(local threshold)를 이용하는 방법으로 구분된다.In the field of image processing and computer vision, computer-based automatic pattern recognition is one of the important problems. Pattern recognition is performed by comparing features of patterns present in the input image with features of a model, which is a pre-stored pattern. For pattern recognition, a process of converting an input image into a digitalized binary image signal is required. These binarization transformations are largely divided into a method using a global threshold and a method using a local threshold.
전역적인 임계값 결정 방법은 입력 영상의 계조도 별 화소수의 분포를 이용하여 256 계조도를 두개의 부분으로 나눌때 두 부분의 분산(variance)을 가장 작게하는 임의의 임계값을 계산하고, 이 계산된 임계값에 따라 입력 영상의 화소를 0 또는 1의 값으로 이진화하는 방법이다.The global threshold determination method calculates an arbitrary threshold that minimizes the variance of two parts when dividing 256 gray levels into two parts using the distribution of the number of pixels for each gray level of the input image. The pixel of the input image is binarized to a value of 0 or 1 according to the calculated threshold.
지엽적 임계값 결정 방법은 N*N를 사용하여 각 마스크로 지정되는 영역내에서의 화소 값을 이용하여 마스크 중심 화소에 대한 임계값을 계산하고, 계산된 임계값에 따라 입력 영상의 화소를 0 또는 1의 값으로 이진화하는 방법이다.The local threshold determination method uses N * N to calculate a threshold value for a mask center pixel using pixel values within an area designated by each mask, and zeros or zeros pixels in the input image according to the calculated threshold value. Binarization to a value of 1.
그러나, 패턴 인식을 위하여 영상을 이진화할때, 상술한 두가지 방법중의 한가지 방법만을 사용하기 때문에 여러가지 영상, 특히 문서와 같이 물체를 나타내는 부분이 적은 영상에서는 정확한 결과를 얻기가 어렵다. 즉, 문서와 같은 종류의 영상은 선 성분으로 모든 정보를 표현하고 이들이 차지하는 영역은 전체 영상에서 약 10 내지 20 % 정도이기 때문에 지엽적인 정보 또는 전역적인 정보를 선택적으로 사용하면 보다 정확한 이진화 영상을 만들지 못하는 문제가 있다.However, when binarizing an image for pattern recognition, since only one of the two methods described above is used, it is difficult to obtain accurate results in various images, particularly in an image having few parts representing objects such as documents. In other words, images of the same type as documents represent all information as line components, and the area occupied by them is about 10 to 20% of the entire image. There is no problem.
그러므로, 본 발명은 패턴 인식 시스템에서 영상 전체에서 물체를 나타내는 부분이 적은 입력 영상에 대한 보다 정확한 이진화 영상을 생성하는 방법을 제공하는 것을 그 목적으로한다.Therefore, an object of the present invention is to provide a method for generating a more accurate binarized image of an input image in which a part representing an object in the entire image in the pattern recognition system is small.
상술한 목적을 달성하기위한 본 발명에 따르면, 패턴 인식 시스템에서 사용하는 입력 영상에 대한 이진화 방법은, 상기 입력 영상의 화소 값 분포를 이용하여 전역적 임계값을 구하는 단계와, 상기 입력 영상을 3*3 마스크를 이용하여 지엽적 임계값를 구하는 단계와, 상기 전역적 임계값과 상기 지엽적 임계값을 비교하여 상기 전역적 임계값이 상기 지엽적 임계값보다 크면 상기 전역적 임계값을 최종 임계값으로서 선택하고, 상기 전역적 임계값이 상기 지엽적 임계값보다 작거나 같으면 상기 지엽적 임계값을 최종 임계값으로서 선택하는 단계와, 상기 중심 화소의 화소 값과 상기 최종 임계값의 비교에 따라 상기 중심 화소를 이진수의 한 값으로 설정하는 단계를 포함하는 것을 특징으로한다.According to the present invention for achieving the above object, a binarization method for an input image used in a pattern recognition system, the method comprising: obtaining a global threshold value by using a pixel value distribution of the input image, and the input image 3 * 3 obtaining a local threshold using a mask; comparing the global threshold with the local threshold and selecting the global threshold as the final threshold if the global threshold is greater than the local threshold; Selecting the local threshold as a final threshold if the global threshold is less than or equal to the local threshold, and comparing the central pixel to a binary value according to a comparison of the pixel value of the central pixel and the final threshold. Characterized in that the step of setting to one value.
도 1은 본 발명의 이진화 방법을 이용하는 패턴 인식 시스템의 개략적인 블록 구성도,1 is a schematic block diagram of a pattern recognition system using a binarization method of the present invention;
도 2는 본 발명에 따른 이진화 방법을 설명하는 플로우차트,2 is a flowchart illustrating a binarization method according to the present invention;
도 3a는 지엽적 임계값 결정 방법을 이용하여 이진화된 영상의 패턴 인식된 결과를 예시하는 도면,3A is a diagram illustrating a pattern recognized result of a binarized image using a local threshold determination method;
도 3b는 전역적 임계값 결정 방법을 이용하여 이진화된 영상의 패턴 인식된 결과를 예시하는 도면,3B is a diagram illustrating a pattern recognized result of a binarized image using a global threshold determination method;
및 3c는 본 발명에 따른 적응적인 임계값 결정 방법을 이용하여 이진화된 영상의 패턴 인식된 결과를 예시하는 도면.And 3c illustrates a pattern recognized result of a binarized image using the adaptive threshold determination method according to the present invention.
* 도면의 주요부분에 대한 부호의 설명* Explanation of symbols for main parts of the drawings
10 : 스캐너 20 : 이진화부10: scanner 20: binarization unit
30 : 세그멘테이션부 40 : 패턴 윤곽선 추출부30: segmentation unit 40: pattern contour extraction unit
50 : 분류기50: classifier
본 발명의 상기 및 기타 목적과 여러가지 장점은 첨부된 도면을 참조하여 하기에 기술되는 본 발명의 바람직한 실시예로 부터 더욱 명확하게 될 것이다.The above and other objects and various advantages of the present invention will become more apparent from the preferred embodiments of the present invention described below with reference to the accompanying drawings.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세하게 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1을 참조하면, 본 발명에 따른 이진화 방법을 이용하는 패턴 인식 시스템의 개략적인 블록도가 도시된다.1, there is shown a schematic block diagram of a pattern recognition system using a binarization method according to the present invention.
먼저, 광학 스캐너등을 포함하는 스캐너(10)는 서류, 또는 문서상의 영상을 스캔한다. 이진화부(20)는 스캔된 영상으로부터 하기에 상세히 설명되는 바와같이 전역적 임계값과 지엽적 임계값 결정 방법을 이용하여 이진수로 디지트화한다.First, the scanner 10 including an optical scanner or the like scans a document or an image on a document. The binarization unit 20 digitizes the binary image using the global threshold value and the local threshold value determination method as described in detail below from the scanned image.
이진화부(20)에의해 디지트화된 이진수의 영상은 세그멘테이션부(30)에 의해 구획되어 패턴 윤곽선 추출부(40)로 제공된다. 패턴 윤곽선 추출부(40)는 본 기술 분야에서 널리 알려진 윤곽 추출 알고리즘을 이용하여 영상의 윤곽선과 같은 특징을 추출한다. 추출된 윤곽선과 같은 특징은 허프 변환(Hough transform)을 이용하여 영상에 있는 직선과 곡선들로 검출된다음 분류기(50)로 제공된다. 분류기(50)는 직선과 곡선의 패턴이 속하는 부류를 결정하여 인식된 결과를 최종적으로 출력하게된다.The binary image digitized by the binarization unit 20 is partitioned by the segmentation unit 30 and provided to the pattern contour extracting unit 40. The pattern outline extractor 40 extracts a feature such as an outline of an image by using a contour extraction algorithm well known in the art. Features such as extracted contours are detected by straight lines and curves in the image using a Hough transform and then provided to the classifier 50. The classifier 50 determines the class to which the linear and curved patterns belong and finally outputs the recognized result.
도 2에는 도 1에 도시된 이진화부에서 수행되는 본 발명의 영상 이진화 방법을 설명하는 플로우차트를 도시한다.FIG. 2 is a flowchart illustrating an image binarization method of the present invention performed by the binarization unit shown in FIG. 1.
먼저, 단계(110)에서, 스캐너를 통해 스캔된 영상이 입력되면, 이 스캔된 영상에 대하여 지엽적 임계값이 계산된다. 즉, 입력 영상에 대하여 N*N, 예로, 3*3 마스크(mask)를 사용하여 각 마스크로 지정되는 영역내에서의 화소 값을 이용하여 마스크 중심 화소에 대한 임계값을 계산한다. 지엽적 임계값 ()의 계산은 하기 수학식 1과 같이 규정된다.First, in step 110, when a scanned image is input through a scanner, a local threshold is calculated for this scanned image. That is, the threshold value for the mask center pixel using the pixel value in the region designated by each mask using N * N, for example, a 3 * 3 mask for the input image. Calculate Local threshold ( ) Is defined as in Equation 1 below.
상기 수학식 1 에서 사용된 변수는 하기 수학식 2과 같이 정의된다.The variable used in Equation 1 is defined as in Equation 2 below.
상기 수학식 2 에서 M 은 영상내의 모든 화소의 개수이고, P(n)은 화소 n 의 히스토그램 값이고, Pi 는 3*3 마스크내 화소 i 의 화소 값(grey value)을 나타낸다.In Equation 2, M is the number of all pixels in the image, P (n) is the histogram value of the pixel n, and Pi represents the pixel value (grey value) of the pixel i in the 3 * 3 mask.
그 다음, 단계(120)에서 전역적 임계값이 결정된다. 전역적 임계값 결정은 입력 영상의 계조도 별 화소수의 분포를 이용하여 256 계조도를 두개의 부분으로 나눌때 두 부분의 분산(variance)을 가장 작게하는 임의의 임계치 t 를 찾는 방법으로, 이것은 하기 수학식 3과 같이 나타낼 수 있다.Then, in step 120, a global threshold is determined. Global threshold determination is a method of finding an arbitrary threshold t that minimizes the variance of two parts when dividing 256 gray levels into two parts using a distribution of the number of pixels for each gray level of the input image. It can be expressed as Equation 3 below.
상기 수학식 1 에서 사용된 변수는 다음과 같이 정의된다.The variable used in Equation 1 is defined as follows.
: 화소 i 의 히스토그램(histogram) : Histogram of pixel i
: 화소값이 t 이하인 화소들의 개수 : The number of pixels whose pixel value is t or less
: 화소값이 t 이상인 화소들의 개수 : The number of pixels whose pixel value is t or more
: t 이하인 화소 값의 분산 Variance of pixel values less than or equal to t
: t 이상인 화소 값의 분산 variance of pixel values above t
: 화소값이 t 이하인 확률 : Probability that the pixel value is less than or equal to t
: 화소값이 t 이상인 확률 : Probability that pixel value is greater than or equal to t
상술한 수학식 3에서 σw 2(t) 를 최소로하는 t 값이 임계값으로서 결정된다.In the above equation (3), the value of t that minimizes sigma w 2 (t) is determined as the threshold value.
단계(130)에서, 지엽적 임계값() 과 전역적 임계값(t)을 비교하여 3*3 마스크의 중심에 배치된 화소에 대한 최종 임계값(Γ)을 구한다. 이때, 전역적 임계값(t)가 지엽적 임계값() 보다 크면, 전역적 임계값(t)를 최종 임계값(Γ)으로서 선택하고(단계 140), 전역적 임계값(t)가 지엽적 임계값() 보다 작거나 같으면, 지엽적 임계값() 을 최종 임계값(Γ)으로서 선택한다(단계 150). 이러한 선택 과정은 화소 값의 분포가 큰 경우에는 전역적 임계값을 사용하고, 화소 값의 분포가 작은 경우에는 지엽적 임계값을 사용함으로써 입력 영상내의 점과 같은 잡음과 선 내부의 공백을 제거함과 동시에 선과 인접한 문자가 선에 붙는 것을 방지하게 된다.In step 130, the local threshold ( ) Is compared with the global threshold t to obtain a final threshold value Γ for a pixel disposed at the center of the 3 * 3 mask. In this case, the global threshold t is the local threshold ( If greater than, the global threshold t is chosen as the final threshold Γ (step 140), and the global threshold t is the local threshold ( Less than or equal to), the local threshold ( ) Is chosen as the final threshold Γ (step 150). This selection process uses a global threshold when the distribution of pixel values is large and a local threshold when the distribution of pixel values is small to remove noises such as points in the input image and white space inside the line. This prevents text adjacent to the line from sticking to it.
단계(160)에서는 3*3 마스크의 중심 화소가 갖는 화소 값(Pi)과 최종 임계값(Γ)의 비교함으로써 중심 화소를 이진수의 0 또는 1중의 어느 한 값으로 설정한다. 이때, 3*3 마스크의 중심 화소가 갖는 화소 값(Pi)이 최종 임계값(Γ)보다 크면, 중심 화소값(Pi)을 이진수 1로 이진화하고(단계 170), 3*3 마스크의 중심 화소가 갖는 화소 값(Pi)이 최종 임계값(Γ)보다 작으면, 중심 화소값(Pi)을 이진수 0로 이진화한다.In step 160, the center pixel is set to one of zero or one of binary numbers by comparing the pixel value Pi of the center pixel of the 3 * 3 mask with the final threshold value Γ. At this time, if the pixel value Pi of the center pixel of the 3 * 3 mask is greater than the final threshold value Γ, the center pixel value Pi is binarized to binary 1 (step 170), and the center pixel of the 3 * 3 mask If the pixel value Pi has smaller than the final threshold value Γ, the center pixel value Pi is binarized to binary zero.
도 3은 입력 영상으로서 지도 영상을 각기 상이한 방법으로 이진화한 결과를 도시하는 도면으로, 도 3a 와 도 3b 에는 각기 지엽적 임계값 결정과 전역적 임계값 결정을 이용하고, 도 3c에는 지엽적 임계값과 전역적 임계값 결정을 적응적으로 이용하여 지도 영상을 이진화하고, 이진화된 영상에서 상호 연결된 성분(connected component)들의 크기를 사용하여 고립 문자를 제거한 후 세선화(thinning)화한 결과이다. 도 3a에서는 점과 같은 작은 잡음들이 존재하고 우측 하단의 굵은 선분 내부에 많은 홀(hole)들이 발생한 것이 보이며, 도 3b에서는 작은 잡음들이 존재하지않고 선 성분 중간에 홀도 생기지 않았으나, 영상의 좌측 상단에 있는 문자 6이 인접한 선 성분에 붙어있는 것이 보인다. 그러나, 본 발명을 이용하여 인식된 결과를 예시하는 도 3c에서는 좌측 상단의 문자 6이 선 성분과 분리되어 제거되었으며 점들과 선 내부의 홀이 제거된 것을 알 수 있다.FIG. 3 is a diagram illustrating a result of binarizing a map image as an input image by different methods. FIG. 3A and FIG. 3B use local threshold determination and global threshold determination, and FIG. It is a result of binarizing a map image by adaptively using global threshold determination, thinning after removing isolated characters using the size of interconnected components in the binarized image. In FIG. 3A, there are small noises such as dots and many holes are formed inside the thick line at the lower right. In FIG. 3B, there are no small noises and no holes in the line component. Notice that the letter 6 in is attached to the adjacent line component. However, in FIG. 3C illustrating the result recognized using the present invention, it can be seen that the letter 6 in the upper left is removed separately from the line component and the points and holes inside the line are removed.
그러므로, 모든 정보를 선 성분으로 표현하고 이들이 차지하는 영역이 전체 영상에서 약 10 내지 20 %를 차지하는 지도와 같은 영상에서는 본 발명에 따라서 전역적인 임계값 결정과 지엽적 임계값 결정을 적응적으로 채택함으로써 패턴 인식에 필요한 보다 정확한 이진화 영상을 제공할 수 있다.Therefore, in a map-like image in which all information is represented by a line component and the area occupied is about 10 to 20% of the entire image, the pattern by adaptively adopting global threshold determination and local threshold determination in accordance with the present invention. It is possible to provide more accurate binarized images for recognition.
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970029489A KR19990005294A (en) | 1997-06-30 | 1997-06-30 | Input Image Binarization Method of Pattern Recognition System |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970029489A KR19990005294A (en) | 1997-06-30 | 1997-06-30 | Input Image Binarization Method of Pattern Recognition System |
Publications (1)
Publication Number | Publication Date |
---|---|
KR19990005294A true KR19990005294A (en) | 1999-01-25 |
Family
ID=65999449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019970029489A KR19990005294A (en) | 1997-06-30 | 1997-06-30 | Input Image Binarization Method of Pattern Recognition System |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR19990005294A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100713335B1 (en) * | 2005-08-11 | 2007-05-04 | 삼성전자주식회사 | Method for recognizing of picture in wireless terminal |
KR100897382B1 (en) * | 2007-05-28 | 2009-05-14 | 성균관대학교산학협력단 | Method and Apparatus for Real Time Extracting Connected Component |
-
1997
- 1997-06-30 KR KR1019970029489A patent/KR19990005294A/en not_active Application Discontinuation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100713335B1 (en) * | 2005-08-11 | 2007-05-04 | 삼성전자주식회사 | Method for recognizing of picture in wireless terminal |
KR100897382B1 (en) * | 2007-05-28 | 2009-05-14 | 성균관대학교산학협력단 | Method and Apparatus for Real Time Extracting Connected Component |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1473658B1 (en) | Preprocessing device and method for recognizing image characters | |
JP2696211B2 (en) | Method and apparatus for pattern recognition from grayscale images | |
EP0552704A2 (en) | Processing of dot-matrix/ink-jet printed text for optical character recognition | |
KR100703284B1 (en) | Device and method for binarization of image using quadratic filter and improved quadratic filter | |
EP2645305A2 (en) | A system and method for processing image for identifying alphanumeric characters present in a series | |
JP2002133426A (en) | Ruled line extracting device for extracting ruled line from multiple image | |
Gilly et al. | A survey on license plate recognition systems | |
JP2002288589A (en) | Image processing method, image processor and computer readable recording medium recording program for executing the image processing method by computer | |
JP3438440B2 (en) | Image processing device | |
US7130085B2 (en) | Half-tone dot elimination method and system thereof | |
Saddami et al. | Improvement of binarization performance using local otsu thresholding. | |
KR19990005294A (en) | Input Image Binarization Method of Pattern Recognition System | |
JP3150762B2 (en) | Gradient vector extraction method and character recognition feature extraction method | |
JP3552269B2 (en) | License plate detection device | |
Nurhaida et al. | Indonesian license plate recognition with improved horizontal-vertical edge projection | |
Liu et al. | Document image binarization based on texture analysis | |
RU2520407C1 (en) | Method and system of text improvement at digital copying of printed documents | |
JP4409713B2 (en) | Document image recognition apparatus and recording medium | |
Gatos et al. | Locating text in historical collection manuscripts | |
KR100235353B1 (en) | Method for estimating a circle pattern in an image | |
JP7277879B2 (en) | License plate recognition program and license plate recognition device | |
KR100288706B1 (en) | Image binarization method for removing the noise due to isolated pixel | |
US11232281B1 (en) | Method of filtering fingerprint image | |
Vidyarthi et al. | Text and non-text region identification using texture and connected components | |
JP3578247B2 (en) | Character recognition method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Withdrawal due to no request for examination |