KR20050116224A - Apparatus for extracting target area of document by detecting background area and method thereof - Google Patents

Apparatus for extracting target area of document by detecting background area and method thereof Download PDF

Info

Publication number
KR20050116224A
KR20050116224A KR1020040041348A KR20040041348A KR20050116224A KR 20050116224 A KR20050116224 A KR 20050116224A KR 1020040041348 A KR1020040041348 A KR 1020040041348A KR 20040041348 A KR20040041348 A KR 20040041348A KR 20050116224 A KR20050116224 A KR 20050116224A
Authority
KR
South Korea
Prior art keywords
area
background
group
document image
pixel value
Prior art date
Application number
KR1020040041348A
Other languages
Korean (ko)
Inventor
옥형수
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020040041348A priority Critical patent/KR20050116224A/en
Publication of KR20050116224A publication Critical patent/KR20050116224A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

배경영역 검출에 의한 문서의 타겟영역 추출 장치 및 그 방법이 개시된다. 본 배경영역 검출에 의한 문서의 타겟영역 추출 방법은 문자와 그림이 혼재된 문서영상을 소정 크기의 격자로 구획하고, 구획된 각 격자 내 화소값의 변화량을 산출하는 단계, 산출된 화소값의 변화량이 소정의 값 이하인 격자를 배경후보격자로 선출하고, 선출된 배경후보격자들을 격자 평균화소값에 기초하여 수개의 그룹으로 그룹화하는 단계, 그룹들 중에서 그룹의 면적 및 그룹의 화소값의 변화량 중 적어도 어느 하나를 비교하여 선택된 그룹을 배경영역을 검출하는 단계, 및 문서영상에서 배경영역을 제외한 문자영역 및 그림영역으로 이루어진 타겟영역을 추출하는 단계를 구비한다. 이에 의해, 추출된 타겟영역의 범위 내에서 문자영역과 그림영역을 구분하게 함으로써, 전체 문서영상에 대해 문자영역과 그림영역을 블럭단위로 구분함에 따라 발생하는 블러킹 현상을 방지하고, 검출된 배경영역을 이용하여 전체적인 배경영역의 밝기값 조절에 사용할 수 있다.An apparatus and method for extracting a target region of a document by detecting a background region are disclosed. The method of extracting a target area of a document by detecting a background area includes dividing a document image having a mixture of characters and pictures into a grid having a predetermined size, calculating a change amount of pixel values in each partitioned grid, and calculating a calculated change amount of a pixel value. Selecting a lattice having a predetermined value or less as a background post-stalker, and grouping the selected background post-suppliers into several groups based on the lattice average pixel value, at least of the area of the group and the amount of change in the pixel value of the group; Detecting a background area of the selected group by comparing any one, and extracting a target area including a text area and a picture area excluding the background area from the document image. As a result, by separating the character area and the picture area within the range of the extracted target area, the blocking phenomenon caused by dividing the text area and the picture area by the block unit for the entire document image is prevented, and the detected background area is detected. It can be used to adjust the brightness value of the whole background area by using.

Description

배경영역 검출에 의한 문서의 타겟영역 추출 장치 및 그 방법{Apparatus for extracting target area of document by detecting background area and method thereof}Apparatus for extracting target area of document by detecting background area and method

본 발명은 배경영역 검출에 의한 문서의 타겟영역 추출 장치 및 그 방법에 관한 것으로, 더욱 상세하게는 화소값의 변화량이 작은 배경영역 검출에 의해 배경영역을 제외한 문자영역 및 그림영역으로 이루어진 타겟영역을 추출할 수 있는 배경영역 검출에 의한 문서의 타겟영역 추출 장치 및 그 방법에 관한 것이다.The present invention relates to an apparatus and method for extracting a target region of a document by detecting a background region, and more particularly, to a target region including a character region and a picture region except for the background region by detecting a background region having a small amount of change in pixel values. An apparatus and method for extracting a target region of a document by detecting a background region which can be extracted.

적어도 하나의 문자(텍스트)와 그림(이미지)을 가지고 있는 문서를 혼재문서(mixed document)라고 한다. 여기서 이미지는 그래픽(graphic)과 사진(photograph)을 포함한다.A document containing at least one character (text) and picture (image) is called a mixed document. The image here includes a graphic and a photograph.

통상적으로 혼재문서의 화질을 개선하기 위한 방법으로 스캐닝된 혼재문서영상을 문자영역과 그림 영역으로 구분하고 각각의 영역 유형에 적합한 화질 개선 처리를 함으로써 전체적인 화질을 개선한다. 문자의 경우는 윤곽선을 강조하여 선명히 할 수 있으나, 그림의 경우에는 지나친 윤곽선 강조는 프린터 출력 화질이 부자연스러울 수 있으므로, 문자 부분과 그림 부분을 구별하여 각각에 대하여 별도의 영상 화질 개선 방법을 적용한다.In general, as a method for improving the quality of a mixed document, the scanned mixed document image is divided into a text area and a picture area, and the overall image quality is improved by performing image quality improvement processing suitable for each area type. In the case of text, it is possible to sharpen it by emphasizing the outline, but in the case of pictures, excessive image enhancement can cause unnatural printer output quality. Therefore, separate image quality improvement method is applied to each character by distinguishing between the text part and the picture part. .

도 1은 종래의 혼재문서 화질 개선방법의 일예를 보여주는 흐름도이다.1 is a flowchart illustrating an example of a conventional method for improving image quality of mixed documents.

도 1을 참조하면, 혼재문서 화질 개선방법은 스캐너 등의 입력장치로부터 문서영상을 입력받는 과정(S100), 문자 영역과 그림 영역을 구분하기 위해 각 블럭에 대하여 고대역 통과 필터를 적용하여 과정(S110), 고대역 성분이 많은 문자 영역과 고대역 성분이 적은 그림 영역을 구분하는 과정(S120), 구분된 문자 영역에 대해 윤곽선을 선명하게 하기 위한 고대역 통과 필터를 적용하는 과정(S130), 구분된 그림 영역에 대해 노이즈를 줄이기 위해 저대역 통과 필터를 적용하는 과정(S140), 개선된 영상을 생성하는 과정(S150), 및 프린터를 이용하여 문서를 출력하기 위해 하프톤을 적용하여 하프톤 영상을 출력하는 과정(S160)을 포함한다.Referring to FIG. 1, a method of improving a mixed document image quality is a process of receiving a document image from an input device such as a scanner (S100), and applying a high pass filter to each block to distinguish a character area and a picture area. S110), a process of distinguishing a character region having many high band components and a picture region having a small high band component (S120), a process of applying a high pass filter to sharpen an outline for the divided character region (S130), Applying a low pass filter to reduce noise in the divided picture region (S140), generating an improved image (S150), and applying halftones to output a document using a printer and applying halftones A process of outputting an image is included (S160).

그러나, 이러한 종래기술이 사용하는 전체 문서영상을 블럭 단위로 분할하여 문자영역과 그림영역을 구분하는 기술은 같은 영역내에 속하는 이웃한 블럭의 클래스가 다르게 결정된 경우 블럭이 드러나 보이는 블러킹 현상이 발생할 수 있다. However, in the technique of dividing the entire document image used in the prior art by a block unit and dividing the text area and the picture area, a blocking phenomenon may occur in which a block is revealed when a class of neighboring blocks belonging to the same area is determined differently. .

한편, 혼재문서의 화질을 개선하기 위한 미국특허 제 6,078,697호("Method and apparatus for segmenting image data into contone, text and halftone classifications")에는 다음과 같은 방법이 개시된다. 즉, 입력된 문서영상의 각 화소에 대하여 각 화소를 중심으로 소정 크기의 윈도우를 설정하고, 윈도우 안에 있는 화소들에 대하여 경사도(Gradient) 연산을 적용하여 경사도의 크기와 방향을 산출한다. 산출된 값들을 이용하여 퍼지 규칙(Fuzzy Rule)에 의해 중심 화소가 글자영역, 하프톤 영역, 연속톤 영역에 속할 가능성을 나타태는 값인 퍼지 확률값을 계산한 후, 산출된 세 개의 퍼지 확률값을 비교하여 가장 큰 값을 갖는 영역으로 중심 화소의 클래스를 결정한다. 최종적으로 잘못 구분된 화소를 다시 구분하는 후처리 과정을 통해 중심 화소의 클래스를 확정한다.On the other hand, US Patent No. 6,078,697 ("Method and apparatus for segmenting image data into contone, text and halftone classifications") for improving the quality of mixed documents is disclosed the following method. That is, for each pixel of the input document image, a window having a predetermined size is set around each pixel, and the magnitude and direction of the gradient are calculated by applying a gradient operation to the pixels in the window. Using the calculated values, a fuzzy probability value, which is a value indicating the likelihood that a central pixel belongs to a character area, a halftone area, or a continuous tone area is calculated by a fuzzy rule, and then the three calculated fuzzy probability values are compared. The class of the center pixel is determined as the area having the largest value. Finally, the class of the center pixel is determined through a post-processing process for re-classifying the misidentified pixels.

그러나, 상기 미국특허 제 6,078,697호에 의한 기술은 중심 화소의 클래스를 결정하는데 있어서 좁은 범위안의 정보를 이용하기 때문에 오류가 발생할 수 있고, 이웃한 화소간에 클래스가 다르게 결정된 경우 블럭이 드러나 보이는 블러킹 현상이 발생할 수 있는 문제점이 있다.However, the technique described in US Pat. No. 6,078,697 uses errors in a narrow range in determining the class of the center pixel, which may cause an error, and the blocking phenomenon in which the block is revealed when the class is determined differently between neighboring pixels is caused. There is a problem that can occur.

따라서, 본 발명의 목적은, 문자와 그림이 혼재된 문서영상에서 화소값의 변화량이 작은 배경영역을 검출하여 배경영역을 제외한 문자영역 및 그림영역으로 이루어진 타겟영역을 추출할 수 있는 배경영역 검출에 의한 문서의 타겟영역 추출 장치 및 그 방법을 제공함에 있다.Accordingly, an object of the present invention is to detect a background area that detects a background area having a small amount of change in pixel value in a document image having a mixture of characters and pictures, and extracts a target area consisting of a text area and a picture area excluding the background area. An apparatus and method for extracting a target area of a document by the same are provided.

상기 목적을 달성하기 위한 본 발명에 따른 배경영역 검출에 의한 문서의 타겟영역 추출 방법, 문자와 그림이 혼재된 문서영상을 소정 크기의 격자로 구획하고, 상기 구획된 각 격자 내 화소값의 변화량을 산출하는 단계, 산출된 상기 화소값의 변화량이 소정의 값 이하인 격자를 배경후보격자로 선출하고, 선출된 상기 배경후보격자들을 격자 평균화소값에 기초하여 수개의 그룹으로 그룹화하는 단계, 상기 그룹들 중에서 그룹의 면적 및 그룹의 화소값의 변화량 중 적어도 어느 하나를 비교하여 선택된 그룹을 배경영역을 검출하는 단계, 및 상기 문서영상에서 상기 배경영역을 제외한 문자영역 및 그림영역으로 이루어진 타겟영역을 추출하는 단계를 포함한다.A method of extracting a target region of a document by detecting a background region according to the present invention for achieving the above object, dividing a document image in which characters and pictures are mixed into a grid having a predetermined size, and changing the amount of change of pixel values in the divided grids Calculating, selecting a lattice having a calculated change amount of the pixel value equal to or less than a predetermined value as a background post-stalker, and grouping the selected background post-suppliers into several groups based on a lattice average pixel value; Detecting a background area of the selected group by comparing at least one of the area of the group and the amount of change in the pixel value of the group, and extracting a target area including a text area and a picture area excluding the background area from the document image; Steps.

그리고, 상기 격자의 크기는, 상기 문서영상의 1인치당 도트의 수에 따라 결정되는 것이 바람직하다.The size of the grid is preferably determined according to the number of dots per inch of the document image.

또한, 상기 그룹화하는 단계는, 소정 범위 내의 격자 평균화소값을 갖는 상기 배경후보격자들을 동일 영역으로 판단하는 단계, 및 상기 동일 영역으로 판단된 수개의 영역과 상기 각 영역 내 격자 평균화소값의 평균값에서 소정 범위 내의 화소값을 가지는 인접한 화소들을 각각 동일 그룹으로 그룹화 하는 단계를 포함하는 것이 바람직하다. The grouping may include determining the background post-storers having a lattice average pixel value within a predetermined range as the same area, and an average value of several areas determined as the same area and the lattice average pixel values in each area. Preferably grouping adjacent pixels having pixel values within a predetermined range into the same group.

그리고, 상기 화소값의 변화량을 산출하는 단계 전에, 잡음 및 하프톤으로 인한 오류를 방지하기 위해 상기 문서영상에 대하여 저대역 통과 필터링을 수행하는 단계를 더 포함하는 것이 바람직하다. The method may further include performing low pass filtering on the document image to prevent an error due to noise and halftones before calculating the amount of change in the pixel value.

한편, 본 발명의 배경영역 검출에 의한 문서의 타겟영역 추출 장치는, 문자와 그림이 혼재된 문서영상을 소정 크기의 격자로 구획하는 구획부, 상기 구획된 각 격자 내 화소값의 변화량을 산출하는 변화량 산출부, 산출된 상기 화소값의 변화량이 소정의 값 이하인 각 격자를 배경후보격자로 선출하고, 소정 범위 내의 격자 평균화소값을 갖는 상기 배경후보격자들을 동일 영역으로 판단하는 동일 영역 판단부, 상기 동일 영역으로 판단된 수개의 영역과 상기 각 영역 내 격자 평균화소값에서 소정 범위 내의 화소값을 가지는 인접한 화소들을 각각 동일 그룹으로 그룹화 하는 그룹화부, 상기 그룹들 중에서 그룹의 면적 및 그룹의 화소값의 변화량 중 적어도 어느 하나를 비교하여 선택된 그룹을 배경영역으로 검출하는 배경영역 검출부, 및 상기 문서영상에서 상기 배경영역을 제외한 문자영역 및 그림영역으로 이루어진 타겟영역을 추출하는 타켓영역 추출부를 포함한다.Meanwhile, the apparatus for extracting a target region of a document by detecting a background region of the present invention includes a partition unit for dividing a document image in which characters and pictures are mixed into a grid having a predetermined size, and calculating a change amount of pixel values in each partitioned grid. A change amount calculation unit, an equal area determination unit which selects each lattice whose calculated change amount of the pixel value is equal to or less than a predetermined value as a background post-striker, and determines the background post-suppliers having a grid average pixel value within a predetermined range as the same area; A grouping unit for grouping several regions determined as the same region and adjacent pixels having a pixel value within a predetermined range from the lattice average pixel values in each region into the same group, an area of the group among the groups, and a pixel value of the group A background region detector for detecting a selected group as a background region by comparing at least one of the change amounts of?, And the document image And a target area extraction unit for extracting a target area including a text area and a picture area except for the background area.

그리고, 상기 격자의 크기는, 상기 문서영상의 1인치당 도트의 수에 따라 결정되는 것이 바람직하다.The size of the grid is preferably determined according to the number of dots per inch of the document image.

이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.Hereinafter, with reference to the drawings will be described the present invention in more detail.

도 2는 본 발명에 따른 배경영역 검출에 의한 문서의 타겟영역 추출 장치의 블럭도이다. 도 2를 참조하면, 본 배경영역 검출에 의한 문서의 타겟영역 추출 장치는 구획부(200), 변화량 산출부(210), 동일 영역 판단부(220), 그룹화부(230), 배경영역 검출부(240), 및 타겟영역 추출부(250)를 포함한다. 2 is a block diagram of an apparatus for extracting a target region of a document by detecting a background region according to the present invention. Referring to FIG. 2, the apparatus for extracting a target region of a document by detecting the background region includes a partition unit 200, a change amount calculation unit 210, an identical region determination unit 220, a grouping unit 230, and a background region detection unit ( 240, and a target region extraction unit 250.

구획부(200)는 문자와 그림이 혼재된 문서영상을 8×8 또는 적절한 크기의 격자로 구획한다. 변화량 산출부(210)는 구획부(200)에 의해 구획된 각 격자 내 화소값의 변화량을 산출한다. 동일 영역 판단부(220)는 변화량 산출부(210)에서 산출된 변화량이 소정의 값 이하인 각 격자를 배경후보격자로 선출하고, 소정 범위 내의 격자 평균화소값을 갖는 배경후보격자들을 동일 영역으로 판단한다. 그룹화부(230)는 동일 영역 판단부(220)에서 동일 영역으로 판단된 수개의 영역들 중에서 각각의 영역 내 격자의 평균화소값과 상기 각각의 영역 내 격자의 평균화소값과 유사한 화소값을 가지는 인접한 격자내의 화소들을 각각 동일 그룹으로 그룹화한다. 배경영역 검출부(240)는 그룹화부(230)에서 그룹화된 그룹들 중 그룹의 면적이 크고, 그룹의 화소값의 변화량이 작은 그룹을 적절하게 비교하여 배경영역으로 검출한다. 상기 배경영역은 그룹의 크기와 그룹의 변화량에 따라 하나 또는 그 이상일 수 있다. 타겟영역 추출부(250)는 전체 문서 영역에서 배경영역 검출부(240)에서 검출된 배경영역을 제외한 문자영역과 그림영역으로 이루어진 타겟영역을 추출한다.The dividing unit 200 divides a document image in which characters and pictures are mixed into a grid of 8 × 8 or an appropriate size. The change amount calculator 210 calculates a change amount of pixel values in the grids partitioned by the partition unit 200. The same area judging unit 220 selects each lattice whose change amount calculated by the change amount calculating unit 210 is equal to or less than a predetermined value as a background post-sitter, and determines the background post-sitters having a grid average pixel value within a predetermined range as the same area. do. The grouping unit 230 has an average pixel value of a grating in each area and a pixel value similar to the average pixel value of the grating in each area among several areas determined to be the same area by the same area determining unit 220. The pixels in adjacent grids are each grouped into the same group. The background area detection unit 240 compares a group having a large area of the group among the groups grouped by the grouping unit 230 and a small change amount of the pixel value of the group as a background area. The background area may be one or more depending on the size of the group and the amount of change in the group. The target area extractor 250 extracts a target area including a text area and a picture area except for the background area detected by the background area detection unit 240 from the entire document area.

도 3은 본 발명에 따른 배경영역 검출에 의한 문서의 타겟영역 추출 장치의 동작을 설명하기 위한 흐름도이다. 도 2 와 도3을 참조하면, 문자와 그림이 혼재된 혼재문서의 문서영상을 저대역 통과 필터링 한다(S300). 이 과정을 통해 잡음 및 하프톤으로 인한 오류가 방지된다. 저대역 통과 필터링된 문서영상이 구획부(200)에서 8×8 또는 적절한 크기의 격자로 구획되고, 각 격자 내 화소값의 변화량을 산출한다(S310). 산출된 화소값의 변화량이 소정의 값 이하인 격자를 배경후보격자로 선출하고, 소정 범위 내의 격자 평균화소값을 갖는 상기 배경후보격자들을 동일 영역으로 판단하여, 동일 영역으로 판단된 수개의 영역과 각 영역 내 격자 평균화소값에서 소정 범위 내의 화소값을 가지는 인접환 격자 내의 화소들을 각각 동일 그룹으로 그룹화한다(320). 그룹화된 그룹들 중 그룹의 크기가 크고, 그룹의 화소값의 변화량이 작은 그룹을 적절하게 비교하여 배경영역으로 검출한다(S330). 상기 배경영역은 그룹의 크기와 그룹의 변화량에 따라 하나 또는 그 이상일 수 있다. 전체 문서 영역에서 배경영역 검출부(240)에서 검출된 배경영역을 제외한 문자영역과 그림영역으로 이루어진 타겟영역을 추출한다(S340).3 is a flowchart illustrating an operation of an apparatus for extracting a target region of a document by detecting a background region according to the present invention. Referring to FIGS. 2 and 3, low pass filtering is performed on a document image of a mixed document in which characters and pictures are mixed (S300). This prevents errors due to noise and halftones. The low pass filtered document image is divided into 8x8 or a grid of an appropriate size in the partition unit 200, and an amount of change of pixel values in each grid is calculated (S310). A grid having a calculated amount of change in pixel value equal to or less than a predetermined value is elected as a background post-stalker, and the background post-suppliers having a grid average pixel value within a predetermined range are judged as the same area, and several areas determined as the same area and each The pixels in the adjacent ring lattice having pixel values within a predetermined range from the lattice average pixel values in the region are grouped into the same group (320). Among the grouped groups, a group having a large size and a small change in pixel value of the group are appropriately compared and detected as a background area (S330). The background area may be one or more depending on the size of the group and the amount of change in the group. A target area including a text area and a picture area except for the background area detected by the background area detection unit 240 is extracted from the entire document area (S340).

이와 같이 문자와 그림이 혼재된 문서영상에서 화소값의 변화량이 작은 배경영역을 검출하여 타겟영역을 추출함으로써, 추출된 타겟영역의 범위 내에서 문자영역과 그림영역을 구분하게 하여 블러킹 현상을 방지할 수 있고, 검출된 배경영역을 이용하여 전체적인 배경영역의 밝기값 조절에 사용할 수 있다.As described above, the target region is extracted by detecting a background region having a small amount of change in pixel value in a mixed document image, so that the text region and the image region can be divided within the extracted target region to prevent blocking. The detected background area may be used to adjust the brightness value of the entire background area.

이상 설명한 바와 같이, 본 발명에 따르면, 문자와 그림이 혼재된 문서영상에서 화소값의 변화량이 작은 배경영역을 검출하여 타겟영역을 추출함으로써, 문자영역과 그림영역을 구분하는 경우 추출된 타겟영역의 범위 내에서 문자영역과 그림영역을 구분하게 함으로써, 전체 문서영상에 대해 문자영역과 그림영역을 블럭단위로 구분함에 따라 발생하는 블러킹 현상을 방지할 수 있고, 검출된 배경영역을 이용하여 전체적인 배경영역의 밝기값 조절에 사용할 수 있다. As described above, according to the present invention, a target region is detected by extracting a target region having a small amount of change in pixel value from a document image having a mixture of characters and pictures. By separating the text area and the picture area within the range, it is possible to prevent the blocking phenomenon caused by dividing the text area and the picture area by block unit for the entire document image, and to use the detected background area as a whole background area. It can be used to adjust the brightness value of.

또한, 이상에서는 본 발명의 바람직한 실시예에 대해서 도시하고 설명하였으나, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 이러한 변형 실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.In addition, while the preferred embodiment of the present invention has been shown and described, the present invention is not limited to the specific embodiment described above, the technical field to which the invention belongs without departing from the spirit of the invention claimed in the claims. Anyone of ordinary skill in the art as well as various modifications can be made, of course, these modifications should not be understood individually from the technical spirit or prospects of the present invention.

도 1은 혼재문서 화질 개선방법에 대한 종래기술의 일예를 설명하기 위한 흐름도,1 is a flowchart for explaining an example of the related art with respect to a method of improving a mixed document image quality;

도 2는 본 발명에 따른 배경영역 검출에 의한 문서의 타겟영역 추출 장치의 블럭도, 그리고2 is a block diagram of an apparatus for extracting a target region of a document by detecting a background region according to the present invention;

도 3은 본 발명에 따른 배경영역 검출에 의한 문서의 타겟영역 추출 장치의 동작을 설명하기 위한 흐름도이다.3 is a flowchart illustrating an operation of an apparatus for extracting a target region of a document by detecting a background region according to the present invention.

* 도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

200 : 구획부 210 : 변화량 산출부200: division unit 210: change amount calculation unit

220 : 동일 영역 판단부 230 : 그룹화부220: same area determination unit 230: grouping unit

240 : 배경영역 검출부 250 : 타겟영역 추출부240: background area detection unit 250: target area extraction unit

Claims (6)

문자와 그림이 혼재된 문서영상을 소정 크기의 격자로 구획하고, 상기 구획된 각 격자 내 화소값의 변화량을 산출하는 단계;Dividing a document image in which characters and pictures are mixed into a grid having a predetermined size, and calculating a change amount of pixel values in the partitioned grids; 산출된 상기 화소값의 변화량이 소정의 값 이하인 격자를 배경후보격자로 선출하고, 선출된 상기 배경후보격자들을 격자 평균화소값에 기초하여 수개의 그룹으로 그룹화하는 단계;Selecting a lattice whose calculated amount of change in pixel value is equal to or less than a predetermined value as a background post-strigger and grouping the selected background post-striggers into several groups based on a lattice average pixel value; 상기 그룹들 중에서 그룹의 면적 및 그룹의 화소값의 변화량 중 적어도 어느 하나를 비교하여 선택된 그룹을 배경영역을 검출하는 단계; 및Detecting a background area of the selected group by comparing at least one of an area of the group and a change amount of pixel values of the group among the groups; And 상기 문서영상에서 상기 배경영역을 제외한 문자영역 및 그림영역으로 이루어진 타겟영역을 추출하는 단계;를 포함하는 것을 특징으로 하는 배경영역 검출에 의한 문서의 타겟영역 추출 방법.And extracting a target area including a text area and a picture area excluding the background area from the document image. 제 1항에 있어서, The method of claim 1, 상기 격자의 크기는, 상기 문서영상의 1인치당 도트의 수에 따라 결정되는 것을 특징으로 하는 배경영역 검출에 의한 문서의 타겟영역 추출 방법.And a size of the grid is determined according to the number of dots per inch of the document image. 제 1항에 있어서, The method of claim 1, 상기 그룹화하는 단계는,The grouping step, 소정 범위 내의 격자 평균화소값을 갖는 상기 배경후보격자들을 동일 영역으로 판단하는 단계; 및Determining the background candidates having a lattice average pixel value within a predetermined range as the same area; And 상기 동일 영역으로 판단된 수개의 영역과 상기 각 영역 내 격자 평균화소값의 평균값에서 소정 범위 내의 화소값을 가지는 인접한 화소들을 각각 동일 그룹으로 그룹화 하는 단계;를 포함하는 것을 특징으로 하는 배경영역 검출에 의한 문서의 타겟영역 추출 방법.Grouping adjacent pixels having pixel values within a predetermined range from the average value of the plurality of areas determined as the same area and the lattice average pixel values in each area into the same group, respectively. Method of extracting target area of document by text. 제 1항에 있어서,The method of claim 1, 상기 화소값의 변화량을 산출하는 단계 전에, 잡음 및 하프톤으로 인한 오류를 방지하기 위해 상기 문서영상에 대하여 저대역 통과 필터링을 수행하는 단계;를 더 포함하는 것을 특징으로 하는 배경영역 검출에 의한 문서의 타겟영역 추출 방법.And performing a low pass filtering on the document image to prevent an error due to noise and halftones before calculating the amount of change in the pixel value. Method for extracting the target area. 문자와 그림이 혼재된 문서영상을 소정 크기의 격자로 구획하는 구획부;A partition unit for dividing a document image in which characters and pictures are mixed into a grid having a predetermined size; 상기 구획된 각 격자 내 화소값의 변화량을 산출하는 변화량 산출부;A change amount calculator for calculating a change amount of pixel values in the partitioned grids; 산출된 상기 화소값의 변화량이 소정의 값 이하인 각 격자를 배경후보격자로 선출하고, 소정 범위 내의 격자 평균화소값을 갖는 상기 배경후보격자들을 동일 영역으로 판단하는 동일 영역 판단부;An equal area judging unit which selects each lattice having a calculated change amount of the pixel value equal to or less than a predetermined value as a background post compensator and determines the background post compensators having a grid average pixel value within a predetermined range as the same area; 상기 동일 영역으로 판단된 수개의 영역과 상기 각 영역 내 격자 평균화소값에서 소정 범위 내의 화소값을 가지는 인접한 화소들을 각각 동일 그룹으로 그룹화 하는 그룹화부;A grouping unit for grouping the plurality of regions determined as the same region and adjacent pixels having pixel values within a predetermined range from the lattice average pixel values in each region into the same group; 상기 그룹들 중에서 그룹의 면적 및 그룹의 화소값의 변화량 중 적어도 어느 하나를 비교하여 선택된 그룹을 배경영역으로 검출하는 배경영역 검출부; 및A background area detector for comparing the at least one of the area of the group and the amount of change in the pixel value of the group to detect the selected group as the background area; And 상기 문서영상에서 상기 배경영역을 제외한 문자영역 및 그림영역으로 이루어진 타겟영역을 추출하는 타켓영역 추출부;를 포함하는 것을 특징으로 하는 배경영역 검출에 의한 문서의 타겟영역 추출 장치.And a target area extraction unit for extracting a target area including a text area and a picture area excluding the background area from the document image. 제 5항에 있어서,The method of claim 5, 상기 격자의 크기는, 상기 문서영상의 1인치당 도트의 수에 따라 결정되는 것을 특징으로 하는 배경영역 검출에 의한 문서의 타겟영역 추출 장치.And a size of the grid is determined according to the number of dots per inch of the document image.
KR1020040041348A 2004-06-07 2004-06-07 Apparatus for extracting target area of document by detecting background area and method thereof KR20050116224A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040041348A KR20050116224A (en) 2004-06-07 2004-06-07 Apparatus for extracting target area of document by detecting background area and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040041348A KR20050116224A (en) 2004-06-07 2004-06-07 Apparatus for extracting target area of document by detecting background area and method thereof

Publications (1)

Publication Number Publication Date
KR20050116224A true KR20050116224A (en) 2005-12-12

Family

ID=37289904

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040041348A KR20050116224A (en) 2004-06-07 2004-06-07 Apparatus for extracting target area of document by detecting background area and method thereof

Country Status (1)

Country Link
KR (1) KR20050116224A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130066819A (en) * 2011-12-13 2013-06-21 삼성전자주식회사 Apparus and method for character recognition based on photograph image
WO2018012729A1 (en) * 2016-07-14 2018-01-18 삼성전자 주식회사 Display device and text recognition method for display device
US9881561B2 (en) 2014-05-23 2018-01-30 Samsung Electronics Co., Ltd. Electronic device and method of controlling output characteristic thereof
CN108830186A (en) * 2018-05-28 2018-11-16 腾讯科技(深圳)有限公司 Method for extracting content, device, equipment and the storage medium of text image

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130066819A (en) * 2011-12-13 2013-06-21 삼성전자주식회사 Apparus and method for character recognition based on photograph image
US9881561B2 (en) 2014-05-23 2018-01-30 Samsung Electronics Co., Ltd. Electronic device and method of controlling output characteristic thereof
WO2018012729A1 (en) * 2016-07-14 2018-01-18 삼성전자 주식회사 Display device and text recognition method for display device
KR20180007783A (en) 2016-07-14 2018-01-24 삼성전자주식회사 Display apparauts and text recognizing method thereof
US11170247B2 (en) 2016-07-14 2021-11-09 Samsung Electronics Co., Ltd. Display apparatus and text recognizing method thereof
CN108830186A (en) * 2018-05-28 2018-11-16 腾讯科技(深圳)有限公司 Method for extracting content, device, equipment and the storage medium of text image

Similar Documents

Publication Publication Date Title
US7746505B2 (en) Image quality improving apparatus and method using detected edges
US7876959B2 (en) Methods and systems for identifying text in digital images
US20060029280A1 (en) Image processing apparatus, image processing method, and program and storage medium therefor
JPH05252388A (en) Noise removing device
KR100524072B1 (en) Method for improving image quality
US4638369A (en) Edge extraction technique
US8619330B2 (en) Image processing apparatus and image processing method
US6775031B1 (en) Apparatus and method for processing images, image reading and image forming apparatuses equipped with the apparatus, and storage medium carrying programmed-data for processing images
US7145694B2 (en) Image processing apparatus and method
US6411741B1 (en) Image processing apparatus
KR20050116224A (en) Apparatus for extracting target area of document by detecting background area and method thereof
CN101291384B (en) Method for separating image and text and reinforcing text
JPH08237475A (en) Image area separation method, image area separator and image processing method and image processing unit
JP2672553B2 (en) Image processing device
JPH0654180A (en) Method and device for image area separation
JPH0393355A (en) Character area separation system
JP2702133B2 (en) Image processing method
JPH05292312A (en) Dot area separator
JP2006229817A (en) Background detection method, program, recording medium, image processing apparatus, and image forming apparatus
JP3245586B2 (en) Pole pixel detection device
KR100484170B1 (en) Method and apparatus for improvement of digital image quality
JP2005033527A (en) Image processor, image processing method, program and recording medium
JPH03153167A (en) Character area separation system
KR100514734B1 (en) Method and apparatus for improvement of digital image quality
JPH03219774A (en) Picture processor

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid