KR20050106810A - Method and apparatus for processing of binary image - Google Patents

Method and apparatus for processing of binary image Download PDF

Info

Publication number
KR20050106810A
KR20050106810A KR1020040031852A KR20040031852A KR20050106810A KR 20050106810 A KR20050106810 A KR 20050106810A KR 1020040031852 A KR1020040031852 A KR 1020040031852A KR 20040031852 A KR20040031852 A KR 20040031852A KR 20050106810 A KR20050106810 A KR 20050106810A
Authority
KR
South Korea
Prior art keywords
symbol
image
binary image
binary
region
Prior art date
Application number
KR1020040031852A
Other languages
Korean (ko)
Other versions
KR101024027B1 (en
Inventor
이종현
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020040031852A priority Critical patent/KR101024027B1/en
Priority to US11/110,790 priority patent/US20050281463A1/en
Publication of KR20050106810A publication Critical patent/KR20050106810A/en
Application granted granted Critical
Publication of KR101024027B1 publication Critical patent/KR101024027B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32203Spatial or amplitude domain methods
    • H04N1/32261Spatial or amplitude domain methods in binary data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/4115Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/413Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information
    • H04N1/415Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information in which the picture-elements are subdivided or grouped into fixed one-dimensional or two-dimensional blocks

Abstract

이진 화상 처리방법 및 장치가 개시된다. 본 발명에 따른 이진 화상 처리 방법은, 영상소스로부터 인가되는 이진 화상을 소정 영역으로 분할하고, 분할된 각 영역을 구성하는 화상이 심볼화상인지 비심볼화상인지를 판단하는 단계와, 심볼화상으로 구성된 것으로 판단되는 영역들을 대상으로 심볼화상영역 내에 존재하는 심볼을 검색하는 단계 및 검색된 심볼의 윤곽을 추적하고, 윤곽 추적이 완료되면 이진 화상으로부터 추적이 완료된 심볼을 추출하는 단계를 포함한다. 이에 의해, 이진 화상 압축시 싱글톤이 발생하는 것을 줄일 수 있다.A binary image processing method and apparatus are disclosed. The binary image processing method according to the present invention comprises the steps of dividing a binary image applied from an image source into a predetermined region, and determining whether the image constituting each divided region is a symbol image or a non-symbol image, and comprising a symbol image. Searching for a symbol existing in the symbol image area for areas determined to be traced, and tracking the outline of the retrieved symbol, and extracting the completed symbol from the binary image when the trace of the outline is completed. This can reduce the occurrence of singletons in binary image compression.

Description

이진 화상 처리방법 및 장치{Method and apparatus for processing of binary image}Binary image processing method and apparatus {Method and apparatus for processing of binary image}

본 발명은 이진 화상 처리방법 및 장치에 관한 것으로, 보다 상세하게는, 이진 화상을 심볼 매칭 부호화 방식으로 압축하고자 하는 경우 효율적인 부호화를 위해 이진 화상으로부터 심볼들을 추출해 내는 이진 화상 처리방법 및 장치에 관한 것이다.The present invention relates to a binary image processing method and apparatus, and more particularly, to a binary image processing method and apparatus for extracting symbols from a binary image for efficient encoding when a binary image is to be compressed by a symbol matching coding scheme. .

이진 화상에 대한 무손실 압축 방식으로는 MH(Modified Huffman), MR(Modified READ), MMR(Modified Modified READ), JBIG(Joint Bi-level Image experts Group) 등이 적용되고 있다. 이 중 MR, MMR 방식은 G3, G4 팩스 등에 응용된 부호화 알고리즘이며, JBIG은 콘텍스트(context)에 기초한 산술부호화 알고리즘이다. 최근에는 이진 화상에 대한 부호화 방식으로 손실 및 무손실 부호화가 가능한 JBIG2가 표준화된 상태이며, JBIG2는 심볼(symbol) 매칭에 기반한 부호화 방식을 채용하고 있다. As a lossless compression method for binary images, Modified Huffman (MH), Modified READ (MR), Modified Modified READ (MMR), and Joint Bi-level Image experts Group (JBIG) are applied. Among them, MR and MMR methods are encoding algorithms applied to G3 and G4 fax machines. JBIG is an arithmetic encoding algorithm based on a context. Recently, JBIG2, which is capable of lossy and lossless encoding, has been standardized as a coding method for binary images, and JBIG2 employs an encoding method based on symbol matching.

심볼 매칭에 기반한 부호화 방식을 살펴보면, 먼저, 입력되는 이진 화상으로부터 심볼을 추출하고, 추출된 심볼과 유사한 심볼이 사전(Dictionary) 또는 라이브러리(Library)에 존재하는지를 검색한다. 이 때, 심볼로 추출되는 화상은 문자(text)와 같은 화상을 의미한다. Referring to the encoding scheme based on symbol matching, first, a symbol is extracted from an input binary image, and a symbol similar to the extracted symbol is searched for in a dictionary or a library. At this time, the image extracted as a symbol means an image such as text.

상기 검색결과 사전 또는 라이브러리에 추출된 심볼과 유사한 심볼이 존재하는 것으로 판단된 경우에는 사전에 저장되어 있는 심볼의 인덱스(index) 정보를 이용하여 부호화한다. 이와 달리, 사전에 추출된 심볼과 유사한 심볼이 존재하지 않는 경우에는 추출된 심볼을 새롭게 등록하는 방식으로 부호화한다.If it is determined that a symbol similar to the extracted symbol exists in the dictionary or library, the information is encoded using index information of a symbol stored in the dictionary. On the other hand, if a symbol similar to a previously extracted symbol does not exist, the extracted symbol is encoded by newly registering.

상기와 같은 심볼 매칭에 기반한 부호화 방식은 텍스트나 기호와 같이 심볼로 구분되는 화상 데이터를 부호화하는데 있어서는 효율적이나, 라인-아트나 하프톤 이미지와 같은 화상 데이터를 부호화하는데 있어서는 압축률을 저하시키기 때문에 비효율적이다. 일반적으로, 이진 화상으로 구성된 문서에는 텍스트 및 기호 등과 같이 심볼로 구분되는 화상과, 라인 아트 및 하프톤 이미지와 같이 비심볼로 구분되는 화상이 혼재되어 있다. 따라서, 심볼 매칭에 기반한 부호화 방식을 이용하여 심볼로 구분되는 화상과 비심볼로 구분되는 화상이 혼재되어 있는 문서를 부호화시키는 경우 전체적으로 압축률이 낮아지므로 비효율적이다.The encoding scheme based on the symbol matching is efficient in encoding image data divided into symbols, such as text and symbols, but is inefficient because it lowers the compression ratio in encoding image data such as line-art or halftone images. . In general, a document composed of binary images contains images separated by symbols such as text and symbols, and images separated by nonsymbols such as line art and halftone images. Therefore, when encoding a document in which an image divided by a symbol and an image divided by a non-symbol are mixed by using an encoding method based on symbol matching, the compression ratio is lowered as a whole, which is inefficient.

이러한 문제점을 해결하기 위하여, RLSA(Run Length smearing Algorithm), RXYC(Recursive X-Y Cut) 및 Docstrum과 같은 방법을 이용하여 이진 화상을 소정 특징을 갖는 부분 화상으로 분할한 후 압축 처리하였다. 그러나, 이러한 방법들은 계산량이 많거나, 많은 메모리를 요구하므로 주로 문자 인식이나 문서 구조 해석의 분야에만 적용되고 있다. In order to solve this problem, binary images are divided into partial images having predetermined characteristics and then compressed by using methods such as RLSA (Run Length smearing Algorithm), RXYC (Recursive X-Y Cut), and Docstrum. However, since these methods require a large amount of computation or a large amount of memory, they are mainly applied to the fields of character recognition or document structure interpretation.

한편, 상기와 같은 방법으로 이진 화상을 분할하는 경우 분할된 화상의 경계부분에 심볼들이 존재하게 되는데, 이러한 심볼들로 인해 압축 처리시 싱글톤(singleton)이 발생하고, 이진 화상의 압축률로 낮아지는 단점이 있다. On the other hand, when dividing a binary image in the above manner, symbols exist at the boundary of the divided image. Due to these symbols, a singleton is generated during the compression process, and the compression rate of the binary image is reduced. There are disadvantages.

본 발명이 이루고자 하는 기술적 과제는, 이진 화상의 효율적인 부호화를 위하여 이진 화상으로부터 심볼 매칭에 사용되는 심볼들을 효율적으로 추출해 내는 이진 화상에서의 심볼 추출방법 및 장치를 제공하는 데 있다.SUMMARY OF THE INVENTION The present invention has been made in an effort to provide a method and apparatus for extracting a symbol from a binary image which efficiently extracts symbols used for symbol matching from the binary image for efficient encoding of the binary image.

상기와 같은 기술적 과제를 해결하기 위한, 본 발명에 따른 이진 화상 처리 방법은, 영상소스로부터 인가되는 이진 화상을 소정 영역으로 분할하고, 분할된 상기 각 영역을 구성하는 화상이 심볼화상인지 비심볼화상인지를 판단하는 단계; 상기 심볼화상으로 구성된 것으로 판단되는 영역들을 대상으로 상기 심볼화상영역 내에 존재하는 심볼을 검색하는 단계; 및 상기 검색된 심볼의 윤곽을 추적하고, 상기 윤곽 추적이 완료되면 상기 추적이 완료된 심볼을 상기 이진 화상으로부터 추출하는 단계를 포함한다.In order to solve the above technical problem, the binary image processing method according to the present invention divides a binary image applied from an image source into a predetermined region, and determines whether the image constituting each of the divided regions is a symbol image or a non-symbol image. Determining cognition; Searching for a symbol existing in the symbol image area for regions determined to be composed of the symbol image; And tracing the outline of the retrieved symbol, and extracting the traced symbol from the binary image when the outline tracking is completed.

바람직하게는, 상기 윤곽 추적대상 심볼이 상기 비심볼화상영역에 포함되어 있는지를 판단하는 단계를 더 포함하며, 상기 추출단계는 상기 윤곽 추적대상 심볼이 상기 비심볼화상영역에 포함되어 있는 것으로 판단되는 경우, 상기 비심볼화상영역까지 추적한다.Preferably, the method further includes determining whether the contour tracking object symbol is included in the non-symbol image area, and wherein the extracting step is determined to include the contour tracking object symbol in the non-symbol image area. If so, the non-symbol image area is traced.

또한, 기 작성된 사전에 상기 추출된 심볼에 대응하는 유사심볼이 존재하는지를 검색하는 단계; 및 상기 사전에 상기 추출된 심볼에 대응하는 상기 유사심볼이 존재하지 않는 경우, 상기 추출된 심볼을 상기 사전에 추가하는 단계를 더 포함한다.The method may further include searching for whether a similar symbol corresponding to the extracted symbol exists in a previously created dictionary; And if the similar symbol corresponding to the extracted symbol does not exist in the dictionary, adding the extracted symbol to the dictionary.

한편, 상기와 같은 기술적 과제를 해결하기 위한, 본 발명에 따른 이진 화상 처리 장치는, 영상소스로부터 인가되는 이진 화상을 소정 영역으로 분할하고, 분할된 상기 각 영역으로부터 상기 각 영역을 구성하는 화상에 대한 적어도 하나의 정보를 추출하는 정보 추출부; 추출된 상기 적어도 하나의 정보를 기초로 상기 각 블록을 구성하는 화상이 심볼화상인지 비심볼화상인지를 판단하는 화상 판단부; 및 상기 이진 화상 중 상기 심볼화상으로 구성된 것으로 판단되는 영역을 대상으로 영역 내에 존재하는 심볼을 검색하고, 상기 검색된 심볼의 윤곽을 추적하며, 상기 윤곽 추적이 완료되면 상기 이진 화상으로부터 상기 추적이 완료된 심볼을 추출하는 심볼 추출부를 구비한다.On the other hand, the binary image processing apparatus according to the present invention for solving the above technical problem, divides the binary image applied from the image source into a predetermined region, and from the divided respective regions to the image constituting the respective region. An information extracting unit for extracting at least one information about the unit; An image determining unit determining whether an image constituting each block is a symbol image or a non-symbol image based on the extracted at least one information; And searching for a symbol existing in a region of the binary image, the symbol being included in the symbol image, tracking the outline of the retrieved symbol, and completing the tracking from the binary image when the contour tracking is completed. It has a symbol extraction unit for extracting.

바람직하게는, 상기 심볼 추출부는 상기 윤곽 추적대상 심볼이 상기 비심볼화상영역에 포함되어 있는지를 판단하고, 상기 비심볼화상영역에 포함되어 있는 것으로 판단되는 경우 상기 비심볼화상영역까지 추적한다.Preferably, the symbol extractor determines whether the contour tracking target symbol is included in the non-symbol image area, and tracks the non-symbol image area if it is determined that the symbol is included in the non-symbol image area.

이하, 첨부된 도면들을 참조하여 본 발명을 보다 상세하게 설명한다.Hereinafter, the present invention will be described in more detail with reference to the accompanying drawings.

도 1은 본 발명의 바람직한 실시예에 따른 이진 화상 처리장치에 대한 개략적인 블록도이다.1 is a schematic block diagram of a binary image processing apparatus according to a preferred embodiment of the present invention.

도 1을 참조하면, 이진 화상 처리장치(100)는 스캐너(110), 전처리부(120), 정보 추출부(130), 화상 판단부(140), 심볼 추출부(150), 제1압축부(160) 및 제2압축부(170)를 구비한다.Referring to FIG. 1, the binary image processing apparatus 100 includes a scanner 110, a preprocessing unit 120, an information extracting unit 130, an image determining unit 140, a symbol extracting unit 150, and a first compression unit. And a second compression unit 170.

본 발명에 따른 이진 화상 처리장치(100)는 스캐너(110)와 같은 화상독취장치에 의해 독취된 이진 화상을 효율적으로 부호화 하기 위해, 이진 화상으로부터 심볼 매칭 부호화 방식에 적합한 심볼들을 효율적으로 추출해 낸다.The binary image processing apparatus 100 according to the present invention efficiently extracts the symbols suitable for the symbol matching coding scheme from the binary image in order to efficiently encode the binary image read by the image reading apparatus such as the scanner 110.

스캐너(110)는 스캔 대상 문서를 스캐닝한 후 디지털 신호로 변환하여 출력한다. 스캐너(110)에 의해 디지털 신호로 변환된 이진 화상은 전처리부(120)로 제공된다.The scanner 110 scans a document to be scanned and converts it into a digital signal and outputs the converted digital signal. The binary image converted into a digital signal by the scanner 110 is provided to the preprocessor 120.

전처리부(120)는 스캐너(110)로부터 입력받은 이진 화상에 대한 노이즈 필터링 및 기울기 보정 등과 같은 사전 처리를 수행한다. The preprocessor 120 performs preprocessing such as noise filtering and tilt correction on the binary image received from the scanner 110.

정보 추출부(130)는 전처리된 이진 화상을 소정 영역으로 분할하고, 분할된 각 영역으로부터 각 영역을 구성하는 화상의 특징을 결정하기 위한 적어도 하나의 정보를 추출한다. 여기서, 정보 추출부(130)에 의해 추출되는 정보는 각 영역내의 연결요소(connected component)의 개수 및 각 영역 내에 존재하는 화소들 간의 컬러 변화율 정보 중 적어도 하나를 포함한다. 정보 추출부(130)에 의해 추출된 적어도 하나의 정보는 화상 판단부(140)로 제공된다.The information extracting unit 130 divides the preprocessed binary image into predetermined regions, and extracts at least one information for determining characteristics of the image constituting each region from the divided regions. The information extracted by the information extracting unit 130 may include at least one of the number of connected components in each region and color change rate information between pixels in each region. At least one information extracted by the information extracting unit 130 is provided to the image determining unit 140.

화상 판단부(140)는 정보 추출부(130)에 의해 추출된 연결 요소 개수 정보 및 컬러 변화율 정보를 기초로 각 영역을 구성하는 화상이 심볼화상인지 비심볼화상인지를 판단한다. 여기서, 심볼화상은 문자(text), 기호, 숫자 등과 같이 텍스트로 구분되는 화상을 의미하며, 비심볼화상은 하프톤 이미지와 같은 화상을 의미한다. 본 발명에서는 심볼화상으로 판단되지 않는 화상은 비심볼화상으로 판단한다. 정보 추출부(130)에 의해 소정 영역으로 분할된 각 영역을 구성하는 화상이 심볼화상인지 비심볼화상인지를 판단하는 방법에 대해서는 동출원인에 의해 기 출원된 바 있는 특허 출원번호(P2004-0027983)에 개시되어 있음으로 구체적인 설명은 생략한다.The image determining unit 140 determines whether an image constituting each region is a symbol image or a non-symbol image based on the connection element number information and the color change rate information extracted by the information extracting unit 130. Here, the symbol image means an image divided into texts such as text, symbols, and numbers, and the non-symbol image means an image such as a halftone image. In the present invention, an image not determined to be a symbol image is determined to be a non-symbol image. Patent Application No. P2004-0027983, previously filed by the same applicant, for a method of determining whether an image constituting each area divided into predetermined areas by the information extraction unit 130 is a symbol image or a non-symbol image. Since it is disclosed in the detailed description thereof will be omitted.

심볼 추출부(150)는 이진 화상에 포함된 심볼 검색 동작을 수행하되, 분할된 영역들 중 심볼화상영역으로 판단된 영역에 대해서만 상기 심볼 검색 동작을 수행한다. 심볼 추출부(150)는 심볼화상영역으로 판단된 영역에 존재하는 심볼들을 추출한다. 심볼화상영역에서 심볼이 검색되면, 심볼 추출부(150)는 검색된 심볼의 윤곽(outline)을 추적(trace)하고, 윤곽의 추적이 완료되면 이진 화상으로 부터 추적이 완료된 심볼을 추출해 낸다. 이 때, 윤곽 추적 중인 심볼이 비심볼화상영역에 포함되는 것으로 판단되면, 즉, 심볼이 심볼화상영역과 비심볼화상영역의 사이에 걸쳐 있는 것으로 판단되면, 심볼 추출부(150)는 윤곽 추적 중인 심볼이 포함된 비심볼화상영역까지 추적한다. 따라서, 본 발명에 따르면, 심볼화상영역내에 존재하는 심볼은 물론, 심볼화상영역과 비심볼화상영역 사이에 존재하는 심볼까지 추출한다. 단, 비심볼화상영역 내에 존재하는 심볼에 대해서는 추출하지 않는다. 심볼 추출부(150)에 의해 추출된 심볼들은 제1압축부(160)로 제공된다.The symbol extractor 150 performs a symbol search operation included in the binary image, but performs the symbol search operation only on a region determined as a symbol image region among the divided regions. The symbol extractor 150 extracts the symbols existing in the region determined as the symbol image region. When the symbol is searched in the symbol image area, the symbol extraction unit 150 traces the outline of the found symbol, and when the trace of the outline is completed, extracts the completed symbol from the binary image. At this time, if it is determined that the symbol under contour tracking is included in the non-symbol image area, that is, if it is determined that the symbol spans between the symbol image area and the non-symbol image area, the symbol extracting unit 150 is under contour tracking. Traces up to the non-symbol image area containing the symbol. Therefore, according to the present invention, not only the symbol existing in the symbol image region but also the symbol existing between the symbol image region and the non-symbol image region are extracted. However, symbols existing in the non-symbol image area are not extracted. The symbols extracted by the symbol extraction unit 150 are provided to the first compression unit 160.

제1압축부(160)는 심볼 추출부(150)로부터 입력받은 심볼들을 압축하는 모듈로서, 심볼 매칭에 기반한 압축 알고리즘을 이용하여 압축 처리한다. 여기서, 심볼 매칭에 기반한 압축 알고리즘으로는 JBIG2(Joint Bi-level Image experts Group-2)를 들 수 있다. The first compression unit 160 is a module that compresses the symbols received from the symbol extraction unit 150 and performs a compression process using a compression algorithm based on symbol matching. Here, the compression algorithm based on symbol matching may be Joint Bi-level Image experts Group-2 (JBIG2).

제2압축부(170)는 이진 화상으로부터 심볼들이 제외된 나머지 화상, 즉, 비심볼화상영역으로 판단된 영역에 존재하는 화상을 압축한다. 제2압축부(170)에 적용 가능한 압축 알고리즘으로는 MR(Modified READ), MMR(Modified Modified READ),하프톤 코딩 방식 및 JBIG1 등을 들 수 있다.The second compression unit 170 compresses the remaining image in which the symbols are excluded from the binary image, that is, the image existing in the region determined as the non-symbol image region. Compression algorithms applicable to the second compression unit 170 include MR (Modified READ), MMR (Modified Modified READ), halftone coding scheme, JBIG1, and the like.

도 2는 도 1에 도시된 이진 화상 처리장치에서의 이미지 처리방법을 설명하기 위해 도시한 흐름도 이다. FIG. 2 is a flowchart illustrating an image processing method in the binary image processing apparatus shown in FIG. 1.

도 1 및 도 2를 참조하면, 스캐너(110)로부터 이진 화상이 수신되면(S210), 전처리부(120)는 수신된 이진 화상에 대한 노이즈 필터링 및 기울기 보정 등과 같은 사전 처리를 수행한다(S215).1 and 2, when a binary image is received from the scanner 110 (S210), the preprocessor 120 performs preprocessing such as noise filtering and tilt correction on the received binary image (S215). .

정보 추출부(130)는 전처리된 이진 화상을 소정 영역으로 분할하고(S220), 분할된 각 영역으로부터 각 영역을 구성하는 화상을 판단하기 위한 적어도 하나의 정보를 추출한다. 정보 추출부(130)는 각 영역으로부터 영역내의 연결 요소의 개수 및/또는 영역 내에 존재하는 화소들 간의 컬러 변화율 정보를 추출한다.The information extracting unit 130 divides the preprocessed binary image into predetermined regions (S220), and extracts at least one information for determining an image constituting each region from the divided regions. The information extracting unit 130 extracts the number of connection elements in the region and / or color change rate information between pixels existing in the region from each region.

화상 판단부(140)는 정보 추출부(130)에 의해 추출된 적어도 하나의 정보를 기초로 분할된 각 영역을 구성하는 화상이 심볼화상인지 비심볼화상인지를 판단한다(S225).The image determining unit 140 determines whether an image constituting each divided region is a symbol image or a non-symbol image based on the at least one information extracted by the information extracting unit 130 (S225).

화상 판단부(140)에 의해 각 영역을 구성하는 화상의 종류가 판단되면, 심볼 추출부(150)는 분할된 각 영역 중 심볼화상으로 구성된 것으로 판단된 영역, 즉, 심볼화상영역으로 판단된 영역 내에 존재하는 심볼을 검색한다(S230). 심볼 추출부(150)는 도 3에 도시된 바와 같이, 심볼화상영역으로 판단된 영역을 래스터(raster) 스캔 방향으로 이동하면서 심볼화상영역 내에 존재하는 심볼을 검색한다. 도 3은 화상 판단부(140)에 의해 판단된 결과로 라벨링된 이진 화상을 도시한 도면이다. 도 3에서, 참조부호 'T'로 라벨링된 영역들은 텍스트 데이터로 구성된 것으로 판단된 영역으로, 심볼화상영역을 의미하며, 참조부호 'H' 및 'I'로 라벨링된 영역은 각각 하프톤 화상과 중간화상으로 구성된 것으로 판단된 영역으로, 비심볼화상영역을 의미한다. When the image determining unit 140 determines the type of the image constituting each area, the symbol extraction unit 150 determines an area determined as being composed of a symbol image among the divided areas, that is, an area determined as a symbol image area. The symbol existing within is searched for (S230). As shown in FIG. 3, the symbol extractor 150 searches for a symbol existing in the symbol image region while moving the region determined as the symbol image region in the raster scan direction. 3 is a diagram illustrating a binary image labeled as a result determined by the image determining unit 140. In FIG. 3, areas labeled with 'T' are areas that are determined to be composed of text data, meaning symbol image areas, and areas labeled with 'H' and 'I' respectively represent halftone images and the like. An area judged to be composed of an intermediate image, which means a non-symbol image area.

S235 단계에서 심볼이 검색되면, 심볼 추출부(150)는 검색된 심볼의 윤곽을 설정된 방향(예컨대, 시계방향)으로 추적한다(S235). 추적 중인 심볼이 심볼화상영역과 비심볼상영역 사이에 걸쳐있는 심볼인 경우, 심볼 추출부(150)는 검색된 심볼이 존재하는 비심볼화상영역을 가로지르는 추적을 수행한다(S240, S245). 즉, 심볼 추출부(150)는 도 4에 도시된 바와 같이, 검색된 심볼("S")이 심볼화상영역과 비심볼화상영역 사이에 존재하는 경우, 심볼 추출부(150)는 비심볼화상영역까지 추적을 수행한다.If the symbol is found in step S235, the symbol extraction unit 150 tracks the outline of the found symbol in a set direction (eg, clockwise direction) (S235). If the symbol being traced is a symbol that spans between the symbol image region and the non-symbol image region, the symbol extractor 150 performs tracking across the non-symbol image region where the searched symbol exists (S240, S245). That is, as shown in FIG. 4, when the retrieved symbol "S" exists between the symbol image region and the non-symbol image region, the symbol extractor 150 may include the non-symbol image region. Perform tracing until.

검색된 심볼에 대한 윤곽 추적이 완료되면(S250), 심볼 추출부(150)는 이진 화상으로부터 추적이 완료된 심볼을 추출한다(S255). 도 5는 도 4에 도시된 이진 화상에서 "S" 심볼이 추출된 화상을 도시한 것이다. 도 5에 도시된 바와 같이, 윤곽 추적이 완료된 심볼은 이진 화상으로부터 제거된다. 심볼 추출부(150)에 의해 최종 추출된 심볼들은 제1압축부(160)로 제공된다.When contour tracking for the retrieved symbol is completed (S250), the symbol extractor 150 extracts the completed symbol from the binary image (S255). FIG. 5 shows an image in which an “S” symbol is extracted from the binary image shown in FIG. 4. As shown in Fig. 5, the symbol whose contour tracking has been completed is removed from the binary image. The symbols finally extracted by the symbol extraction unit 150 are provided to the first compression unit 160.

제1압축부(160)는 추출된 심볼들을 사전에 등록된 유사심볼들과 매칭시켜 압축 처리한다(S260). 심볼 매칭 과정을 살펴보면, 심볼 추출부(150)에 의해 추출된 심볼에 대응하는 유사심볼이 기 작성한 사전(dictionary)에 존재하는지를 검색한다. 상기 사전에 추출된 심볼에 대응하는 유사심볼이 존재하는 경우, 사전에 등록된 유사심볼의 인덱스 정보를 이용하여 추출된 심볼을 압축 처리한다. 이와 달리, 상기 사전에 추출된 심볼에 대응하는 유사심볼이 존재하지 않는 것으로 판단되는 경우, 추출된 심볼을 새로운 심볼로 판단하여 사전에 등록한다. 이와 같이, 추출된 심볼 압축 처리시 추출된 심볼의 공간상의 위치 정보에 대해서도 압축처리 한다. The first compression unit 160 matches the extracted symbols with pre-registered similar symbols and compresses the extracted symbols (S260). Referring to the symbol matching process, it is searched whether a similar symbol corresponding to a symbol extracted by the symbol extraction unit 150 exists in a previously created dictionary. If there is a similar symbol corresponding to the previously extracted symbol, the extracted symbol is compressed by using index information of the previously registered similar symbol. In contrast, if it is determined that there is no similar symbol corresponding to the previously extracted symbol, the extracted symbol is determined as a new symbol and registered in advance. In this way, the compression process is also performed on the positional information on the space of the extracted symbol during the extracted symbol compression process.

한편, 도 6은 제2압축부(170)에 의해 압축 처리되는 비심볼화상의 예를 도시한 도면이다. 도 6에 도시된 바와 같이, 이진 화상에서 심볼 추출부(150)에 의해 추출된 심볼화상이 제거된 화상, 즉, 비심볼화상은 제2압축부(170)에 의해 압축 처리된다. 6 is a diagram illustrating an example of a non-symbol image compressed by the second compression unit 170. As illustrated in FIG. 6, an image from which a symbol image extracted by the symbol extraction unit 150 is removed from a binary image, that is, a non-symbol image, is compressed by the second compression unit 170.

이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.While the above has been shown and described with respect to preferred embodiments of the present invention, the present invention is not limited to the specific embodiments described above, it is usually in the technical field to which the invention belongs without departing from the spirit of the invention claimed in the claims. Various modifications can be made by those skilled in the art, and these modifications should not be individually understood from the technical spirit or the prospect of the present invention.

지금까지 설명한 바와 같이, 본 발명에 따르면, 이진 화상을 심볼화상으로 구성된 영역과 비심볼화상으로 구성된 영역으로 구분하고, 심볼화상영역 내에 포함된 심볼들 및 심볼화상영역과 비심볼화상영역 사이에 존재하는 심볼들 만을 추출하여 압축 처리함으로써, 심볼의 정확한 매칭이 가능하며, 싱글톤의 발생을 줄일 수 있는 효과가 있다. As described so far, according to the present invention, a binary image is divided into a region composed of a symbol image and a region composed of a non-symbol image, and is present between symbols included in the symbol image region and between a symbol image region and a non-symbol image region. By extracting and compressing only the symbols to be able to accurately match the symbols, it is possible to reduce the occurrence of a singleton.

도 1은 본 발명의 바람직한 실시예에 따른 이진 화상 처리장치에 대한 개략적인 블록도,1 is a schematic block diagram of a binary image processing apparatus according to a preferred embodiment of the present invention;

도 2는 도 1에 도시된 이진 화상 처리장치에서의 이미지 처리방법을 설명하기 위해 도시한 흐름도, 2 is a flowchart illustrating an image processing method in the binary image processing apparatus shown in FIG. 1;

도 3은 화상 판단부에 의해 판단된 결과로 라벨링된 이진 화상을 도시한 도면,3 shows a binary image labeled as a result judged by the image determining unit;

도 4는 심볼 추출부의 심볼 추적 과정을 설명하기 위해 도시한 도면,4 is a view illustrating a symbol tracking process of a symbol extraction unit;

도 5는 도 4에서 추적이 완료된 심볼이 추출된 화상을 도시한 도면, 그리고,FIG. 5 is a diagram illustrating an image from which a symbol whose tracking has been completed in FIG. 4 is extracted;

도 6은 제2압축부에 의해 압축 처리되는 비심볼화상의 예를 도시한 도면이다.6 is a diagram showing an example of a non-symbol image compressed by the second compression unit.

* 도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

100 : 이진 화상 처리 장치 110 : 스캐너100 binary image processing device 110 scanner

120 : 전처리부 130 : 정보 추출부120: preprocessing unit 130: information extraction unit

140 : 화상 판단부 150 : 심볼 추출부140: image determination unit 150: symbol extraction unit

160 : 제1압축부 170 : 제2압축부160: first compression unit 170: second compression unit

Claims (5)

영상소스로부터 인가되는 이진 화상을 소정 영역으로 분할하고, 분할된 상기 각 영역을 구성하는 화상이 심볼화상인지 비심볼화상인지를 판단하는 단계;Dividing a binary image applied from an image source into a predetermined region, and determining whether the divided image is a symbol image or a non-symbol image; 상기 심볼화상으로 구성된 것으로 판단되는 영역들을 대상으로 상기 심볼화상영역 내에 존재하는 심볼을 검색하는 단계; 및Searching for a symbol existing in the symbol image area for regions determined to be composed of the symbol image; And 상기 검색된 심볼의 윤곽을 추적하고, 상기 윤곽 추적이 완료되면 상기 이진 화상으로부터 상기 추적이 완료된 심볼을 추출하는 단계;를 포함하는 것을 특징으로 하는 이진 화상 처리 방법.Tracing the contour of the retrieved symbol and extracting the trace-completed symbol from the binary image when the contour tracing is completed. 제 1항에 있어서,The method of claim 1, 상기 윤곽 추적대상 심볼이 상기 비심볼화상영역에 포함되어 있는지를 판단하는 단계;를 더 포함하며,Determining whether the contour tracking target symbol is included in the non-symbol image area; 상기 추출단계는 상기 윤곽 추적대상 심볼이 상기 비심볼화상영역에 포함되어 있는 것으로 판단되는 경우, 상기 비심볼화상영역까지 추적하는 것을 특징으로 하는 이진 화상 처리 방법.And the extracting step tracks the non-symbol image region if it is determined that the contour tracking target symbol is included in the non-symbol image region. 제 2항에 있어서,The method of claim 2, 기 작성된 사전에 상기 추출된 심볼에 대응하는 유사심볼이 존재하는지를 검색하는 단계; 및Searching whether there is a similar symbol corresponding to the extracted symbol in a previously created dictionary; And 상기 사전에 상기 추출된 심볼에 대응하는 상기 유사심볼이 존재하지 않는 경우, 상기 추출된 심볼을 상기 사전에 추가하는 단계;를 더 포함하는 것을 특징으로 하는 이진 화상 처리방법.And adding the extracted symbol to the dictionary when the similar symbol corresponding to the extracted symbol does not exist in the dictionary. 영상소스로부터 인가되는 이진 화상을 소정 영역으로 분할하고, 분할된 상기 각 영역으로부터 상기 각 영역을 구성하는 화상에 대한 적어도 하나의 정보를 추출하는 정보 추출부;An information extraction unit for dividing a binary image applied from an image source into a predetermined area and extracting at least one information about an image constituting each area from the divided respective areas; 추출된 상기 적어도 하나의 정보를 기초로 상기 각 블록을 구성하는 화상이 심볼화상인지 비심볼화상인지를 판단하는 화상 판단부; 및An image determining unit determining whether an image constituting each block is a symbol image or a non-symbol image based on the extracted at least one information; And 상기 이진 화상 중 상기 심볼화상으로 구성된 것으로 판단되는 영역을 대상으로 영역 내에 존재하는 심볼을 검색하고, 상기 검색된 심볼의 윤곽을 추적하며, 상기 윤곽 추적이 완료되면 상기 이진 화상으로부터 상기 추적이 완료된 심볼을 추출하는 심볼 추출부;를 포함하는 것을 특징으로 하는 이진 화상 처리 장치.Search for a symbol existing in a region of the binary image determined to be composed of the symbol image, trace the outline of the retrieved symbol, and if the contour tracking is completed, extract the completed symbol from the binary image. And a symbol extracting unit to extract the binary image processing apparatus. 제 4항에 있어서,The method of claim 4, wherein 상기 심볼 추출부는 상기 윤곽 추적대상 심볼이 상기 비심볼화상영역에 포함되어 있는지를 판단하고, 상기 비심볼화상영역에 포함되어 있는 것으로 판단되는 경우 상기 비심볼화상영역까지 추적하는 것을 특징으로 하는 이진 화상 처리 장치.The symbol extracting unit determines whether the contour tracking target symbol is included in the non-symbol image area, and if it is determined that the symbol is included in the non-symbol image area, tracks the binary image to the non-symbol image area. Processing unit.
KR1020040031852A 2004-04-22 2004-05-06 Method and apparatus for processing of binary image KR101024027B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020040031852A KR101024027B1 (en) 2004-05-06 2004-05-06 Method and apparatus for processing of binary image
US11/110,790 US20050281463A1 (en) 2004-04-22 2005-04-21 Method and apparatus for processing binary image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040031852A KR101024027B1 (en) 2004-05-06 2004-05-06 Method and apparatus for processing of binary image

Publications (2)

Publication Number Publication Date
KR20050106810A true KR20050106810A (en) 2005-11-11
KR101024027B1 KR101024027B1 (en) 2011-03-22

Family

ID=37283521

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040031852A KR101024027B1 (en) 2004-04-22 2004-05-06 Method and apparatus for processing of binary image

Country Status (1)

Country Link
KR (1) KR101024027B1 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100289698B1 (en) * 1997-12-20 2001-05-15 전주범 Method and apparatus for coding object information of image object plane
KR100386116B1 (en) * 2000-12-15 2003-06-02 (주) 멀티비아 multimedia data coding and decoding system
JP2003219187A (en) * 2002-01-23 2003-07-31 Canon Inc Image processing method and image processor
US7164797B2 (en) * 2002-04-25 2007-01-16 Microsoft Corporation Clustering

Also Published As

Publication number Publication date
KR101024027B1 (en) 2011-03-22

Similar Documents

Publication Publication Date Title
KR100938099B1 (en) Clustering
US6373981B1 (en) Method and apparatus for segmenting data to create mixed raster content planes
US6404932B1 (en) Apparatus and method of decoding an image using a statistical model based on pixels
JPH07220091A (en) Device and method for image processing
US5751859A (en) Compression of text images by soft pattern matching
US20030012440A1 (en) Form recognition system, form recognition method, program and storage medium
KR100938100B1 (en) Compression of bi-level images with explicit representation of ink clusters
JP3335009B2 (en) Image processing method and image processing apparatus
US20010008564A1 (en) Pattern matching coding device and method thereof
US20050281463A1 (en) Method and apparatus for processing binary image
EP0902398B1 (en) Method and system for compressing and decompressing binary representations of dithered images
US6574367B1 (en) Method and apparatus for pattern matching encoding
US6487311B1 (en) OCR-based image compression
KR101024027B1 (en) Method and apparatus for processing of binary image
Holt A fast binary template matching algorithm for document image data compression
US20060045341A1 (en) Apparatus and method for high-speed character recognition
US6301391B1 (en) Coding apparatus
US6912320B2 (en) Data decompressing method, data decompressing unit, and computer-readable storage medium storing data decompressing program
JP5264675B2 (en) Image processing apparatus and image processing method
JP3323833B2 (en) Image encoding device and image decoding device
KR100595023B1 (en) Binary image segmentation method and apparatus
Shang et al. JBIG2 text image compression based on OCR
JPH10126624A (en) Picture encoding device and picture decoding device
JPH0773273A (en) Pattern segmenting and recognizing method and its system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee