RU2012148763A - METHOD AND SYSTEM FOR IMPROVING TEXT FOR DIGITAL COPYING OF PRINTED DOCUMENTS - Google Patents

METHOD AND SYSTEM FOR IMPROVING TEXT FOR DIGITAL COPYING OF PRINTED DOCUMENTS Download PDF

Info

Publication number
RU2012148763A
RU2012148763A RU2012148763/08A RU2012148763A RU2012148763A RU 2012148763 A RU2012148763 A RU 2012148763A RU 2012148763/08 A RU2012148763/08 A RU 2012148763/08A RU 2012148763 A RU2012148763 A RU 2012148763A RU 2012148763 A RU2012148763 A RU 2012148763A
Authority
RU
Russia
Prior art keywords
characters
areas
module
groups
scanned image
Prior art date
Application number
RU2012148763/08A
Other languages
Russian (ru)
Other versions
RU2520407C1 (en
Inventor
Илья Васильевич Курилин
Илья Владимирович Сафонов
Original Assignee
Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд."
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." filed Critical Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд."
Priority to RU2012148763/08A priority Critical patent/RU2520407C1/en
Priority to KR1020130055215A priority patent/KR20140063378A/en
Publication of RU2012148763A publication Critical patent/RU2012148763A/en
Application granted granted Critical
Publication of RU2520407C1 publication Critical patent/RU2520407C1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • H04N1/4092Edge or detail enhancement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3256Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document colour related metadata, e.g. colour, ICC profiles
    • H04N2201/326Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document colour related metadata, e.g. colour, ICC profiles relating to the rendering or output medium, device or process, e.g. monitor, paper or printer profile

Abstract

1. Способ улучшения текста при цифровом копировании печатных документов, предусматривающий выполнение следующих операций:- сканируют печатный документ, получая сканированное изображение;- выявляют на сканированном изображении связные области символов;- определяют характерные цвета для групп связных областей символов;- аппроксимируют контуры связных областей символов с помощью последовательностей отрезков линий и сегментов кривых;- выполняют на сканированном изображении растеризацию аппроксимированных контуров с заполнением их внутренней области соответствующими характерными цветами;- печатают модифицированное изображение.2. Способ по п.1, отличающийся тем, что по результатам выявления на сканированном изображении связных областей символов создают маркерное бинарное изображение, определяющее связные области символов на сканированном изображении.3. Способ по п.1, отличающийся тем, что определяют характерные цвета для связных областей символов посредством выполнения следующих операций:- размечают связные области на маркерном бинарном изображении;- определяют на сканированном изображении цвет областей символов, соответствующих размеченным связным областям на маркерном бинарном изображении;- группируют близкорасположенные связные области символов,отличающиеся цветом на величину, не более предопределенного значения;- определяют среднее значение цвета для каждой из указанных групп связных областей символов;- объединяют группы посредством кластеризации средних значений цвета указанных групп;- выбирают центры полученных кластеров в качестве характерных цветов для групп связных областей символ�1. A method for improving text when digitally copying printed documents, which involves the following operations: - scanning a printed document to obtain a scanned image; - identifying connected areas of characters on a scanned image; - determining characteristic colors for groups of connected areas of characters; - approximating the contours of connected areas of characters using sequences of line segments and curve segments; - rasterize approximated contours on a scanned image and fill them inside renney area corresponding characteristic color - print the modified izobrazhenie.2. The method according to claim 1, characterized in that according to the results of the identification of the connected areas of the characters on the scanned image, a marker binary image is created that defines the connected areas of the characters on the scanned image. The method according to claim 1, characterized in that the characteristic colors for the connected areas of the symbols are determined by performing the following operations: - marking the connected areas on the marker binary image; - determining the color of the symbol areas on the scanned image corresponding to the marked connected areas on the marker binary image; - group closely connected connected areas of characters that differ in color by an amount no more than a predetermined value; - determine the average color value for each of these groups connected regions of symbols; - groups are combined by clustering the average color values of the indicated groups; - centers of the resulting clusters are selected as characteristic colors for groups of connected regions of the symbol

Claims (8)

1. Способ улучшения текста при цифровом копировании печатных документов, предусматривающий выполнение следующих операций:1. A way to improve the text in digital copying of printed documents, providing for the following operations: - сканируют печатный документ, получая сканированное изображение;- scan a printed document, receiving a scanned image; - выявляют на сканированном изображении связные области символов;- connected areas of characters are detected on the scanned image; - определяют характерные цвета для групп связных областей символов;- determine the characteristic colors for groups of connected areas of characters; - аппроксимируют контуры связных областей символов с помощью последовательностей отрезков линий и сегментов кривых;- approximate the contours of the connected areas of the characters using sequences of line segments and curve segments; - выполняют на сканированном изображении растеризацию аппроксимированных контуров с заполнением их внутренней области соответствующими характерными цветами;- perform rasterization of the approximated contours on the scanned image with filling their inner area with the corresponding characteristic colors; - печатают модифицированное изображение.- print a modified image. 2. Способ по п.1, отличающийся тем, что по результатам выявления на сканированном изображении связных областей символов создают маркерное бинарное изображение, определяющее связные области символов на сканированном изображении.2. The method according to claim 1, characterized in that according to the results of the identification of the connected areas of the characters on the scanned image, a marker binary image is created that defines the connected areas of the characters on the scanned image. 3. Способ по п.1, отличающийся тем, что определяют характерные цвета для связных областей символов посредством выполнения следующих операций:3. The method according to claim 1, characterized in that the characteristic colors for the connected areas of the characters are determined by performing the following operations: - размечают связные области на маркерном бинарном изображении;- mark the connected areas on the marker binary image; - определяют на сканированном изображении цвет областей символов, соответствующих размеченным связным областям на маркерном бинарном изображении;- determine on the scanned image the color of the symbol areas corresponding to the marked connected areas on the marker binary image; - группируют близкорасположенные связные области символов,отличающиеся цветом на величину, не более предопределенного значения;- group closely spaced connected areas of characters that differ in color by an amount of no more than a predetermined value; - определяют среднее значение цвета для каждой из указанных групп связных областей символов;- determine the average color value for each of these groups of connected areas of characters; - объединяют группы посредством кластеризации средних значений цвета указанных групп;- group together by clustering the average color values of these groups; - выбирают центры полученных кластеров в качестве характерных цветов для групп связных областей символов, соответствующих этим кластерам.- choose the centers of the resulting clusters as characteristic colors for groups of connected symbol regions corresponding to these clusters. 4. Способ по п.1, отличающийся тем, что аппроксимируют контуры связных областей символов с помощью последовательностей отрезков линий и сегментов кривых посредством выполнения следующих операций:4. The method according to claim 1, characterized in that they approximate the contours of the connected regions of the characters using sequences of line segments and curve segments by performing the following operations: - отслеживают точки внешнего и внутренних контуров каждой связной области на маркерном бинарном изображении;- track the points of the external and internal contours of each connected area on the marker binary image; - упрощают контуры связных областей за счет выделения точек перегиба каждого контура;- simplify the contours of the connected areas by highlighting the inflection points of each contour; - аппроксимируют упрощенные контуры связных областей символов с помощью последовательностей отрезков линий и сегментов кривых.- approximate the simplified contours of the connected areas of the characters using sequences of line segments and curve segments. 5. Способ по любому из пп.1 и 3, отличающийся тем, что группируют близкорасположенные связные области символов, отличающиеся цветом на величину, не более предопределенного значения, посредством выполнения следующих операций:5. The method according to any one of claims 1 and 3, characterized in that they group closely connected connected areas of the characters that differ in color by an amount of not more than a predetermined value, by performing the following operations: - вычисляют евклидово расстояние в цветовом пространстве RGB между средними значениями компонентов цвета сравниваемых связных близкорасположенных областей символов;- calculate the Euclidean distance in the RGB color space between the average values of the color components of the compared connected closely spaced areas of the characters; - группируют указанные области символов, если евклидово расстояние между средними значениями цвета этих областей не превышает предопределенного значения.- group the indicated symbol regions if the Euclidean distance between the average color values of these regions does not exceed a predetermined value. 6. Способ по любому из пп.1 и 3, отличающийся тем, что объединяют группы посредством кластеризации средних значений цвета указанных групп за счет выполнения следующих операций:6. The method according to any one of claims 1 and 3, characterized in that the groups are combined by clustering the average color values of these groups by performing the following operations: - выбирают группу близкорасположенных связных областей символов, обладающую наибольшим количеством пикселей сканированного изображения, содержащихся в указанных областях;- choose a group of closely connected connected areas of the characters with the largest number of pixels of the scanned image contained in these areas; - принимают средний цвет выбранной группы за центр кластера;- take the average color of the selected group as the center of the cluster; - включают в текущий кластер еще одну группу близкорасположенных связных областей символов, для которой евклидово расстояние между ее средним цветом и центром кластера не превышает предопределенного значения;- include in the current cluster another group of closely connected connected regions of symbols for which the Euclidean distance between its middle color and the center of the cluster does not exceed a predetermined value; - корректируют центр кластера посредством вычисления нового среднего значения цвета групп, составляющих кластер;- adjust the center of the cluster by calculating a new average color value of the groups that make up the cluster; - повторяют указанные операции до тех пор, пока все группы близкорасположенных связных областей символов не будут включены в соответствующие кластеры.- repeat the indicated operations until all groups of closely connected connected regions of symbols are included in the corresponding clusters. 7. Способ по пп.1 и 4, отличающийся тем, что аппроксимируют упрощенные контуры связных областей символов с помощью последовательностей отрезков линий и сегментов кривых посредством определения координат начала и конца для отрезков линий и координат двух контрольных точек и точек начала и конца сегментов кривых, описанных кубическими кривыми Безье.7. The method according to claims 1 and 4, characterized in that the simplified contours of the connected regions of the symbols are approximated using sequences of line segments and curve segments by determining the coordinates of the beginning and end for line segments and the coordinates of two control points and the start and end points of the curve segments, described by cubic Bezier curves. 8. Система улучшения текста, реализующая способ по п.1, включающая в себя:8. The text improvement system that implements the method according to claim 1, including: - сканирующий модуль, выполненный с возможностью сканирования исходного печатного документа и подачи на выходы сканированного изображения, причем один выход сканирующего модуля соединен с входом модуля сегментации, а второй выход сканирующего модуля соединен с входами модуля определения характерных цветов и модулярастрирования;- a scanning module, configured to scan the original printed document and feed the output of the scanned image, moreover, one output of the scanning module is connected to the input of the segmentation module, and the second output of the scanning module is connected to the inputs of the module for determining characteristic colors and rasterization module; - модуль сегментации текста, выполненный с возможностью создания маркерного бинарного изображения, определяющего текстовые и нетекстовые области на сканированном изображении поступающего на три выхода модуля сегментации текста, причем один выход модуля сегментации текста соединен со вторым входом модуля определения характерных цветов, второй выход модуля сегментации текста соединен с входом модуля векторизации, а третий выход модуля сегментации текста соединен с одним из четырех входов модуля растрирования;- a text segmentation module, configured to create a marker binary image that defines text and non-text areas on a scanned image received at three outputs of a text segmentation module, with one output of the text segmentation module connected to the second input of the characteristic color determination module, the second output of the text segmentation module with the input of the vectorization module, and the third output of the text segmentation module is connected to one of the four inputs of the rasterization module; - модуль определения характерных цветов, выполненный с возможностью выявления групп связных областей символов, отличающихся цветом на величину, не более предопределенного значения, и с возможностью определения характерных цветов для указанных групп; выход модуля определения характерных цветов соединен с одним из четырех входов модуля растрирования;- a module for determining characteristic colors, configured to identify groups of connected areas of characters differing in color by an amount no more than a predetermined value, and with the ability to determine characteristic colors for these groups; the output of the characteristic color determination module is connected to one of four inputs of the rasterization module; - модуль векторизации, выполненный с возможностью аппроксимации контуров связных областей символов на маркерном бинарном изображении с помощью последовательностей отрезков линий и сегментов кривых; выход модуля векторизации соединен с одним из четырех входов модуля растрирования;- a vectorization module, made with the possibility of approximating the contours of the connected areas of the characters on the marker binary image using sequences of line segments and curve segments; the output of the vectorization module is connected to one of the four inputs of the rasterization module; - модуль растрирования, выполненный с возможностью растеризации на сканированном изображении аппроксимированных контуров с заполнением их внутренних областей соответствующими характерными цветами; выход модуля растрирования соединен с входом модуля печати;- rasterization module, configured to rasterize the approximated contours on the scanned image with filling their inner areas with the corresponding characteristic colors; the output of the screening module is connected to the input of the print module; - модуль печати, выполненный с возможностью печати модифицированного изображения. - print module, configured to print a modified image.
RU2012148763/08A 2012-11-16 2012-11-16 Method and system of text improvement at digital copying of printed documents RU2520407C1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2012148763/08A RU2520407C1 (en) 2012-11-16 2012-11-16 Method and system of text improvement at digital copying of printed documents
KR1020130055215A KR20140063378A (en) 2012-11-16 2013-05-15 Image forminag apparatus, method for image forming and computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2012148763/08A RU2520407C1 (en) 2012-11-16 2012-11-16 Method and system of text improvement at digital copying of printed documents

Publications (2)

Publication Number Publication Date
RU2012148763A true RU2012148763A (en) 2014-05-27
RU2520407C1 RU2520407C1 (en) 2014-06-27

Family

ID=50774946

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012148763/08A RU2520407C1 (en) 2012-11-16 2012-11-16 Method and system of text improvement at digital copying of printed documents

Country Status (2)

Country Link
KR (1) KR20140063378A (en)
RU (1) RU2520407C1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021150226A1 (en) 2020-01-23 2021-07-29 Hewlett-Packard Development Company, L.P. Determining minimum scanning resolution
WO2021150231A1 (en) * 2020-01-23 2021-07-29 Hewlett-Packard Development Company, L.P. Region of interest extraction from reference image using object map

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2081406C (en) * 1991-12-23 1997-09-16 Chinmoy Bhusan Bose Method and apparatus for connected and degraded text recognition
US5790126A (en) * 1995-01-03 1998-08-04 Microsoft Corporation Method for rendering a spline for scan conversion of a glyph
RU2260208C2 (en) * 2003-08-21 2005-09-10 Войсковая часть 45807 Method for facsimile recognition and reproduction of printed product text
RU2365510C1 (en) * 2008-01-23 2009-08-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Way of forming of symbols for microprinting

Also Published As

Publication number Publication date
KR20140063378A (en) 2014-05-27
RU2520407C1 (en) 2014-06-27

Similar Documents

Publication Publication Date Title
US9390357B2 (en) Readable matrix code
US9137422B2 (en) Image processing in contone space and halftone space
US10922801B2 (en) Channel-based binarization of color
CN103177279A (en) Four dimensional (4d) color barcode for high capacity data encoding and decoding
TW200847064A (en) Multi-color dropout for scanned document
US8086040B2 (en) Text representation method and apparatus
US9665944B2 (en) Image processing apparatus and non-transitory computer readable recording medium storing an image processing program with improved duplication of characters against a background image
US10506134B2 (en) Apparatus, method, and program for processing image
CN104361335B (en) A kind of processing method that black surround is automatically removed based on scan image
CN107346580A (en) Billing information recognition methods and device
CN105760869B (en) Examination paper marking method based on image gray level recognition and processing
CN104935784A (en) Image processing apparatus and image processing method
RU2012148763A (en) METHOD AND SYSTEM FOR IMPROVING TEXT FOR DIGITAL COPYING OF PRINTED DOCUMENTS
US9438767B2 (en) Image processing apparatus, image processing method, and storage medium
US8989493B1 (en) Method and apparatus for identifying regions of an image to be filtered during processing of the image
JP5335581B2 (en) Image processing apparatus, image processing method, and program
CN108701204A (en) A kind of method and device of one-dimension code positioning
JP2016184914A (en) Image processing apparatus
CN104778432A (en) Image recognition method
CN107852445B (en) Image processing apparatus
US9411543B2 (en) Image processing apparatus
US20120159292A1 (en) Method of processing an object-based image file with content type dependent image processing algorithms
CN111491069B (en) Automatic setting method for color mode of document image
JP2013054547A (en) Object recognition device and object recognition method
CN114898001A (en) Color enhancement method, color enhancement device, image forming apparatus, and storage medium

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner
PC41 Official registration of the transfer of exclusive right

Effective date: 20170921

PD4A Correction of name of patent owner
MM4A The patent is invalid due to non-payment of fees

Effective date: 20191117