RU2260208C2 - Method for facsimile recognition and reproduction of printed product text - Google Patents

Method for facsimile recognition and reproduction of printed product text Download PDF

Info

Publication number
RU2260208C2
RU2260208C2 RU2003125815/09A RU2003125815A RU2260208C2 RU 2260208 C2 RU2260208 C2 RU 2260208C2 RU 2003125815/09 A RU2003125815/09 A RU 2003125815/09A RU 2003125815 A RU2003125815 A RU 2003125815A RU 2260208 C2 RU2260208 C2 RU 2260208C2
Authority
RU
Russia
Prior art keywords
text
recognized
characters
image
font
Prior art date
Application number
RU2003125815/09A
Other languages
Russian (ru)
Other versions
RU2003125815A (en
Inventor
И.Ф. Королев (RU)
И.Ф. Королев
В.С. Курбатов (RU)
В.С. Курбатов
Original Assignee
Войсковая часть 45807
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Войсковая часть 45807 filed Critical Войсковая часть 45807
Priority to RU2003125815/09A priority Critical patent/RU2260208C2/en
Publication of RU2003125815A publication Critical patent/RU2003125815A/en
Application granted granted Critical
Publication of RU2260208C2 publication Critical patent/RU2260208C2/en

Links

Abstract

FIELD: polygraphy.
SUBSTANCE: method includes conversion of recognized and standard images to digital form, their digital processing by determining coordinates, comparison and determining of match of recognized and standard contours. Determining of coordinates of line of characteristic contour of recognized image of symbol is performed using appropriate standard graphic image by finding value of coordinates X, Y, angle β of position of optical center of text symbols by superposition along area of printed area of digital images - in straight contrast of standard on appropriate recognized in reversed contrast.
EFFECT: higher reliability.
2 cl, 1 dwg

Description

Изобретение относится к области полиграфии, в частности к компьютерной системе обработки текстовой информации и создания текстовых фотоформ средствами интерактивной графики при факсимильном воспроизведении (репродуцировании) текстовых образцов акцидентной печатной продукции.The invention relates to the field of printing, in particular to a computer system for processing text information and creating text photoforms using interactive graphics during facsimile reproduction (reproduction) of text samples of incidental printed products.

В общей полиграфии в зависимости от назначения и использования образцов печатной продукции, а также от требований к степени факсимильности (соответствия) полученных тиражный печатных оттисков к оригиналам (эталонам) применяются различные системы и способы автоматического и полуавтоматического распознавания и воспроизведения графем знаков текста с соответствующим созданием текстовых фотоформ и получения печатных оттисков одним из способов печати.In general printing, depending on the purpose and use of samples of printed products, as well as on the requirements for the degree of facsimileness (conformity) of the obtained print runs to the originals (standards), various systems and methods for automatically and semi-automatically recognizing and reproducing grafts of text characters with the corresponding creation of text photoforms and obtaining prints one of the printing methods.

Согласно теоретических положений распознавания образов (Горелик А.П., Скрыпник В.А. Методы распознавания. М., Высшая школа, 1977) и требований к точности воспроизведения геометрических параметров изображений на полиграфической репродукции (Лахимова Е.А. Контроль размеров и формы изображений в фоторепродукционных процессах. Р.Ж Полиграфическая промышленность. Вып.1, с.40, Москва, "Книга", 1975) критериями факсимильности являются различительные пороги. Такие пороги, расчитанные из условий сравнительной оценки при визуальном восприятии репродукции и оригинала, в изменямых толщинах штрихов составляют ±5-10 мкм.According to the theoretical principles of pattern recognition (Gorelik A.P., Skrypnik V.A. Recognition methods. M., Vysshaya shkola, 1977) and the requirements for the accuracy of reproducing the geometric parameters of images on printing reproductions (Lakhimova EA. Image size and shape control in photographic reproduction processes. R. Zh. Printing industry. Issue 1, p.40, Moscow, “Book”, 1975) the facsimile criteria are distinguishing thresholds. Such thresholds, calculated from the conditions of a comparative assessment in the visual perception of the reproduction and the original, in variable strokes are ± 5-10 microns.

В известном фототелеграфном способе факсимильной связи автоматизированная обработка и воспроизведение газетного текста осуществляются в технологическом цикле "оттиск с наборной формы (оригинал) → фотоотпечаток (фотоформа) → тиражные оттиски с матриц (стереотипов)" (Витт А.А. Определение оптимальных параметров технологического процесса децентрализованного выпуска газет с использованием фототелеграфной передачи. Автореферат кандидатской диссертации. М., 1971). Способ заключается в том, что оттиск, отпечатанный с оригинальной формы текстового набора и растрированных изображений, сканируется в аналоговом режиме в продольном или кадровом направлении развертки. Сигналы с фотоэлектрического преобразователя после формирования и трансформирования по спектру подаются в канал связи с частотой 240 кГц. В пункте приема электрические сигналы управляют действием газоразрядной лампы, экспонирующей фотоматериал. Полученная после фотографической обработки факсимильная негативная фотокопия используется для изготовления печатной формы или ее стереотипов и получения тиража печатных оттисков. За критерий оценки точности воспроизведения знаков шрифта по их печатному очку принята величина абсолютной деформации вертикальных и горизонтальных штрихов. Такие отклонения даже при воспроизведении качественного оттиска оригинала на мелованной бумаге составляют ±13% (20-40 мкм) и выходят за пороги неразличимости, что нарушает в отдельных гарнитурах шрифта единство его построения. Причиной абсолютных деформаций элементов изображения знаков шрифта являются систематические апертурные искажения, возникающие при электронно-оптическом анализе и распознавании изображений развертывающим элементом, а также неравномерность амплитудно-частотных характеристик, шумов, селективных помех и случайных расхождений мгновенных скоростей передатчика и приемника. Данный способ обеспечивает факсимильность на тиражных оттисках с матриц (стереотипов) лишь общую гарнитуру шрифта и в пределах порогов и зон неразличимости такие параметры, как интерлиньяж и выключку строк, высоту и ширину полос текстового набора.In the well-known photo-telegraph facsimile method, automated processing and reproduction of newspaper text is carried out in the technological cycle "print from a typeset (original) → photo print (photoform) → print runs from matrices (stereotypes)" (A. Witt. Determination of optimal parameters of a decentralized technological process newspapers using photo telegraphic transfer. Abstract of the dissertation. M., 1971). The method consists in the fact that the print printed from the original form of the text set and the rasterized images is scanned in analogue mode in the longitudinal or frame scanning direction. The signals from the photoelectric transducer after the formation and transformation of the spectrum are fed into the communication channel with a frequency of 240 kHz. At the receiving point, the electrical signals control the action of the discharge lamp exhibiting the photographic material. The facsimile negative photocopy obtained after photographic processing is used to make a printed form or its stereotypes and to obtain a print run of prints. For the criterion for assessing the accuracy of the reproduction of font characters according to their printing point, the absolute deformation of vertical and horizontal strokes is taken. Such deviations, even when reproducing a high-quality print of the original on coated paper, are ± 13% (20-40 microns) and go beyond the threshold of indistinguishability, which violates the unity of its construction in certain typefaces. The cause of the absolute deformations of the image elements of the font characters is the systematic aperture distortions arising from the electron-optical analysis and recognition of images by the developing element, as well as the unevenness of the amplitude-frequency characteristics, noise, selective interference, and random discrepancies in the instantaneous speeds of the transmitter and receiver. This method provides facsimile on prints from matrices (stereotypes) only a common typeface and, within thresholds and indistinguishable areas, such parameters as leading and turning off lines, height and width of text types.

Существующие в настоящее время способы автоматического распознавания изображений основаны на использовании соответствующих эталонных изображений (Патент (19) ЕПВ (ЕР), (11) заявка №0114248, кл. МКИ G 06 К 9/78, УДК 681.32, публ. 84.08.01, №31, патент (19) ЕПВ (ЕР), (11) заявка №115462, (51) МКИ G 06 К 9/30, (53) УДК 681.327, публ. 64.08.08, №32).Currently existing methods for automatic image recognition are based on the use of appropriate reference images (Patent (19) EPO (EP), (11) application No. 0114248, class MKI G 06 K 9/78, UDC 681.32, publ. 84.08.01, No. 31, patent (19) EPO (EP), (11) application No. 115462, (51) MKI G 06 K 9/30, (53) UDC 681.327, publ. 64.08.08, No. 32).

Наиболее близким к заявляемому техническому решению является запатентованный способ по заявке №115462 (прототип). Способ влючает преобразование в цифровую форму распознаваемого изображения и эталонного изображения, определение координат распознаваемого и эталонного изображений, сравнение и определение совпадения распознаваемого контура и эталонного контура. Например, система распознавания и воспроизведения заполненных форм ABBYY Fine Reader 6.0 предназначена для ввода в компьютер с помощью сканера текстов, заполненных анкет, регистрационных карточек и т.п. Система обеспечивает распознавание считанных изображений знаков печатного текста путем сравнения с эталонными знаками компьютерного каталога гарнитур шрифта и переводит эти текстовые оригиналы в электронный вид - в редактируемые файлы, как правило, формата (DOC) с версткой текста, в которой необходимый размер строк достигается путем равномерного увеличения межсловных и межбуквенных расстояний (апрошей). После сканирования система распознает полученные графемы знаков и выделяет цветом все сомнительные символы. Изображения с такими пометками передаются на верификацию для сопоставления с оригиналом и проверки орфографии и синтаксиса текста.Closest to the claimed technical solution is the patented method according to the application No. 115462 (prototype). The method includes digitizing the recognized image and the reference image, determining the coordinates of the recognized and reference images, comparing and determining the coincidence of the recognized circuit and the reference circuit. For example, ABBYY Fine Reader 6.0, a system for recognizing and reproducing completed forms, is designed to enter texts, completed questionnaires, registration cards, etc. into a computer using a scanner. The system provides recognition of read images of characters of printed text by comparison with the reference characters of the computer font type catalog and translates these text originals into electronic form - into editable files, usually of the format (DOC) with the layout of the text, in which the required line size is achieved by uniform increase spacing and letter spacing (aprosh). After scanning, the system recognizes the received graphemes of signs and highlights all doubtful symbols with color. Images with such marks are sent for verification to compare with the original and check spelling and syntax of the text.

Данный способ распознавания изображений, отпечатанных с широким диапазоном качества печати, где пространственный спектр помех в виде пятен и точек перекрывается со спектром самого изображения, где знаки текста имеют непропечатки, неконтрастные и размытые изображения, дефекты в виде сливающихся загрязненных элементов параллельных штрихов, разрывы линий и неравномерности толщин, а кроме того, перекос строк не обеспечивает необходимую достоверность распознавания, так как процент знаков, имеющих те или иные искажения, достаточно велик. В результате все сомнительные знаки текста неоднозначно классифицируются, с большими ошибками, плохо распознаются и требуют много времени на процесс верификации. Кроме того, способ не обеспечивает требуемой факсимильности при воспроизведении геометрических параметров верстки текста. При распознавании текста может иметь место использование другой похожей гарнитуры шрифта, угрубление общего контура графемы знака шрифта, нарушение соотношений в толщинах основных штрихов символов по отношению к оригиналу и наборной верстке сплошного текста. Имеют место нарушения в длине фраз текста, межсловных расстояний и величинах апрошей, переносе слов при выключке текста по отношению к оригиналу, что очень важно, ибо от композиционно-целостного текста зависит его факсимильное зрительное восприятие.This method of recognition of images printed with a wide range of print quality, where the spatial spectrum of noise in the form of spots and dots overlaps with the spectrum of the image itself, where the text characters have unprints, opaque and blurry images, defects in the form of merging contaminated elements of parallel strokes, line breaks and uneven thicknesses, and in addition, the skew of the lines does not provide the necessary accuracy of recognition, since the percentage of characters having certain distortions is quite large. As a result, all doubtful characters of the text are ambiguously classified, with large errors, poorly recognized and require a lot of time for the verification process. In addition, the method does not provide the required facsimile when reproducing the geometric parameters of the layout text. When recognizing the text, the use of another similar font typeface, coarsening of the general outline of the grapheme of the font sign, violation of the ratios in the thicknesses of the main character strokes with respect to the original and typesetting of solid text can take place. Violations occur in the length of the text phrases, interword spacings and the size of the samples, word wrap when the text is turned off in relation to the original, which is very important, because its facsimile visual perception depends on the compositionally integrated text.

Основная задача настоящего изобретения состоит в обеспечении достоверности распознавания знаков текста печатной продукции и достижении факсимильного воспроизведения очка печатных знаков шрифта любых гарнитуро-кеглей и наборной верстки в широком диапазоне качества печати.The main objective of the present invention is to ensure the recognition of text characters of printed materials and achieve facsimile reproduction of the point of the printed characters of the font of any typeface size and typesetting in a wide range of print quality.

Положительный результат достигается тем, что определение координат линии характеристического контура распознаваемого и эталонного изображений, сравнение и определение совпадения каждого распознаваемого изображения знаков шрифта оригинала с эталонными знаками (знаками шрифтоносителя), имеющими то же самое начертание и кегль, производят дополнительно по площади их печатного очка оптическим наложением и равномерным совмещением позитивного (в прямом контрасте) эталонного изображения на соответствующее негативное (в обратном контрасте) распознаваемое изображение. Определение координат линии характеристического контура распознаваемого изображения производят с помощью соответствующего эталонного изображения путем нахождения местоположения оптического центра знаков шрифта на оригинале при совмещении и равномерном перекрытии по площади печатного очка одноименных знаков текста. В качестве эталонного шрифта при выполнении операции сравнения используют гарнитуру знаков текста распознаваемого изображения, оптимизированных по качеству печатного очка, кеглю и ширине с целью обеспечения единства их гарнитурного построения и создания электронного шрифтоносителя.A positive result is achieved in that the determination of the coordinates of the line of the characteristic contour of the recognized and reference images, the comparison and determination of the coincidence of each recognized image of the characters of the original font with reference characters (characters of the font carrier) having the same style and size, is additionally carried out by the optical print area of their superimposing and evenly combining a positive (in direct contrast) reference image on the corresponding negative (in reverse contrast e) a recognizable image. The coordinates of the line of the characteristic contour of the recognized image are determined using the corresponding reference image by finding the location of the optical center of the font characters on the original while combining and uniformly overlapping the printed area of the same characters of the text. As a reference font, when performing the comparison operation, a headset of text characters of the recognized image is used, optimized for the quality of the printing point, size and width in order to ensure the unity of their typeface construction and the creation of an electronic font carrier.

Операцию сравнения распознаваемого и эталонного изображений производят по предварительной интерактивной разметке распознаваемого изображения текста оригинала путем определения и нахождения осевых линий контуров знаков и выделения по ним левой и правой границ полосы набора текста, верхней и нижней линии шрифта и интерлиньяжа строк.The operation of comparing the recognized and reference images is performed by preliminary interactive marking of the recognized image of the text of the original by determining and finding the axial lines of the contours of characters and highlighting the left and right borders of the typing strip, the upper and lower lines of the font and the leading lines.

Таким образом, верификация символов распознаваемого текста печатной продукции оптическим наложением и совмещением одноименных знаков текста, а также определение координат местоположения оптического центра знаков шрифта на оригинале повышает достоверность распознавания знаков текста печатной продукции и обеспечивает факсимильность воспроизведения очка и верстки печатных знаков шрифта любых гарнитуро-кеглей и наборной верстки текста.Thus, verification of characters of recognizable text of printed products by optical overlapping and combining the same characters of the text, as well as determining the coordinates of the optical center of the font characters on the original, increases the accuracy of recognition of text characters of printed products and ensures facsimile reproduction of the point and layout of printed characters of the font of any typeface typesetting text.

Возможность осуществления изобретения поясняется представленной блок-схемой способа факсимильного распознавания и воспроизведения текста печатной продукции.The possibility of carrying out the invention is illustrated by the presented flowchart of the method of facsimile recognition and reproduction of the text of the printed matter.

Способ факсимильного распознавания и воспроизведения текста печатной продукции включает два этапа: этап создания и факсимильного воспроизведения шрифтоносителя (эталона) на основе графического и метрического анализа шрифта и этап распознавания и воспроизведения изображения текста печатной продукции. Причем второй этап включает в себя два уровня распознавания. Первый уровень - распознавание путем сравнения с эталонами всех классов шрифта воспроизводимого изображения текста системой ABBYY Fine Reader 6.0, и второй - программными методами и методом интерактивной графики - более точное сравнение и определение совпадения по графическим и метрическим характеристикам параметров шрифта и особенностям наборной верстки распознанного изображения оптическим наложением и последовательным или выборочным совмещением с эталонами, набор знаков которых представляют факсимильно распознанные изображения знаков оригинала.The method of facsimile recognition and reproduction of text in printed materials includes two stages: the stage of creation and facsimile reproduction of the type medium (standard) based on graphic and metric analysis of the font, and the step of recognizing and reproducing the image of text in printed matter. Moreover, the second stage includes two levels of recognition. The first level is recognition by comparison with the standards of all font classes of the reproduced image of the text with the ABBYY Fine Reader 6.0 system, and the second - by software and interactive graphics methods - more accurate comparison and determination of the coincidence of the graphic and metric characteristics of the font parameters and the features of the typeset layout of the recognized image by optical overlay and sequential or selective combination with standards, the set of characters of which represent facsimile recognized images of the signs of iginal.

На первом этапе проводят графический и метрический анализ знаков шрифта и определяют способ печати текста оригинала. Вводят изображение текста в компьютер с помощью сканера с разрешением 1200 dpi в цветовом режиме RGB Color 24 bit на пиксель и переводят текстовое изображение оригинала в электронный вид.At the first stage, a graphic and metric analysis of the characters of the font is carried out and the method of printing the text of the original is determined. Enter the image of the text into the computer using a scanner with a resolution of 1200 dpi in the color mode RGB Color 24 bit per pixel and translate the text image of the original in electronic form.

Далее на экране монитора в увеличенном масштабе до 50 крат на печатном изображении текста печатной формы выбирают наиболее четкие по печатному очку знаки алфавита и другие графические символы, встречающиеся в тексте. На основе графического и метрического анализа определяют высоту и ширину одноименных знаков, толщины основных и вспомогательных штрихов и их соотношение. Комплект выбранных знаков используют для создания электронного шрифтоносителя (эталона).Then, on the monitor screen, on an enlarged scale up to 50 times, on the printed image of the printed form text, the most distinct alphabetical signs and other graphic characters found in the text are selected on the printed point. Based on graphical and metric analysis, the height and width of the signs of the same name, the thickness of the main and auxiliary strokes and their ratio are determined. A set of selected characters is used to create an electronic font carrier (reference).

Аппаратным и программным уровнем обработки обеспечивают выполнение функций качественного ввода изображений и выделение полезной информации. В программе Photoshop 4.0 используют алгоритмы выделения контуров знаков, т.е. устраняют характерные графические искажения в выборке знаков алфавита, обусловленные процессом печати тем или иным способом. Производят тоновую коррекцию изображений текста, усиление яркости и контрастности, удаление вуали за счет повышения резкости краев изображений электронными фильтрами. Операцию выделения контуров, корректуру графем знаков текста, выявление и восстановление очка знаков по изображению оттиска с печатной формы проводят на экране монитора с увеличением изображения знака до 50 крат по отношению к оригиналу. Методами электронной ретуши удаляют ростиск вокруг печатного очка, восстанавливают непропечатанные места в графеме букв, выдерживают характер подсечек и соотношение толщин основных и вспомогательных штрихов, обеспечивают и сохраняют тем самым единство гарнитурного построения шрифта. С помощью программы редактирования шрифтов (FontLab) импортируют восстановленный шрифт и экспортирует его в формат TrueType, а далее в качестве нового шрифта вводят в каталог эталонов программы распознавания ABBYY Fine Reader.The hardware and software processing levels provide the functions of high-quality image input and the selection of useful information. Photoshop 4.0 uses character contouring algorithms, i.e. eliminate the characteristic graphic distortion in the selection of characters of the alphabet due to the printing process in one way or another. They perform tone correction of text images, enhance brightness and contrast, remove the veil by sharpening the edges of images with electronic filters. The operation of selecting contours, proofreading grapheme signs of the text, identifying and restoring the point marks on the image of the print from the printing form is carried out on the monitor screen with an increase in the image of the sign up to 50 times in relation to the original. Using electronic retouching methods, they remove the growth around the printing point, restore unprinted places in the letter grapheme, withstand the nature of the cuts and the ratio of the thicknesses of the main and auxiliary strokes, thereby ensuring and preserving the unity of the typeface construction of the font. Using the font editing program (FontLab), the restored font is imported and exported to the TrueType format, and then, as a new font, it is entered into the ABBYY Fine Reader recognition program reference catalog.

После сканирования и обработки в цифровой форме оригинала текста системой распознавания и воспроизведения изображений ABBYY Fine Reader 6.0 с использованием выборки гарнитуры знаков эталона (шрифтоносителя), его верификации (сопоставления с оригиналом на экране монитора считанного и распознанного текста) и проверки синтаксиса и орфографии осуществляют запись текста в редактируемый файл, который экспортируют с разрешением 1200 dpi в пакет векторной графики CorelDraw 10.0, позволяющий преобразовывать текст в графические объекты и редактировать их в интерактивном режиме. Интерактивное редактирование текста позволяет выбирать отдельные знаки шрифта, изменять их параметры: угол наклона, высоту, отступ, расстояние между знаками и между словами, изменять наборную верстку текста.After scanning and digitally processing the original text, the ABBYY Fine Reader 6.0 image recognition and playback system uses a sample of the headset of the reference characters (font-carrier), its verification (comparison with the original on the monitor screen of the read and recognized text), and syntax and spelling are checked to record the text to an editable file that is exported with a resolution of 1200 dpi to the vector graphics package CorelDraw 10.0, which allows you to convert text to graphic objects and edit them in active mode. Interactive text editing allows you to select individual characters in the font, change their parameters: angle, height, indent, distance between characters and between words, change the typesetting of the text.

Методом электронной трансформации в пакете обработки графических изображений CorelDraw 10.0, изображения текста оригинала и знаков шрифтоносителя (эталона) приводят к единому масштабу.By the method of electronic transformation in the package for processing graphic images CorelDraw 10.0, the text of the original and the characters of the font-carrier (reference) lead to a single scale.

В выбранном формате и масштабе с необходимой разрешающей способностью производят разметку оригинала в пакете векторной графики CorelDraw 10.0, в результате которой с использованием направляющих линий Guidelines на оригинале определяют и выделяют левую и правую стороны полосы набора текста, нижнюю и верхнюю линии шрифта, интерлиньяж строк путем определения и выделения осевых линий толщин контуров знаков текста с помощью смоделированной для этих целей прямоугольной палетки с высотой одного из прямоугольников, равной кеглю соответствующего шрифта, а высотой другого, равной межстрочному расстоянию (интерлиньяжу строк).In the selected format and scale with the necessary resolution, the markup of the original is carried out in the CorelDraw 10.0 vector graphics package, as a result of which the left and right sides of the typing strip, the lower and upper font lines, and the leading of lines are determined and highlighted using the Guidelines on the original and highlighting the axial lines of the thicknesses of the contours of the characters of the text using a rectangular palette simulated for these purposes with a height of one of the rectangles equal to the size of the corresponding font , and the height of the other, equal to the line spacing (leading lines).

Одновременно с распознанным изображением во входной файл импортируют цифровое изображение оригинала. Пакет CorelDraw позволяет проецировать на экран монитора несколько изображений, одновременно их инвертировать и производить сложение, вычитание (позитив-негатив) этих изображений. Совмещение одноименных изображений производят оптическим наложением и сложением эталонных знаков шрифтоносителя в прямом контрасте с соответствующими распознанными знаками оригинала в обратном контрасте методами пакета векторной графики CorelDraw 10.0. Это позволяет расширить возможности процесса верификации путем дополнительного сравнения распознаваемого изображения с эталоном последовательно или выборочно и осуществить дополнительный контроль совпадения (факсимильности) по графике каждого распознаваемого изображения знаков шрифта с одноименными эталонными знаками по площади их печатного очка в масштабе увеличения до 30 крат.Simultaneously with the recognized image, a digital image of the original is imported into the input file. The CorelDraw package allows you to project several images onto the monitor screen, at the same time invert them and add, subtract (positive-negative) these images. The images of the same name are combined by optical superposition and addition of the standard characters of the font carrier in direct contrast with the corresponding recognized characters of the original in reverse contrast using the CorelDraw 10.0 vector graphics package methods. This allows expanding the capabilities of the verification process by additionally comparing the recognizable image with the standard sequentially or selectively, and additionally checking the coincidence (facsimile) on the graph of each recognizable image of the font characters with the same reference characters in the area of their print point in the magnification scale up to 30 times.

Вдоль выделенных и обозначенных верхней и нижней линий шрифта контролируют геометрические параметры наборной верстки текста: местоположение совмещенных по очку знаков шрифта, их взаимное положение друг относительно друга, правильность переноса слов текста, выключку и интерлиньяж строк, расположение полосы набора текста в целом. В случае отклонения от оригинала интерактивным путем и программными методами осуществляют изменение положения знака шрифтоносителя (эталона), его разворот в соответствии с аналогичным изображением оригинала. Достигают 100% перекрытия по площади печатного очка последовательным оптическим наложением и совмещением одноименных знаков текста (позитив-негатив). Затем фиксируют степень совпадения изображений двух одноименных знаков текста или целых слов по всей полосе набора и только при их полном совпадении с оригиналом программным путем происходит фиксация идентичности (факсимильности), т.е. местоположения изображения знака или групп знаков текста шрифтоносителя (эталона) на полосе текстового набора оригинала и копирование их кода в выходной файл с соответствующими кординатами X, Y, угол β местоположения знаков шрифта.Along the highlighted and marked upper and lower lines of the font, the geometric parameters of the typesetting of the text are controlled: the location of the font characters aligned by the point, their relative position relative to each other, the correct word wrap, switching off and leading lines, the location of the typing strip as a whole. In case of deviation from the original, interactively and programmatically, the position of the font carrier character (standard) is changed, its rotation is in accordance with the same image of the original. Achieve 100% overlap over the area of the printing point by sequential optical overlapping and combining the same characters of the text (positive-negative). Then, the degree of coincidence of the images of two characters of the same name of the text or whole words is recorded over the entire typing strip, and only when they are completely identical with the original programmatically, the identity (facsimile) is fixed, i.e. the location of the image of the character or groups of characters of the text of the font-carrier (reference) on the strip of the text set of the original and copying their code into the output file with the corresponding coordinates X, Y, angle β of the location of the characters of the font.

На лазерном устройстве фотовывода с разрешением 3600Х3600 dpi получают текстовую фотоформу для изготовления печатной формы к способу печати соответствующего оригинала.On a laser photo-output device with a resolution of 3600X3600 dpi, a text photo form for producing a printing form for the method of printing the corresponding original is obtained.

Использование предлагаемого способа обеспечивает, по сравнению с существующими способами, возможность факсимильного распознавания и воспроизведения текста печатной продукции малых форматов, отпечатанной в широком диапазоне качества печати и степени старения издания. При этом точно воспроизводится используемая гарнитура шрифта печатного оттиска за счет восстановления очка печатных знаков шрифта любых гарнитуро-кеглей, при сохранении метрических и графических параметров знаков текста, сложных элементов верстки, длины фраз, переноса и выключки строк, что может быть использовано при реставрации и переиздании старинных раритетных образцов акцидентной печатной продукции, чтобы сохранить композиционно-целостный текст и обеспечить его факсимильное зрительное восприятие.Using the proposed method provides, in comparison with existing methods, the facsimile recognition and reproduction of text in printed products of small formats, printed in a wide range of print quality and the degree of aging of the publication. At the same time, the used print headset font is accurately reproduced by restoring the point of the print characters of the font of any typeface sizes, while maintaining the metric and graphic parameters of text characters, complex layout elements, phrase lengths, line wrapping and off, which can be used for restoration and reprinting old-fashioned rare samples of accented printed materials in order to preserve a compositionally integrated text and ensure its facsimile visual perception.

Источники информацииSources of information

1. Патент (19) ЕПВ (ЕР), (11) заявка №0114248, кл. МКИ G 06 К 9/78, УДК 681.32, публ. 84.08.01 №31, (аналог).1. Patent (19) EPO (EP), (11) application No. 0114248, cl. MKI G 06 K 9/78, UDC 681.32, publ. 84.08.01 No. 31, (analogue).

2. Патент (19) ЕПВ (ЕР), (11) заявка №115462, (51) МКИ G 06 К 9/30, (53) УДК 681.327, публ. 64.08.08 №32, (прототип).2. Patent (19) EPO (EP), (11) application No. 115462, (51) MKI G 06 K 9/30, (53) UDC 681.327, publ. 08/08/08 No. 32, (prototype).

3. Горелик А.П., Скрыпник В.А. Методы распознавания. - М.: Высшая школа, 1977.3. Gorelik A.P., Skrypnik V.A. Recognition methods. - M.: Higher School, 1977.

4. Лахимова Е.А. Контроль размеров и формы изображений в фоторепродукционных процессах. - Р.Ж. Полиграфическая промышленность. Вып.1, Москва, "Книга", 1975. 40 с.4. Lakhimova EA Image size and shape control in photographic reproduction processes. - R.Zh. Printing industry. Issue 1, Moscow, “Book”, 1975. 40 p.

5. Витт А.А. Определение оптимальных параметров технологического процесса децентрализованного выпуска газет с использованием фототелеграфной передачи. Автореферат кандидатской диссертации. - М., 1971.5. Witt A.A. Determination of the optimal parameters of the technological process of decentralized newspaper production using photo telegraphic transmission. Abstract of the candidate dissertation. - M., 1971.

Claims (2)

1. Способ факсимильного распознавания и воспроизведения текста печатной продукции, включающий преобразование в цифровую форму распознаваемого и эталонного изображений, их цифровую обработку путем определения координат, сравнение и определение совпадения распознаваемого и эталонного контуров, отличающийся тем, что определение координат линии характеристического контура распознаваемого изображения символа производят с помощью соответствующего эталонного графического изображения путем нахождения значений координат X, Y, угла β местоположения оптического центра знаков текста наложением по площади печатного очка цифровых изображений - в прямом контрасте эталонного на соответствующее распознаваемое в обратном контрасте.1. The method of facsimile recognition and text playback of printed products, including digitizing the recognized and reference images, digitally processing them by determining the coordinates, comparing and determining the coincidence of the recognized and reference contours, characterized in that the line coordinates of the characteristic contour of the recognized symbol image are produced using the corresponding reference graphic image by finding the values of the coordinates X, Y, angle β places position of the optical center of the text overlay characters on the area of the printing points of digital images - in direct contrast to the corresponding reference recognizable in reverse contrast. 2. Способ факсимильного распознавания и воспроизведения текста печатной продукции по п.1, отличающийся тем, что в качестве эталонного шрифта при выполнении операции сравнения используют выборку знаков текста распознаваемого изображения, оптимизированных по печатному очку.2. The method of facsimile recognition and reproduction of text in printed products according to claim 1, characterized in that as a reference font, when performing the comparison operation, a selection of text characters of a recognized image optimized for a print point is used.
RU2003125815/09A 2003-08-21 2003-08-21 Method for facsimile recognition and reproduction of printed product text RU2260208C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2003125815/09A RU2260208C2 (en) 2003-08-21 2003-08-21 Method for facsimile recognition and reproduction of printed product text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2003125815/09A RU2260208C2 (en) 2003-08-21 2003-08-21 Method for facsimile recognition and reproduction of printed product text

Publications (2)

Publication Number Publication Date
RU2003125815A RU2003125815A (en) 2005-02-20
RU2260208C2 true RU2260208C2 (en) 2005-09-10

Family

ID=35218426

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2003125815/09A RU2260208C2 (en) 2003-08-21 2003-08-21 Method for facsimile recognition and reproduction of printed product text

Country Status (1)

Country Link
RU (1) RU2260208C2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2520407C1 (en) * 2012-11-16 2014-06-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Method and system of text improvement at digital copying of printed documents
RU2648638C2 (en) * 2014-01-30 2018-03-26 Общество с ограниченной ответственностью "Аби Девелопмент" Methods and systems of effective automatic recognition of symbols using a multiple clusters of symbol standards

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2571616C1 (en) * 2014-08-12 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Optical character recognition system and method, reducing processing time for images potentially not containing characters

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2520407C1 (en) * 2012-11-16 2014-06-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Method and system of text improvement at digital copying of printed documents
RU2648638C2 (en) * 2014-01-30 2018-03-26 Общество с ограниченной ответственностью "Аби Девелопмент" Methods and systems of effective automatic recognition of symbols using a multiple clusters of symbol standards

Also Published As

Publication number Publication date
RU2003125815A (en) 2005-02-20

Similar Documents

Publication Publication Date Title
CN114299528B (en) Information extraction and structuring method for scanned document
JPH06290302A (en) Image processor
US10455116B2 (en) Image processing device and method for controlling image processing device
JP3925112B2 (en) Image processing device
JPH07322057A (en) Increase of resolution of binary input picture and its increasing device together with improvement of appearance ofbinary input picture
RU2260208C2 (en) Method for facsimile recognition and reproduction of printed product text
US6671070B1 (en) Coverage-area gain compensation for high resolution printing
US9875670B2 (en) Braille copy machine using image processing techniques
US7142733B1 (en) Document processing method, recording medium recording document processing program and document processing device
JPH04270485A (en) Printing character recognition device
US10395399B2 (en) Method for improving the print quality of graphic elements
JPH06290300A (en) Image area identifying device
US7066566B2 (en) Print inspection apparatus, printing system, method of inspecting print data and program
JP4031189B2 (en) Document recognition apparatus and document recognition method
JPH0916582A (en) Document preparing device and method for outputting recognition result used for this device
JPH05108793A (en) Document edition device
JPH05151388A (en) Designating system for processing area and processing condition
JP2004279445A (en) Print system, attribute information generating device, rasterizing device, plate inspection apparatus, plate inspection method of print data, and program
US20090316210A1 (en) Image forming apparatus, image forming method and computer readable medium
JPH0728934A (en) Document image processor
JPH0757048A (en) Method for enlarging fine character image
JPS6327990A (en) Character recognizing method
JPS6163158A (en) Picture editing device
JPS62222382A (en) Optical character reading system
JP2000148735A (en) Image processor

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20090822