RU2166207C2

RU2166207C2 - Способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения

Info

Publication number: RU2166207C2
Application number: RU99106483/09A
Authority: RU
Inventors: К.В. Анисимович; В.В. Терещенко; Д.Е. Ян
Original assignee: Закрытое акционерное общество "Аби Программное обеспечение"
Priority date: 1999-04-08
Filing date: 1999-04-08
Publication date: 2001-04-27
Also published as: WO2000062196A1; AU3684500A

Abstract

Изобретение относится к области электроники и предназначено, например, для использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения. Техническим результатом является снижение погрешности преобразования и/или верификации. Способ заключается в том, что производят выработку смысловых единиц распознаваемых фрагментов изображения, содержащих n составляющих их элементов, где n выбирают в пределах 1≤n≤10³. В отобранных выборках выделяют подлежащие верификации совокупности их фрагментов изображения, содержащие n₁ элементов, где n₁ выбирают в пределах 1≤(n₁+n)/n≤2. Осуществляют поиск во вспомогательном массиве данных смысловых единиц, отличающихся от выделенных совокупностей фрагментов изображения, с погрешностью ε, выбираемой в пределах 0≤ε≤(αn₁ - 1)/n₁, где α - экспериментальный коэффициент в пределах 0,6≤α≤1,2, выбираемый в зависимости от частоты f_i появления любой смысловой i-й единицы в допустимом множестве смысловых единиц, которую определяют как количество n₂ повторений конкретной смысловой единицы, соотнесенное с общим количеством n₃ смысловых единиц в допустимом множестве смысловых единиц. Выявляют в распознанных смысловых единицах элементы, которые не совпадают с эквивалентными им по месту расположения символами в смысловых единицах, найденных в процессе поиска, и производят их замену соответствующими им по месту расположения символами из найденных смысловых единиц. Формируют дополнительный массив динамических растровых эталонов компьютерных кодов элементов в составе распознаваемых смысловых единиц и с учетом предшествующих операций преобразуют вспомогательный массив данных до уменьшения итоговой погрешности ε₃ способа, которую выбирают по отношению к промежуточной погрешности ε₁ в пределах 1 ≤ (ε₁+ε₃)/ε₁≤ 2.

Description

Изобретение относится к области электроники и может быть применено, например, для использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения.

Известен способ использования вспомогательных данных в процессе преобразования компьютерных кодов и соответствующих им фрагментов изображения, включающий производимое человеком и/или заменяющим его устройством, и/или компьютерной программой использование вспомогательных данных, привлекаемых для распознавания соответствующих им оригиналов [Patent USA N 5153927: Character reading system and method., МПК Oct. 6, 1992.].

Известен также способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов и соответствующих им оригиналов, заключающийся в осуществляемом компьютерной программой использовании вспомогательных массивов данных, привлекаемых для распознавания соответствующих им оригиналов [Руководство пользователя Fine Reader 4.0 ^© ABBYY Software House, М. , 1998. Казанский производственный комбинат программных средств. Заказ Ф-377].

Недостатком известных способов являются относительно низкие их функциональные и технические характеристики, в том числе высокие значения достигаемых погрешностей преобразования.

Решаемой изобретением задачей является совершенствование способов использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения с достижением технического результата в виде снижения погрешности преобразования и/или верификации.

Для удобства и однозначного понимания целесообразно привести расшифровки и определения используемых далее обозначений, символов и/или терминов.

Оригинал - преобразуемая информация, материализованная преимущественно в виде совокупности компьютерных кодов, соответствующих исходному объекту, например распознаваемому фрагменту изображения.

Компьютерный код (например, символ) - компьютерное представление некоторого фрагмента информации (в частности, символьной).

Процесс распознавания - процесс обработки системой распознавания введенного в компьютер графического изображения некоторого символа, в результате чего система распознавания приписывает изображению компьютерный код этого символа.

Процесс верификации - производимое человеком и/или заменяющим его устройством, и/или компьютерной программой сличение (определение адекватности) компьютерных кодов (символов) с графическим изображением, введенным в компьютер.

Допустимое множество смысловых единиц включает в себя всю совокупность вероятных для распознавания наборов смысловых единиц.

Смысловая единица - это совокупность компьютерных кодов, соответствующих ориентированному на какое-либо практическое использование образу, например букве, слову, символу, графическому элементу, логической операции, их совокупности и др.

Вспомогательный массив данных - это произвольным образом сформированная совокупность электронных кодов смысловых единиц, охватываемых, в частности, допустимым множеством смысловых единиц.

Погрешность соответствия ε между исходными смысловыми единицами и соответствующими им смысловыми единицами объема n₁ в дополнительном массиве данных, определяется как допустимое число Δn₁ несовпадающих в них элементов, соотнесенное с n₁: ε = Δn₁/n₁.

Частота f_i появления любой смысловой i-й единицы в допустимом множестве смысловых единиц определяется как количество n₂ повторений конкретной смысловой единицы, соотнесенное с общим количеством из смысловых единиц в допустимом множестве смысловых единиц: f₁ = n₂ ⁱ/n₃.

Погрешность ε₁ вспомогательного массива данных по отношению к допустимому множеству смысловых единиц определяется, как вероятность не нахождения в массиве данных элемента n_j, соотнесенного с общим количеством смысловых единиц n₄ во вспомогательном массиве данных.

Погрешность ε₂ преобразования определяется как количество n₅ ошибочно преобразованных элементов, соотнесенные с общим количеством n₆ элементов в преобразуемом наборе смысловых элементов из их допустимого множества: ε₂ = n₅/n₆.

Погрешность ε₃ определяется как итоговая погрешность преобразования.

Дополнительный массив динамических растровых эталонов - это совокупность элементов смысловых единиц, формируемая в процессе преобразования для уменьшения погрешностей ε₁, ε₂.
В качестве кратких сведений, раскрывающих сущность изобретения следует отметить, что достигаемый технический результат обеспечивают с помощью предложенного способа использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения, заключающегося в том, что производят выборку смысловых единиц распознаваемых фрагментов изображения, содержащих n₁ составляющих их элементов, где n₁ - выбирают в пределах 1 ≤ n ≤ 10³. В отобранных выборках выделяют подлежащие верификации совокупности их фрагментов изображения, содержащие n₁ элементов, где n₁ выбирают в пределах 1 ≤ (n₁+n)/n ≤ 2. Осуществляют поиск во вспомогательном массиве данных смысловых единиц, отличающихся от выделенных совокупностей фрагментов изображения, с погрешностью ε выбираемой в пределах 0 ≤ ε ≤ (αn₁-1)/n₁. Здесь α - экспериментальный коэффициент в пределах 0,6 ≤ α ≤ 1,2, выбираемый в зависимости от частоты f_i появления любой смысловой i-й единицы в допустимом множестве смысловых единиц, которую определяют как количество n₂ повторений конкретной смысловой единицы, соотнесенное с общим количеством n₃ смысловых единиц в допустимом множестве смысловых единиц.

Выявляют в распознанных смысловых единицах элементы, которые не совпадают с эквивалентными им по месту расположения символами в смысловых единицах, найденных в процессе поиска, и производят их замену соответствующими им по месту расположения символами из найденных смысловых единиц. Формируют дополнительный массив динамических растровых эталонов компьютерных кодов элементов в составе распознаваемых смысловых единиц количеством n₇, величину которого выбирают в пределах 1≤ (n₂ + n₅ + n₆ + βn₇ + n₃)/n₃ ≤ 6,3. Здесь β - - экспериментальный коэффициент в пределах 0,4 ≤ β ≤ 1,3, выбираемый в зависимости от задаваемых погрешности ε₁ вспомогательного массива данных по отношению к допустимому множеству смысловых единиц, определяемой как вероятность не нахождения в массиве данных элемента n_j, в общем количестве смысловых единиц n₄ во вспомогательном массиве данных, и погрешности ε₂ преобразования, определяемой как количество n₅ ошибочно преобразованных элементов, соотнесенное с общим количеством n₆ элементов в преобразуемом наборе смысловых элементов из их допустимого множества. Затем с учетом предшествующих операций преобразуют вспомогательный массив данных до уменьшения итоговой погрешности ε₃ способа, которую выбирают по отношению к погрешности ε₁ в пределах 1 ≤ (ε₁+ε₃)/ε₁ ≤ 2.
При изложении сведений, подтверждающих возможность осуществления изобретения целесообразно более подробно описать предложенный способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов и соответствующих им фрагментов изображения. Детально целесообразно остановиться только на существенных особенностях осуществления операций предложенного способа, заключающегося в том, что производят выборку смысловых единиц распознаваемых фрагментов изображения, содержащих n составляющих их элементов, где n - выбирают в пределах 1 ≤ n ≤ 10³. Смысловыми единицами могут быть в произвольном случае буквы, математические и другие символы, отдельные слова, предложение, графические элементы, а также их любые сочетания. В отобранных выборках выделяют подлежащие верификации совокупности их фрагментов изображения, содержащие n₁ элементов, где n₁ выбирают в пределах 1 ≤ (n₁+n)/n ≤ 2. Осуществляют поиск во вспомогательном массиве данных смысловых единиц, отличающихся от выделенных совокупностей фрагментов изображения, с погрешностью ε, выбираемой в пределах 0 ≤ ε ≤ (αn₁-1)/n₁. Здесь α - экспериментальный коэффициент в пределах 0,6 ≤ α ≤ 1,2, выбираемый в зависимости от частоты f_i появления любой смысловой i-й единицы в допустимом множестве смысловых единиц, которую определяют как количество n₂ повторений конкретной смысловой единицы, соотнесенное с общим количеством n₃ смысловых единиц в допустимом множестве смысловых единиц. Фрагментами могут быть как смысловые единицы в целом, так и их части, ориентированные, например, на автономное применение. Погрешность преобразования в основном связана с качеством исходных графических изображений, которое определяется, в частности, тем, что предъявляют для распознавания, например, изготовленное на ксерокопировальном аппарате изображение, факсограмму, машинописный или рукописный текст.

Выявляют в распознанных смысловых единицах элементы, которые не совпадают с эквивалентными им по месту расположения символами в смысловых единицах, найденных в процессе поиска, и производят их замену соответствующими им по месту расположения символами из найденных смысловых единиц. Формируют дополнительный массив динамических растровых эталонов компьютерных кодов элементов в составе распознаваемых смысловых единиц количеством n₇, величину которого выбирают в пределах 1 ≤ (n₂ + n₅ + n₆ + βn₇ + n₃)/n₃≤ 6,3. Здесь β - экспериментальный коэффициент в пределах 0,4 ≤ β ≤ 1,3, выбираемый в зависимости от задаваемых погрешности ε₁ вспомогательного массива данных по отношению к допустимому множеству смысловых единиц, определяемой как вероятность не нахождения в массиве данных элемента n_j, в общем количестве смысловых единиц n₄ во вспомогательном массиве данных, и погрешности ε₂ преобразования, определяемой как количество n₅ ошибочно преобразованных элементов, соотнесенное с общим количеством n₆ элементов в преобразуемом наборе смысловых элементов из их допустимого множества.

Процесс построения динамических растровых эталонов целесообразно определить как производимое человеком и/или заменяющим его устройством, и/или компьютерной программой построение дополнительного массива данных, используемых для ускорения процесса распознавания. Динамический растровый эталон - это дополнительный массив данных, создаваемый и используемый для ускорения процесса распознавания. Понятие "динамический" отражает изменяемый характер создаваемых эталонов, то есть означает, что в процессе использования предложенного способа постоянно изменяют совокупность построенных эталонов пополнением ее новыми эталонами, видоизменением существующих и исключением ненужных, а понятие "растровый" характеризует их особенности выполнения в виде совокупности элементов, образующих, например, периодическую структуру. Создать эталон - значит для каждого встречающегося в тексте символа записать в память растровой подсистемы пару: точечное изображение символа и его название (т.е. какую буквы это изображение представляет).

Затем с учетом предшествующих операций преобразуют вспомогательный массив данных до уменьшения итоговой погрешности ε₃ способа, которую выбирают по отношению к погрешности ε₁ в пределах 1 ≤ (ε₁+ε₃)/ε₁ ≤ 2. На практике возможно использование и отдельных логически завершенных совокупностей операций предложенного способа. Если в результате выделения в соответствии с приведенными аналитическими соотношениями необходимых величин получают дробные, отрицательные значения и какие-либо другие значения, некорректные исходя из условий возможности их дальнейшего использования, то их исключают из рассмотрения и/или автоматически удаляют.

В качестве примера практического выполнения заявленного способа использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов и соответствующих им фрагментов изображения, целесообразно привести следующий, реализованный в последних версиях системы оптического распознавания текстов FineReader. В процессе реализации способа производят выборку смысловых единиц распознаваемых оригиналов, содержащих n составляющих их элементов, где n - выбирают в пределах 1 ≤ n ≤ 20. В отобранных выборках выделяют подлежащие верификации совокупности их фрагментов, содержащие n₁ элементов, где n₁ выбирают из условия 1,8 ≤ (n₁+n)/n ≤ 2. Осуществляют поиск во вспомогательном массиве данных смысловых единиц с погрешностью ε отличающихся от выделенных совокупностей фрагментов, выбираемой в пределах ε ≤ 0,1 при α = 0,9 f_i = 0,01 - 0,1. Выявляют в распознанных смысловых единицах элементы, которые не совпадают с эквивалентными им по месту расположения символами в смысловых единицах, найденных в процессе поиска, и производят их замену соответствующими им по месту расположения символами из найденных смысловых единиц. Формируют дополнительный массив динамических растровых эталонов компьютерных кодов элементов в составе распознаваемых смысловых единиц количеством n₇, величину которого по отношению к общему количеству n₃ смысловых единиц в допустимом множестве смысловых единиц выбирают из условия n₇/n₃ = 0,9 при β = 1,1, ε₁ = 0,05 и ε₂ = 0,05, пренебрегая в конкретном случае влиянием n₂, n₅, и n₆ на величину n₇. Преобразуют в результате вспомогательный массив данных до уменьшения погрешности ε₃ по отношению к погрешности ε₁ из условия (ε₁+ε₃)/ε₁ = 1,2.
Компьютерный код в заявленном объекте, как уже указывалось, - это преобразуемая компьютером совокупность электромагнитных сигналов, адекватно соответствующих распознаваемым исходным символам или любым другим распознаваемым фрагментам исходной информации. Каждый из эталонов совокупности динамических растровых эталонов, образующих периодическую структуру, представляет собой, например, упорядоченный набор электромагнитных сигналов или соответствующих рельефно намагниченных фрагментов жесткого диска. Динамические свойства растровых эталонов определяют временными параметрами их преобразования.

В отношении технических средств, необходимых для реализации заявленного способа, целесообразно в дополнении к вышеизложенному отметить, что ими могут быть как специализированные функциональные блоки, так и функциональные узлы компьютера, управляемые задаваемой системой команд. В частности, некоторые операции осуществляются математическим сопроцессором центрального процессора системного блока компьютера под управлением специализированных для операций с массивами данных и статистических вычислений функциональных программных блоков (библиотек команд, эталонов и других данных), производящих выборку и сортировку списков эталонов. Сами списки находятся либо в оперативной памяти (ОЗУ), либо на дисковом носителе компьютера и управляются системными библиотеками команд операционной среды. Под заменяющим человека устройством подразумевается любое устройство, которое может на необходимом для осуществления способа уровне выполнить операции, которые ранее выполнял или которые может выполнить человек. На практике техническими средствами реализации способа построения динамических растровых эталонов компьютерных кодов в процессе распознавания соответствующих им оригиналов могут являться, в частности, система состоящая из сканера, компьютера с загруженной в оперативную память программой сканирования, программой Fine Reader, подсистемой синхронизации компьютерных кодов, а также монитора, либо печатающего устройства и манипулятора для контроля и управления процессом. Соответствие критерию промышленная применимость предложенного способа также доказывается отсутствием в заявленных притязаниях каких-либо практически трудно реализуемых признаков и известностью средств для их осуществления.

Указанные в формуле изобретения отличия, как уже отмечалось, дают основание сделать вывод о новизне предложенного технического решения, а совокупность испрашиваемых притязаний - о неочевидности их создания или об их изобретательном уровне, что доказывается также вышеприведенным описанием способа. Практическое использование способа обеспечивает достижение вышеуказанного технического результата взаимосвязанной совокупностью существенных признаков и особенностей, отраженных в формуле изобретения. Особенности использования способа и других объектов, не отраженные в описании, общеизвестны и не являются предметом изобретения.

Кроме указанного выше технического результата, практическое осуществление заявленного объекта позволяет существенно расширить возможности его использования применительно, например, к различным документам, заполняемым рукописными символами, либо документам плохого качества.

Claims

Способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения, заключающийся в том, что производят выборку смысловых единиц распознаваемых фрагментов изображения, содержащих n составляющих их элементов, где n выбирают в пределах 1 ≤ n ≤ 10³, в отобранных выборках выделяют подлежащие верификации совокупности их фрагментов изображения, содержащие n₁ элементов, где n₁ выбирают в пределах 1 ≤(n₁ + n)/n ≤ 2, осуществляют поиск во вспомогательном массиве данных смысловых единиц, отличающихся от выделенных совокупностей фрагментов изображения, с погрешностью ε, выдираемой в пределах 0 ≤ ε ≤ (αn₁-1)/n₁ где α - экспериментальный коэффициент в пределах 0,6 ≤ α ≤ 1,2, выбираемый в зависимости от части fi появления любой смысловой i-ой единицы в допустимом множестве смысловых единиц, которую определяют как количество n₂ повторений конкретной смысловой единицы, соотнесенное с общим количеством n₃ смысловых единиц в допустимом множестве смысловых единиц, выявляют в распознанных смысловых единицах элементы, которые не совпадают с эквивалентными им по месту расположения символами в смысловых единицах, найденных в процессе поиска, и производят их замену соответствующими им по месту расположения символами из найденных смысловых единиц, формируют дополнительный массив динамических растровых эталонов компьютерных кодов элементов в составе распознаваемых смысловых единиц количеством n₇, величину которого выбирают в пределах 1≤(n₂ + n₅ + n₆ + β n₇ + n₃)/ n₃ ≤ 6,3, где β - экспериментальный коэффициент в пределах 0,4 ≤ β ≤ 1,3, выбираемый в зависимости от задаваемых погрешности ε₁ вспомогательного массива данных по отношению к допустимому множеству смысловых единиц, определяемой как вероятность ненахождения в массиве данных элемента n_j, в общем количестве смысловых единиц n₄ во вспомогательном массиве данных, и погрешности ε₂ преобразования, определяемой как количество n₅ ошибочно преобразованных элементов, соотнесенное с общим количеством n₆ элементов в преобразуемом наборе смысловых элементов из их допустимого множества, и преобразуют вспомогательный массив данных до уменьшения погрешности ε₃ способа, которую выбирают по отношению к погрешности ε₁ в пределах 1 ≤ (ε₁+ε₃)/ε₁≤ 2.