RU2656573C2 - Методы обнаружения введенных пользователем контрольных меток - Google Patents

Методы обнаружения введенных пользователем контрольных меток Download PDF

Info

Publication number
RU2656573C2
RU2656573C2 RU2014125722A RU2014125722A RU2656573C2 RU 2656573 C2 RU2656573 C2 RU 2656573C2 RU 2014125722 A RU2014125722 A RU 2014125722A RU 2014125722 A RU2014125722 A RU 2014125722A RU 2656573 C2 RU2656573 C2 RU 2656573C2
Authority
RU
Russia
Prior art keywords
document
file
fields
check marks
preformatted
Prior art date
Application number
RU2014125722A
Other languages
English (en)
Other versions
RU2014125722A (ru
Inventor
Сергей Анатольевич Кузнецов
Original Assignee
Общество с ограниченной ответственностью "Аби Девелопмент"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Аби Девелопмент" filed Critical Общество с ограниченной ответственностью "Аби Девелопмент"
Priority to RU2014125722A priority Critical patent/RU2656573C2/ru
Priority to US14/509,188 priority patent/US9396389B2/en
Publication of RU2014125722A publication Critical patent/RU2014125722A/ru
Application granted granted Critical
Publication of RU2656573C2 publication Critical patent/RU2656573C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Abstract

Изобретение относится к способу применения мобильного обрабатывающего устройства для обработки контрольных меток в документе, имеющем предварительно отформатированные поля для ввода контрольных меток. Технический результат заключается в ускорении обработки документов. Способ содержит применение цифровой камеры, связанной с устройством, для генерации первого электронного файла, содержащего двухмерное оцифрованное изображение документа; и применение устройства для (a) обнаружения в первом файле идентификаторов документа и маркеров, определяющих местоположение и ориентацию фрагментов, содержащих предварительно отформатированные поля; (b) генерации второго файла, в котором двухмерное оцифрованное изображение изменено в соответствии с цифровым шаблоном документа; (c) применения цифрового шаблона для извлечения в электронном виде из второго файла оцифрованных изображений предварительно отформатированных полей; и (d) обнаружения присутствия контрольных меток в оцифрованных изображениях предварительно отформатированных полей на основе анализа в них пикселей, не относящихся к фону. 3 н. и 19 з.п. ф-лы, 6 ил.

Description

ОБЛАСТЬ ПРИМЕНЕНИЯ ИЗОБРЕТЕНИЯ
Настоящее изобретение относится к области сбора данных и обработки документов с применением оптического распознавания символов (OCR) и интеллектуального распознавания символов (ICR).
УРОВЕНЬ ТЕХНИКИ НАСТОЯЩЕГО ИЗОБРЕТЕНИЯ
Методы OCR/ICR по существу применяются для преобразования изображений печатных документов в машиночитаемые и редактируемые форматы, а также для извлечения данных из документов. Как правило, устройства с поддержкой OCR/ICR выполняют компьютеризованное сканирование документов и машинный анализ полученных сканированных изображений (т.е. файлов сканированных документов).
Однако сферы применения обработки документов со сбором данных, такие как анализ документов, имеющих предварительно отформатированные поля для пользовательских контрольных меток (например, формы, контрольные списки, анкеты и т.д.), на объекте / в режиме реального времени, могут потребовать ускоренной обработки по сравнению с применением традиционных методов OCR/ICR.
ИЗЛОЖЕНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ
Описаны методы применения мобильного обрабатывающего устройства для обработки контрольных меток в документах, имеющих предварительно отформатированные поля для ввода контрольных меток.
В одном варианте реализации цифровая камера, связанная с мобильным обрабатывающим устройством, применяется для генерации файла, содержащего двухмерное оцифрованное изображение такого документа. Затем применяются идентификаторы, позволяющие отличить один документ от другого, и маркеры, определяющие местоположение и ориентацию фрагментов, содержащих предварительно отформатированные поля, для генерации файла, в котором двухмерное оцифрованное изображение изменено в соответствии с ориентацией и размером цифрового шаблона документа.
С применением шаблона оцифрованные изображения предварительно отформатированных полей извлекаются и анализируются в электронном виде на присутствие в них введенных пользователем контрольных меток. Присутствие контрольных меток обнаруживается путем вычитания пикселей фона и определения ситуации, когда количество оставшихся пикселей превышает первый предварительно выбранный порог, или ситуации, когда отношение количества пикселей, не относящихся к фону, к общему количеству пикселей превысит второй предварительно выбранный порог.
Различные другие объекты и варианты реализации изобретения более подробно описаны ниже. Предполагается, что элементы одного варианта реализации изобретения могут быть использованы в других вариантах его реализации без дополнительного перечисления.
Раскрытие изобретения не представляет собой в полной мере и в полном объеме настоящее изобретение и не должно считаться таковым. Все объекты, элементы и преимущества настоящего изобретения станут очевидны из следующего подробного письменного описания и в соответствии с прилагаемыми чертежами.
Новые элементы, которые считаются характерными для описания, изложены в прилагаемых пунктах формулы изобретения.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
На ФИГ. 1 показана схема, на которой представлен способ применения мобильного обрабатывающего устройства для обработки контрольных меток в документе, имеющем предварительно отформатированные поля для ввода контрольных меток, в соответствии с одним вариантом реализации настоящего изобретения.
На ФИГ. 2 показан пример документа, имеющего предварительно отформатированные поля для ввода контрольных меток и применяемого в настоящем описании для иллюстрации способа, изображенного на ФИГ. 1.
На ФИГ. 3 показано графическое изображение примера цифрового шаблона документа, изображенного на ФИГ. 2.
На ФИГ. 4 показан иллюстративный снимок документа, изображенного на ФИГ. 2, сгенерированный с применением цифровой камеры, связанной с мобильным обрабатывающим устройством.
На ФИГ. 5 показано оцифрованное изображение примера предварительно отформатированного поля в документе, изображенном на ФИГ. 2, с пользовательской меткой.
На ФИГ. 6 показан пример платформы, на которой используется способ, изображенный на ФИГ. 1, в соответствии с одним вариантом реализации настоящего изобретения.
Изображения на чертежах упрощены для целей иллюстрации и приведены без соблюдения масштаба.
Для облегчения понимания на чертежах по возможности используются совпадающие номера позиций для обозначения по существу совпадающих элементов чертежей, за исключением того, что к ним при необходимости могут быть добавлены дополнительные буквенно-цифровые элементы и/или суффиксы для различения таких элементов.
ОСУЩЕСТВЛЕНИЕ НАСТОЯЩЕГО ИЗОБРЕТЕНИЯ
Объекты, элементы и преимущества настоящего изобретения описаны ниже в отношении мобильных обрабатывающих устройств с применением связанных с ними цифровых камер для обработки контрольных меток в документах, имеющих предварительно отформатированные поля для ввода контрольных меток. Предполагается, что по меньшей мере фрагменты настоящего изобретения также могут использоваться с другими типами обрабатывающих устройств (например, настольными компьютерами, связанными с автономными или встроенными цифровыми камерами) или для анализа других типов документов (например, компьютерной графики, мишеней для стрельбы и т.д.) или их оцифрованных изображений.
На ФИГ. 1 показана схема, на которой представлен способ 100 применения мобильного обрабатывающего устройства для обработки контрольных меток в документе, имеющем предварительно отформатированные поля для ввода контрольных меток, в соответствии с одним вариантом реализации настоящего изобретения, а на ФИГ. 2 показан пример документа 200, имеющего предварительно отформатированные поля и применяемого в настоящем описании для иллюстрации способа, изображенного на ФИГ. 1. Для лучшего понимания изобретения рекомендовано рассматривать ФИГ. 1 и 2 одновременно.
Способ 100 начинается с этапа 102 и переходит к этапу 110.
На этапе 110 с применением цифровой камеры, встроенной или иным образом связанной (т.е. соединенной с помощью связи) с мобильным обрабатывающим устройством, выполняется снимок документа, имеющего предварительно отформатированные поля для ввода пользовательских контрольных меток, после того как документ был оформлен (т.е. в него были введены контрольные метки) пользователем документа. Примеры подходящего мобильного обрабатывающего устройства включают в себя, без ограничений, мобильный телефон, мобильное вычислительное устройство (например, планшетный компьютер, карманный персональный компьютер (КПК) или ноутбук) и цифровую камеру с возможностью подключения к сети Интернет.
В памяти мобильного обрабатывающего устройства или связанной с ним цифровой камеры сохраняется снимок сфотографированного документа в форме цифрового файла, считываемого процессором. Данный файл в настоящем описании называется «первым файлом».
По существу первый файл содержит двухмерное оцифрованное изображение сфотографированного документа и также может включать в себя частичное изображение объекта (-ов), окружающего (-их) или удерживающего (-их) документ (например, стола, на котором происходит фотосъемка документа, и т.п.). Для краткости далее любой (-ые) цифровой (-ые) файл (-ы), считываемый (-ые) процессором, будет (-ут) называться «файлом (-ами)».
В одном варианте реализации файл, содержащий чистую (т.е. без введенных пользователем контрольных меток) копию документа, загружается на мобильное обрабатывающее устройство из соответствующей базы данных и затем воспроизводится с применением принтера, соединенного с помощью связи с мобильным обрабатывающем устройством. Альтернативно загруженная копия документа может быть передана в электронном виде с применением мобильного обрабатывающего устройства ее предполагаемым пользователям и распечатана пользователями.
Чистой копии документа по существу присваиваются маркеры, определяющие местоположение и ориентацию фрагмента документа, содержащего предварительно отформатированные поля. Альтернативно в качестве таких маркеров могут применяться линии границы некоторых предварительно отформатированных полей. В качестве дополнительной возможности, чистая копия документа также может включать в себя символы или коды, определяющие документ или его конкретный фрагмент (например, страницу).
В документе контрольные метки могут быть введены от руки («рукописные» контрольные метки, введенные с применением ручек, карандашей или других письменных принадлежностей), с применением штампующего устройства или принтера. Такие контрольные метки могут иметь произвольную одинаковую или различную форму или исполнение.
По существу плотность (т.е. контраст) следов введенных пользователем контрольных меток должна быть достаточной для того, чтобы они были видны невооруженным глазом. Однако в некоторых сферах применения контрольные метки могут быть сгенерированы с применением письменных принадлежностей, оставляющих следы, которые не видны невооруженным глазом при освещении традиционными источниками света или солнечным светом, но видны датчикам цифровой камеры, связанной с мобильным обрабатывающим устройством.
Как представлено на ФИГ. 2, пример документа 200 включает в себя идентификатор или поле идентификатора 210, маркеры 220 и множество текстовых блоков 230, часть которых имеют соответствующие предварительно отформатированные поля 232 для ввода контрольных меток 234. По существу документ 200 может представлять собой одностраничную статью (как показано) или многостраничную статью.
Для иллюстрации показанные предварительно отформатированные поля 232 являются прямоугольными областями, отделенными с применением непрерывных линий границами. Специалистам в данной области будет понятно, что предварительно отформатированные поля могут иметь различные геометрические свойства или могут быть снабжены другими средствами отделения от других элементов текстовых блоков 230.
Идентификатор 210 (например, штрих-код (как показано), код Quick Response (QR) и т.д.) может применяться для определения или маркировки документа 200 или его конкретной страницы. Альтернативно или дополнительно для определения конкретных страниц в многостраничном документе 200 могут применяться отдельные символы 210.
Маркеры 220 определяют местоположение и ориентацию фрагментов документа, содержащих предварительно отформатированные поля 232. Маркеры 220 могут иметь различные геометрические структуры (например, «+» (как показано), круг, квадрат и т.п. или их комбинацию).
Для повышения точности определения областей, на которых расположены предварительно отформатированные поля 232, маркеры 220 по существу размещены на расстоянии друг от друга в различных областях документа 200 (например, по меньшей мере в трех углах (как показано)). Альтернативно линии границы трех или более предварительно отформатированных полей 232, не размещенных на одной и той же линии, могут применяться в качестве маркеров 220 (например, удаленно размещенные предварительно отформатированные поля 2321 и 2323 или 2327).
Текстовые блоки 230 по существу включают в себя одну или несколько строк текста (показаны в виде строк 236, например, вопрос в анкете или пункт контрольного списка) или графические изображения (не показаны).
Предварительно отформатированные поля 232 для ввода контрольных меток 234 могут быть снабжены условными обозначениями, связанными с содержимым (для иллюстрации показаны условные обозначения «ДА» и «НЕТ»). В документе 200 для иллюстрации произвольно выбранные пользовательские контрольные метки 234 введены в предварительно отформатированные поля 2321-2327.
Каждый из этапов 120-150 ниже может быть выполнен с применением процессора мобильного обрабатывающего устройства или удаленного процессора, соединенного с помощью связи с мобильным обрабатывающим устройством. В описанном ниже предпочтительном варианте реализации этапы 120-150 для иллюстрации выполнены с применением вычислительных ресурсов и прикладных программ мобильного обрабатывающего устройства.
На этапе 120 мобильное обрабатывающее устройство анализирует первый файл для обнаружения в нем цифровых изображений маркеров, определяющих местоположение предварительно отформатированных полей, и символов, определяющих документ или его конкретные страницы.
В отношении документа 200 на этапе 120 процессор мобильного обрабатывающего устройства исполняет прикладную программу для обнаружения в первом файле документа 200 идентификатора 210 и маркеров 220 (или альтернативно линий границ выбранной группы предварительно отформатированных полей 232, как описано выше со ссылкой на этап 110).
На этапе 130 мобильное обрабатывающее устройство исполняет прикладную программу, которая применяет первый файл для генерирования второго файла сфотографированного документа, в котором двухмерное цифровое изображение документа изменено в электронном виде для соответствия ориентации и размеру его цифрового шаблона. Файл, содержащий цифровой шаблон документа, можно загрузить из соответствующего источника в любое время до исполнения этапа 130, а затем сохранить в базе данных таких файлов на мобильном обрабатывающем устройстве.
Цифровой шаблон в форме компьютерного кода по существу показывает масштабированное (например, увеличенное или уменьшенное) схематичное изображение, включающее в себя маркеры, идентификационные поля и предварительно отформатированные поля сфотографированного документа. В одном варианте реализации такое наложение (или регистрация изображения) достигается путем совмещения маркеров двухмерного цифрового изображения, содержащихся в первом файле, с соответствующими маркерами цифрового шаблона того же документа.
По существу двухмерное цифровое изображение, содержащееся в первом файле, представляет собой оптически искаженный снимок сфотографированного документа, и могут быть сделаны различные снимки документа (-ов) под разными углами, на разных расстояниях или с различными параметрами масштабирования. Нормализация отдельных снимков документа позволяет совмещать двухмерное цифровое изображение документа с его цифровым шаблоном и в частности определять местоположение предварительно отформатированных полей для ввода контрольных меток на двухмерном цифровом изображении документа. Нормализация отдельных снимков документа представляет собой предварительную обработку двухмерного цифрового изображения, которая может включать в себя автоматическое определение ориентации страницы, автоматическое кадрирование страницы, коррекцию искажений перспективы, масштабирование и т.д.
На ФИГ. 3 показано графическое изображение примера цифрового шаблона 300 документа 200, изображенного на ФИГ. 2. В показанном иллюстративном варианте реализации графическое изображение цифрового шаблона 300 представляет собой эскиз документа 200, который содержит графические изображения, информацию о местоположении и типах данных основных полей 320, 342 и 332 - маркеров 220, идентификационного поля 210 и предварительно отформатированных полей 232 соответственно.
На ФИГ. 4 показан иллюстративный снимок (т.е. графическое изображение) 400 документа 200, изображенного на ФИГ. 2, сгенерированный цифровой камерой, связанной с мобильным обрабатывающим устройством. Изображение 400 содержится в первом файле и представляет собой геометрически искаженный и смещенный относительно центра снимок документа 200.
Для совмещения с цифровым шаблоном 300 (описан выше со ссылкой на ФИГ. 3) изображение 400 изменяют в электронном виде так, чтобы обеспечить, чтобы маркеры 220 документа 200 совпадали с соответствующими маркерами 320 цифрового шаблона 300. В одном варианте реализации на этапе 130 изображение 400 масштабируется в электронном виде и поворачивается в направлениях стрелок 401- 403. Измененное в электронном виде изображение 400 сохраняется в мобильном обрабытвающем устройстве как второй файл документа 200.
На этапе 140 с применением цифрового шаблона в качестве маски оцифрованные изображения предварительно отформатированных полей извлекаются из второго файла и выборочно сохраняются в третьем файле сфотографированного документа. После этого для освобождения памяти мобильного обрабатывающего устройства второй файл сфотографированного документа может быть удален.
Извлеченные оцифрованные изображения содержат только снимки предварительно отформатированных полей, в совокупности представляющих малую часть реального объема документа. Как таковой третий файл намного меньше (т.е. занимает меньше места в памяти) второго файла.
В отношении сфотографированного документа 200 и его цифрового шаблона 300 фрагменты, соответствующие областям 332 шаблона 300, извлекаются в электронном виде из второго файла документа 200. Извлеченные фрагменты графически соответствуют областям предварительно отформатированных полей 232 документа 200. Извлеченные фрагменты выборочно сохраняются в третьем файле документа 200, после чего более крупный второй файл документа 200 может быть удален.
На этапе 150 оцифрованные изображения предварительно отформатированных полей сфотографированного документа получают из третьего файла документа и в электронном виде анализируют на предмет присутствия в них введенных пользователем контрольных меток.
В одном варианте реализации рассчитывается общее количество N1 пикселей в оцифрованном изображении предварительно отформатированного поля и количество N2 пикселей фона. Затем количество N2 вычитают из количества N1. Когда количество оставшихся пикселей превышает первый предварительно выбранный порог, считается, что в предварительно отформатированном поле обнаружена контрольная метка.
В другом варианте реализации рассчитывается соотношение R=(N1- N2)/N1.
Когда числовое значение отношения R превышает второй предварительно выбранный порог, считается, что в предварительно отформатированном поле обнаружена контрольная метка.
На ФИГ. 5 показано оцифрованное изображение 500 примера предварительно отформатированного поля 232 документа 200 с пользовательской контрольной меткой. Изображение 500 получают из третьего файла документа и для иллюстрации оно включает в себя оцифрованное изображение введенной пользователем контрольной метки 502 (показанной, например, в предварительно отформатированных полях 2321, 2323 и 2326 на ФИГ. 2).
Изображение 500 включает в себя множество пикселей N1, в котором имеется N2 фоновых (светлых) пикселей 504, а оставшиеся пиксели N1-N2 - это не относящиеся к фону (т.е. по меньшей мере частично затемненные) пиксели, которые в совокупности образуют цифровое изображение введенной пользователем контрольной метки 502.
Результаты накопления и подсчета обнаруженных контрольных меток из множества документов можно показать на дисплее мобильного обрабатывающего устройства или сохранить в нем или удаленно для дальнейшего анализа (например, статистического анализа) или для справки. Кроме того, мобильное обрабатывающее устройство может представлять различные ошибки / диагностические сообщения (присутствие противоречивых контрольных меток, отсутствие необходимых контрольных меток, ошибки обработки изображения или ошибки распознавания / идентификации изображения и т.д.).
В других вариантах реализации множество документов, имеющих предварительно отформатированные поля для ввода пользовательских контрольных меток, могут быть сфотографированы до того, как их цифровые изображения будут по меньшей мере частично обработаны на присутствие контрольных меток. Альтернативно фрагменты такого анализа могут быть выполнены в мобильном обрабатывающем устройстве в виде его подпрограммы обработки фоновых данных.
После завершения этапа 150 способ 100 заканчивается на этапе 152.
На ФИГ. 6 показан пример платформы 600, на которой используется способ 100, изображенный на ФИГ. 1, в соответствии с одним вариантом реализации настоящего изобретения. Обычному специалисту в данной области будет понятно, что аппаратные и программные конфигурации, изображенные на ФИГ. 6, могут варьироваться без отклонения от сущности или объема изобретения.
Платформа 600 по существу включает в себя мобильное обрабатывающее устройство 610, необязательные периферийные устройства 640 (например, дисплеи, принтеры и т.д.) и необязательную внешнюю / удаленную цифровую камеру 606А. В некоторых вариантах реализации (как показано) платформа 600 также может быть подключена к сети 650 (например, к внутренней, локальной/глобальной сети (LAN/WAN) или сети Интернет). Устройство 610 может быть реализовано, например, в виде мобильного цифрового телефона, цифровой камеры с доступом к сети Интернет, КПК, планшета общего назначения/специализированного планшета или мобильного компьютера.
При реализации в виде мобильного цифрового телефона устройство 610 по существу включает в себя пользовательский интерфейс (например, сенсорный экран) 602, РЧ-модуль 604, цифровую камеру 606, процессор 612, модуль памяти 614, вспомогательные системы 618, системный интерфейс 602 и контроллер ввода/вывода (I/O) 616, обеспечивающий возможность связи с периферийными устройствам 640 и сетью 650. Компоненты устройства 610 могут быть реализованы в виде аппаратных устройств, программных модулей, программно-аппаратного обеспечения или их комбинации. Альтернативно или дополнительно такое устройство 610 может быть связано (т.е. соединено с помощью связи) с внешней/удаленной цифровой камерой 606А (например, цифровой камерой с высоким разрешением).
В показанном варианте реализации в модуле памяти 614 хранятся операционная система (ОС) 620 и прикладные программы (т.е. программные продукты для компьютера) 622. Альтернативно по меньшей мере фрагменты ОС 620 и прикладных программ 622 могут находиться на удаленном вычислительном устройстве (например, сервере в сети 650), соединенном с помощью связи сустройством 610.
В устройстве 610 прикладные программы 622 включают в себя программу(-ы) обнаружения контрольной метки 624 и необязательную базу данных 626 цифровых шаблонов обработанных документов. В число считываемых процессором команд, подаваемых программой(-ами) 624, входят команды, в результате выполнения которых устройство 610 выполняет следующее: (i) генерацию с применением цифровой камеры, связанной с устройством, первого электронного файла, содержащего двухмерное оцифрованное изображение документа, имеющего предварительно отформатированные поля для ввода контрольных меток, и (ii) применение устройства или удаленного процессора для: (а) обнаружения в первом файле символов, определяющих документ, и маркеров, определяющих местоположение и ориентацию фрагментов, содержащих предварительно отформатированные поля, (b) генерирования второго файла, в котором двухмерное оцифрованное изображение изменено в соответствии с ориентацией и размером цифрового шаблона документа, (с) применения цифрового шаблона для извлечения в электронном виде из второго файла оцифрованных изображений предварительно отформатированных полей, и (d) обнаружения контрольных меток в предварительно отформатированных полях на основе количества пикселей в них, не относящихся к фону.
Другие считываемые процессором команды программ(-ы) 624 дополнительно указывают на функции и элементы, описанные выше в отношении способа 100. Считываемые процессором команды необязательно или дополнительно также обеспечивают пользователям устройства 610 доступ к ресурсам компьютерной сети или архитектуре облачных вычислений.
Объекты настоящего изобретения были описаны выше в отношении методов применения мобильного обрабатывающего устройства для обработки пользовательских контрольных меток в документах, имеющих предварительно отформатированные поля для ввода контрольных меток. Однако предполагается, что фрагменты настоящего изобретения могут быть альтернативно или дополнительно реализованы в виде отдельных программных продуктов или элементов других программных продуктов. Также предполагается, что все утверждения, в которых перечислены принципы, объекты, варианты реализации изобретения и его конкретные примеры, охватывают как структурные, так и функциональные эквиваленты изобретения.
Специалистам в данной области будет понятно, что в устройства, способы и программные продукты настоящего изобретения могут быть внесены различные изменения без отклонения от сущности или объема изобретения. Таким образом, предполагается, что настоящее изобретение включает в себя изменения, которые находятся в рамках объема изобретения и его эквивалентов.

Claims (45)

1. Способ применения мобильного обрабатывающего устройства для обработки контрольных меток в документе, имеющем предварительно отформатированные поля для ввода контрольных меток, содержащий:
применение цифровой камеры, связанной с устройством, для генерации первого электронного файла, содержащего двухмерное оцифрованное изображение документа; и
применение устройства для:
(a) обнаружения в первом файле идентификаторов документа и маркеров, определяющих местоположение и ориентацию фрагментов, содержащих предварительно отформатированные поля;
(b) генерации второго файла, в котором двухмерное оцифрованное изображение изменено в соответствии с цифровым шаблоном документа;
(c) применения цифрового шаблона для извлечения в электронном виде из второго файла оцифрованных изображений предварительно отформатированных полей; и
(d) обнаружения присутствия контрольных меток в оцифрованных изображениях предварительно отформатированных полей на основе анализа в них пикселей, не относящихся к фону.
2. Способ по п. 1, в котором устройство представляет собой мобильный телефон, мобильное вычислительное устройство или цифровую камеру.
3. Способ по п. 1, в котором:
документ представляет собой форму, контрольный список, анкету или их множество; и
документ представляет собой одностраничную статью или многостраничную статью, причем страницы снабжены выборочными идентификаторами.
4. Способ по п. 1, дополнительно содержащий применение в качестве маркеров (i) предварительно выбранных графических символов или графических изображений или (ii) по меньшей мере фрагмента предварительно отформатированных полей.
5. Способ по п. 1, в котором этап (b) дополнительно содержит одно или более из: кадрирования, определения ориентации страницы, исправления искажений перспективы и масштабирования двухмерного оцифрованного изображения документа в электронном виде.
6. Способ по п. 1, в котором этап (с) дополнительно содержит удаление второго файла.
7. Способ по п. 1, в котором этап (d) дополнительно содержит в извлеченных оцифрованных изображениях (i) вычитание фоновых пикселей и определение ситуации, когда количество оставшихся пикселей превышает первый предварительно выбранный порог, или (ii) определение ситуации, когда отношение пикселей, не относящихся к фону, ко всем пикселям превышает второй предварительно выбранный порог.
8. Способ по п. 1, в котором этап (d) дополнительно содержит применение устройства для сохранения результатов обнаружения обнаруженных контрольных меток в предварительно выбранном формате.
9. Способ по п. 1, дополнительно содержащий выполнение этапов (a)-(d) для множества документов, имеющих предварительно отформатированные поля для ввода контрольных меток.
10. Способ по п. 9, дополнительно содержащий накопление данных на основе контрольных меток, обнаруженных во множестве документов, в предварительно выбранном формате; и анализ накопленных данных.
11. Способ по п. 1, в котором устройство соединено с ресурсами компьютерной сети или архитектурой облачных вычислений.
12. Платформа для обработки контрольных меток в документе, имеющем предварительно отформатированные поля для ввода контрольных меток, содержащая:
мобильное обрабатывающее устройство, связанное с цифровой камерой, выполненной с возможностью генерации первого файла, содержащего двухмерное оцифрованное изображение документа; и
локальный процессор, оснащенный аппаратными или программными ресурсами, выполненными с возможностью:
(a) обнаружения в первом файле идентификаторов документа и маркеров, определяющих местоположение и ориентацию фрагментов, содержащих предварительно отформатированные поля;
(b) генерации второго файла, в котором двухмерное оцифрованное изображение изменено в соответствии с цифровым шаблоном документа;
(c) применения цифрового шаблона для извлечения в электронном виде из второго файла оцифрованных изображений предварительно отформатированных полей; и
(d) обнаружения присутствия контрольных меток в оцифрованных изображениях предварительно отформатированных полей на основе анализа в них пикселей, не относящихся к фону.
13. Платформа по п. 12, в которой:
устройство представляет собой мобильный телефон, мобильное вычислительное устройство или цифровую камеру;
документ представляет собой форму, контрольный список, анкету или их множество;
документ представляет собой одностраничную статью или многостраничную статью, причем страницы снабжены выборочными идентификаторами;
контрольные метки наносятся вручную, с помощью штампующего устройства или печати; и
результаты обнаружения контрольных меток сохраняются в предварительно выбранном формате с применением устройства.
14. Платформа по п. 12, в которой (i) маркеры представляют собой предварительно выбранные графические символы или графические изображения или (ii) в качестве маркеров применяется по меньшей мере фрагмент предварительно отформатированных полей.
15. Платформа по п. 12, в которой локальный объект выполнен с возможностью одного или более из кадрирования, определения ориентации страницы, исправления искажений перспективы и масштабирования двухмерного оцифрованного изображения документа в электронном виде.
16. Платформа по п. 12, в которой устройство соединено с ресурсами компьютерной сети или архитектурой облачных вычислений.
17. Машиночитаемый носитель, на котором хранятся считываемые процессором команды для обработки контрольных меток в документе, имеющем предварительно отформатированные поля для ввода контрольных меток, причем результатом исполнения команд на мобильном обрабатывающем устройстве, связанном с цифровой камерой, является выполнение устройством следующего применение цифровой камеры для генерации первого файла, содержащего двухмерное оцифрованное изображение документа; и выборочное применение устройства для:
(a) обнаружения в первом файле идентификаторов документа и маркеров, определяющих местоположение и ориентацию фрагментов, содержащих предварительно отформатированные поля;
(b) генерации второго файла, в котором двухмерное оцифрованное изображение изменено в соответствии с цифровым шаблоном документа;
(c) применения цифрового шаблона для извлечения в электронном виде из второго файла оцифрованных изображений предварительно отформатированных полей; и
(d) обнаружения присутствия контрольных меток в оцифрованных изображениях предварительно отформатированных полей на основе анализа в них пикселей, не относящихся к фону.
18. Носитель по п. 17, в котором команды дополнительно инициируют применение в качестве маркеров (i) предварительно выбранных графических символов или графических изображений или (ii) по меньшей мере фрагмента предварительно отформатированных полей.
19. Носитель по п. 17, в котором команды этапа (b) дополнительно инициируют одно или более из: кадрирования, определения ориентации страницы, исправления искажений перспективы и масштабирования двухмерного оцифрованного изображения документа в электронном виде.
20. Носитель по п. 17, в котором команды этапа (с) дополнительно инициируют удаление второго файла.
21. Носитель по п. 17, в котором команды этапа (d) дополнительно инициируют в извлеченных оцифрованных изображениях (i) вычитание фоновых пикселей и определение ситуации, когда количество оставшихся пикселей превышает первый предварительно выбранный порог, или (ii) определение ситуации, когда отношение пикселей, не относящихся к фону, ко всем пикселям превышает второй предварительно выбранный порог.
22. Носитель по п. 17, в котором команды этапа (d) дополнительно инициируют применение устройства для сохранения результатов обнаружения обнаруженных контрольных меток в предварительно выбранном формате.
RU2014125722A 2014-06-25 2014-06-25 Методы обнаружения введенных пользователем контрольных меток RU2656573C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2014125722A RU2656573C2 (ru) 2014-06-25 2014-06-25 Методы обнаружения введенных пользователем контрольных меток
US14/509,188 US9396389B2 (en) 2014-06-25 2014-10-08 Techniques for detecting user-entered check marks

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014125722A RU2656573C2 (ru) 2014-06-25 2014-06-25 Методы обнаружения введенных пользователем контрольных меток

Publications (2)

Publication Number Publication Date
RU2014125722A RU2014125722A (ru) 2015-12-27
RU2656573C2 true RU2656573C2 (ru) 2018-06-05

Family

ID=54930888

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014125722A RU2656573C2 (ru) 2014-06-25 2014-06-25 Методы обнаружения введенных пользователем контрольных меток

Country Status (2)

Country Link
US (1) US9396389B2 (ru)
RU (1) RU2656573C2 (ru)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3047832B1 (fr) * 2016-02-12 2019-09-27 Idemia Identity And Security Procede de determination d'une valeur de couleur d'un objet dans une image
CN107295357B (zh) * 2016-04-01 2021-03-16 深圳平安综合金融服务有限公司 影像文件资料录入方法、云服务器及终端
US10853800B1 (en) * 2017-04-25 2020-12-01 United Services Automobile Association (Usaa) Document generation with dynamic watermarking
WO2020122896A1 (en) * 2018-12-12 2020-06-18 Hewlett-Packard Development Company, L.P. Source identification of printed media
CN110490190B (zh) * 2019-07-04 2021-10-26 贝壳技术有限公司 一种结构化图像文字识别方法及系统
US20230073775A1 (en) * 2021-09-06 2023-03-09 Nathalie Goldstein Image processing and machine learning-based extraction method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2249251C2 (ru) * 1999-06-21 2005-03-27 Де ла рю Жиори С.А. Автоматическое распознавание символов на структурированном фоне при помощи комбинирования моделей фона и символов
US20080253623A1 (en) * 2007-04-13 2008-10-16 Advanced Us Technology Group, Inc. Method for recognizing content in an image sequence
US20090307579A1 (en) * 2007-01-22 2009-12-10 Cfph, Llc Viewing file modifications
US20110010241A1 (en) * 2000-09-28 2011-01-13 Michael Mays Devices, Methods, and Systems for Managing Route-Related Information
US20110029443A1 (en) * 2009-03-12 2011-02-03 King Martin T Performing actions based on capturing information from rendered documents, such as documents under copyright
US20110025842A1 (en) * 2009-02-18 2011-02-03 King Martin T Automatically capturing information, such as capturing information using a document-aware device

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6970267B1 (en) 2001-01-12 2005-11-29 Scan-Optics Inc. Gray scale optical mark reader
US7552381B2 (en) 2003-03-31 2009-06-23 Ricoh Co., Ltd. Check boxes for identifying and processing stored documents
US7257256B2 (en) 2003-07-24 2007-08-14 Sap Ag Method and system for recognizing date
US20050022124A1 (en) 2003-07-24 2005-01-27 Tunney William Patrick Method and system for recognizing questionnaire data based on shape
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US7812860B2 (en) * 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US7564587B2 (en) 2006-05-24 2009-07-21 Scan-0ptics LLC Method of scoring a printed form having targets to be marked
US7978900B2 (en) * 2008-01-18 2011-07-12 Mitek Systems, Inc. Systems for mobile image capture and processing of checks
US8542411B2 (en) 2010-03-24 2013-09-24 Seiko Epson Corporation Creating and processing a mark-able document

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2249251C2 (ru) * 1999-06-21 2005-03-27 Де ла рю Жиори С.А. Автоматическое распознавание символов на структурированном фоне при помощи комбинирования моделей фона и символов
US20110010241A1 (en) * 2000-09-28 2011-01-13 Michael Mays Devices, Methods, and Systems for Managing Route-Related Information
US20090307579A1 (en) * 2007-01-22 2009-12-10 Cfph, Llc Viewing file modifications
US20080253623A1 (en) * 2007-04-13 2008-10-16 Advanced Us Technology Group, Inc. Method for recognizing content in an image sequence
US20110025842A1 (en) * 2009-02-18 2011-02-03 King Martin T Automatically capturing information, such as capturing information using a document-aware device
US20110035656A1 (en) * 2009-02-18 2011-02-10 King Martin T Identifying a document by performing spectral analysis on the contents of the document
US20110029443A1 (en) * 2009-03-12 2011-02-03 King Martin T Performing actions based on capturing information from rendered documents, such as documents under copyright

Also Published As

Publication number Publication date
US20150379339A1 (en) 2015-12-31
RU2014125722A (ru) 2015-12-27
US9396389B2 (en) 2016-07-19

Similar Documents

Publication Publication Date Title
RU2656573C2 (ru) Методы обнаружения введенных пользователем контрольных меток
US11106891B2 (en) Automated signature extraction and verification
US9785627B2 (en) Automated form fill-in via form retrieval
CN106326888B (zh) 图像识别方法和装置
CN103020619B (zh) 一种自动切分电子化笔记本中手写条目的方法
US20150169951A1 (en) Comparing documents using a trusted source
AU2017302245B2 (en) Optical character recognition utilizing hashed templates
WO2014086277A1 (zh) 方便电子化的专业笔记本及其页码自动识别方法
EP2890100B1 (en) Image processing apparatus
CN112508011A (zh) 一种基于神经网络的ocr识别方法及设备
US10083353B2 (en) Identifying document forms using digital fingerprints
CN110909740A (zh) 信息处理装置以及存储介质
US20110064304A1 (en) Electronic document comparison system and method
Hossain et al. Optical character recognition based on template matching
US9818028B2 (en) Information processing apparatus for obtaining a degree of similarity between elements
RU2597163C2 (ru) Сравнение документов с использованием достоверного источника
JP6217407B2 (ja) 情報処理システム、情報処理装置及びプログラム
JP2013061590A (ja) 答案処理装置、答案処理方法、プログラム、およびシール
US11715318B2 (en) Systems and methods for spatial-aware information extraction from electronic source documents
KR101498546B1 (ko) 문서 디지털 복원 시스템 및 방법
CN115937887A (zh) 文档结构化信息的提取方法及装置、电子设备、存储介质
CN108734167B (zh) 一种被污染的胶片文字识别方法
GB2473228A (en) Segmenting Document Images
CN117475453B (zh) 一种基于ocr的文书检测方法、装置及电子设备
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム

Legal Events

Date Code Title Description
HE9A Changing address for correspondence with an applicant
PC43 Official registration of the transfer of the exclusive right without contract for inventions

Effective date: 20181121

QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311