RU2604668C2 - Визуализация машинно-генерируемого изображения документа - Google Patents

Визуализация машинно-генерируемого изображения документа Download PDF

Info

Publication number
RU2604668C2
RU2604668C2 RU2014124525/08A RU2014124525A RU2604668C2 RU 2604668 C2 RU2604668 C2 RU 2604668C2 RU 2014124525/08 A RU2014124525/08 A RU 2014124525/08A RU 2014124525 A RU2014124525 A RU 2014124525A RU 2604668 C2 RU2604668 C2 RU 2604668C2
Authority
RU
Russia
Prior art keywords
identifiers
image
document
structural blocks
lines
Prior art date
Application number
RU2014124525/08A
Other languages
English (en)
Other versions
RU2014124525A (ru
Inventor
Сергей Анатольевич Кузнецов
Original Assignee
Общество с ограниченной ответственностью "Аби Девелопмент"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Аби Девелопмент" filed Critical Общество с ограниченной ответственностью "Аби Девелопмент"
Priority to RU2014124525/08A priority Critical patent/RU2604668C2/ru
Priority to US14/508,617 priority patent/US20150363658A1/en
Publication of RU2014124525A publication Critical patent/RU2014124525A/ru
Application granted granted Critical
Publication of RU2604668C2 publication Critical patent/RU2604668C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/945User interactive design; Environments; Toolboxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Abstract

Изобретение относится к области оптического и интеллектуального распознавания символов. Технический результат - обеспечение визуализации результатов машинной интерпретации при помощи технологии оптического распознавания символов изображения документа посредством снабжения изображения документа визуально различимыми линейными идентификаторами. Способ сопровождения изображения документа средствами визуализации содержит: обнаружение структурных блоков или их фрагментов на изображении документа с использованием технологии оптического распознавания символов; снабжение обнаруженных на изображении документа структурных блоков или их фрагментов визуально различимыми линейными идентификаторами, где каждый линейный идентификатор несет указание на свойства содержимого соответствующего структурного блока или его фрагмента, обнаруженные в ходе машинной интерпретации изображения; отображение изображения документа, снабженного визуально различимыми линейными идентификаторами. 3 н. и 18 з.п. ф-лы, 3 ил.

Description

УРОВЕНЬ ТЕХНИКИ
ОБЛАСТЬ ПРИМЕНЕНИЯ ИЗОБРЕТЕНИЯ
Настоящее изобретение относится к области оптического распознавания символов (OCR) и интеллектуального распознавания символов (ICR).
УРОВЕНЬ ТЕХНИКИ НАСТОЯЩЕГО ИЗОБРЕТЕНИЯ
Методы OCR/ICR по существу используются для преобразования изображений печатных документов в машиночитаемые и редактируемые форматы, а также для извлечения данных из документов. В процессе функционирования устройства с поддержкой OCR/ICR выполняют компьютеризованное сканирование документов и машинный анализ полученных сканированных изображений (т.е. файлов сканированных документов).
При отображении результатов машинного анализа устройства с поддержкой OCR/ICR, как правило, выявляют распознанные и нераспознанные фрагменты документов с использованием различных схем выделения. Однако различия в цветопередаче компьютерных дисплеев и принтеров, а также различия в восприятии цвета пользователями могут ограничивать объем выводимой информации с цветовым кодированием или приводить к ошибкам при интерпретации.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
Предложены методы визуализации машинно-генерируемого изображения документа. Изображение по существу получается при помощи устройств с поддержкой OCR/ICR. На изображении выявляются структурные блоки документа и дополняются линейными идентификаторами, которые обозначают свойства и состояния машинной интерпретации содержимого структурных блоков.
В приложениях такие идентификаторы (одиночные или множественные непрерывные, штриховые, пунктирные или штрихпунктирные линии, имеющие участки одинаковой или разной ширины, линии, образованные с использованием предварительно выбранных символов, и т.п.) используются для выборочного разделения, подчеркивания или штриховки по меньшей мере фрагментов структурных блоков.
В дополнительных вариантах реализации пользователям, работающим с изображением документа, предложены инструменты графического интерфейса пользователя (GUI), выполненные с возможностью применения дополнительных идентификаторов на машинно-генерируемом изображении или изменения/замены существующих идентификаторов. Впоследствии такие редакторские правки, выполненные пользователем, можно встроить в изображение документа.
Различные другие объекты и варианты реализации изобретения более подробно описаны ниже. Предполагается, что элементы одного варианта реализации изобретения могут быть использованы в других вариантах его реализации без дополнительного перечисления.
Раскрытие изобретения не представляет собой в полной мере и в полном объеме настоящее изобретение и не должно считаться таковым. Все объекты, элементы и преимущества настоящего изобретения будут очевидны из следующего подробного письменного описания и в соответствии с прилагаемыми рисунками.
Новые элементы, которые считаются характерными для описания, изложены в прилагаемых пунктах формулы изобретения.
Техническим результатом описанного ниже изобретения является визуализация результатов машинной интерпретации при помощи технологии оптического распознавания символов OCR/ICR изображения документа для пользователя путем снабжения входящего в систему изображения документа визуально различимыми линейными идентификаторами, каждый из которых несет указание на свойства содержимого соответствующего структурного блока или его фрагмента, обнаруженные в ходе машинной интерпретации изображения. В частности, обеспечивается визуализация результатов обработки документа таким образом, что на изображении выявляются структурные блоки документа и дополняются линейными идентификаторами, которые обозначают свойства содержимого структурных блоков. По существу, каждый идентификатор выборочно визуализирует конкретную характеристику машинной интерпретации документа, а доступность большого объема визуально различимых идентификаторов позволяет предоставить пользователям, просматривающим изображение, подробную информацию о результатах этого процесса.
КРАТКОЕ ОПИСАНИЕ РИСУНКОВ
На Фиг.1 представлена схема, на которой показан способ визуализации машинно-генерируемого изображения документа в соответствии с одним вариантом реализации настоящего изобретения.
На Фиг.2 представлен пример машинно-генерируемого изображения, на котором показан способ, изображенный на Фиг.1, в соответствии с одним вариантом реализации настоящего изобретения.
На Фиг.3 представлен пример компьютерной платформы, на которой используется способ, изображенный на Фиг.1, в соответствии с одним вариантом реализации настоящего изобретения.
Изображения на рисунках представлены в упрощенном виде для целей иллюстрации и приведены без соблюдения масштаба.
Для облегчения понимания на рисунках по возможности используются идентичные номера позиций для обозначения, где это возможно, идентичных элементов на рисунках, за исключением того, что к ним могут быть добавлены буквенно-цифровые дополнительные элементы и/или суффиксы, если это необходимо, для разграничения таких элементов.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
Объекты, элементы и преимущества настоящего изобретения описаны ниже в отношении средства визуализации машинно-генерируемых изображений печатных документов, анализируемых с использованием устройств с поддержкой OCR/ICR. Предполагается, что по меньшей мере фрагменты настоящего изобретения также могут использоваться для визуализации свойств или редактирования других типов документов или их изображений (например, компьютерной графики, документов после машинного перевода и т.п.).
На Фиг.1 представлена схема, на которой показан способ 100 визуализации машинно-генерируемого изображения документа в соответствии с одним вариантом реализации настоящего изобретения, а на Фиг.2 представлен пример машинно-генерируемого изображения 200, на котором показан способ, изображенный на Фиг.1. Для лучшего понимания изобретения рекомендовано рассматривать Фиг.1 и 2 одновременно.
Способ 100 начинается с этапа 102 и переходит к этапу 110.
На этапе 110 формируется машинно-генерируемое изображение документа (например, печатного документа). Как правило, изображение формируется с использованием компьютеризованного сканирования документа, выполняемого с использованием устройства с поддержкой OCR/ICR, и включает в себя результаты «машинного анализа» файла сканированного документа на компьютере. Затем изображение предлагается пользователю (-ям) для визуального осмотра в форме одного или нескольких изображений на экране, снимков экрана или их распечатки (-ок).
Как правило, в процессе машинного анализа файла сканированного документа на компьютере генерируется изображение, в котором содержимое документа представлено в форме отдельных структурных или логических блоков. Такой процесс описан, например, в патенте Соединенных Штатов Америки №8,260,049 В2, выданном 4 сентября 2012 г. и принадлежащем тому же правообладателю.
Фрагменты структурных блоков могут быть представлены в монохромном (например, черно-белом, сине-белом и т.д.) или многоцветном форматах, а также могут быть обеспечены другими элементами форматирования для разделения конкретных текстовых и графических элементов документа. В некоторых вариантах реализации изображение также может включать в себя машинно-генерируемые примечания, которые помогают пользователям (например, просматривающим изображение) оценить точность машинного анализа документа или его конкретных структурных блоков.
На Фиг.2 представлен пример машинно-генерируемого изображения 200 сканированного и интерпретированного компьютером документа, которое включает в себя структурные блоки 210, 220, 230, 240 и 250. Для иллюстрации показано, что структурные блоки 210, 220, 230 и 240 представляют собой преимущественно структурные блоки с текстом (например, заголовок, реферат, таблица, верхний колонтитул, нижний колонтитул и т.д.) сканированного документа (конкретные текстовые объекты структурных блоков не показаны для целей ясности), а структурный блок 250 содержит графический/изображаемый объект 256.
На этапе 120 машинно-генерируемое изображение документа (например, изображение 200) представлено с линейными идентификаторами свойств и результатов машинного анализа (т.е. интерпретацией файла сканирования, выполненной компьютерной программой OCR/ICR) содержимого структурных блоков документа. В отображаемом/распечатанном изображении документа такие идентификаторы могут применяться к структурным блокам или их фрагментам в форме отдельных линий, линий границ, линий подчеркивания, линий штриховки и т.п.
В различных вариантах реализации в качестве идентификаторов могут использоваться различные одиночные или множественные (например, включающие две или более параллельных ветвей) прямые или кривые линии, имеющие участки одинаковой или разной ширины, а также линии, образованные с использованием предварительно выбранных символов (например, «#», «*», «» и т.д.), или комбинации этих линий. Примеры одиночных и множественных линий, подходящих для использования в качестве идентификаторов, включают в себя, помимо прочих линий, образованных с использованием предварительно выбранных геометрических образцов, сплошные, волнистые, штриховые, пунктирные или штрихпунктирные линии, а также ломаные или зазубренные («зигзагообразные») линии. Количество таких визуально различимых линейных идентификаторов практически бесконечно. Таким образом, пользователи могут получать большие объемы информации о статусе машинного анализа сканированного документа.
По существу каждый идентификатор выборочно визуализирует конкретную характеристику или предварительно выбранный этап процесса машинной интерпретации документа, а доступность большого объема визуально различимых идентификаторов позволяет предоставить пользователям, просматривающим изображение, подробную информацию о результатах этого процесса. В вариантах реализации способа 100 количество, геометрические характеристики и значения используемых идентификаторов могут различаться, а пользователям также могут быть предоставлены списки (библиотеки) идентификаторов.
Помимо прочих результатов машинной интерпретации документа конкретные идентификаторы могут указывать на тип содержимого структурного блока (текст, таблица, графический элемент, рисунок и т.д.), направление чтения или ориентации символов текста, наличие текста, написанного на конкретных языках, степень уверенности в интерпретации содержимого. В дополнительных вариантах реализации пользователи могут выбрать геометрические параметры или внешний вид идентификаторов (например, типы или ширину линий и т.д.), а также их конфигурацию или положение на изображении документа. В частности, идентификаторы можно расположить рядом с одной или несколькими сторонами структурного блока или образовать из них замкнутые или в альтернативном варианте частично открытые линии границ, расположенные рядом с периферийными участками одного или нескольких структурных блоков. Например, два одинаковых или разных идентификатора могут быть расположены перпендикулярно друг другу для образования угловой границы рядом с, например, нижней и правой сторонами (или периферийными участками) структурного блока.
В предпочтительном варианте реализации цвет идентификаторов (т.е. цвет элементов линий, образующих соответствующие идентификаторы) является черным. Однако в альтернативных вариантах реализации все идентификаторы или их часть могут быть образованы с использованием линий одинакового (т.е. монохромные линии) или разных цветов с предварительно выбранными оттенками или яркостью, включая многоцветные линии и линии, элементы которых имеют разные цвета (например, линии, имеющие штрихи, точки и т.д. разных цветов). В частности, идентификаторы могут включать в себя линии, имеющие их фрагменты или конкретные элементы, представленные с использованием, например, черного, синего, красного, зеленого, желтого, оранжевого и других цветов, а также комбинаций таких цветов.
На Фиг.2 представлены структурные блоки 210, 220, 230, 240 и 250 с произвольно выбранными линейными идентификаторами, описанными выше на этапе 120 способа 100. Для иллюстрации в настоящем описании верхняя горизонтальная одиночная сплошная линия указывает на то, что содержимое структурного блока представляет собой текст, написанный на родном языке пользователя (идентификаторы 211, 221, 241), верхняя одиночная штрихпунктирная линия указывает на то, что содержимое структурного блока представляет собой текст, написанный на иностранном языке (идентификатор 231), вертикальная одиночная пунктирная линия указывает на то, что содержимое структурного блока представляет собой таблицу (идентификаторы 232, 242), вертикальная одиночная штриховая линия указывает на направление чтения текста или таблицы (идентификаторы 214, 224, 234, 244), подчеркивающая (нижняя) одиночная волнистая линия указывает на завершение интерпретации содержимого структурного блока (идентификаторы 223, 243), а подчеркивающая двойная штриховая линия указывает на то, что структурный блок представляет собой заголовок/подзаголовок (идентификатор 213).
Соответственно, вертикальная одиночная сплошная линия указывает на то, что результаты машинной интерпретации содержимого были проверены/утверждены (идентификаторы 212, 222), нижняя горизонтальная двойная сплошная линия указывает на запрос на ввод пользователем в процессе интерпретации содержимого структурного блока (идентификатор 233), двойная штрихпунктирная линия указывает на то, что содержимое структурного блока является графическим элементом (идентификаторы 251-254), а линии штриховки (идентификатор 255) указывают на площадь, занятую графическим/изображаемым объектом.
В одном варианте реализации после завершения этапа 120 способ 100 заканчивается на этапе 142. В альтернативном варианте реализации после завершения этапа 120 способ 100 выполняет необязательные этапы 130 и 140.
На необязательном этапе 130 пользователям, работающим с машинно-генерируемым изображением сканированного документа, предлагаются инструменты графического интерфейса пользователя (GUI), которые позволяют применять, изменять или заменять идентификаторы структурных блоков на отображаемом изображении документа. Такие инструменты редактирования GUI могут быть предложены пользователям компьютерного терминала, выполненного с возможностью обеспечивать редактирование отображаемого изображения в режиме реального времени.
На необязательном этапе 140 результаты выполненного пользователем редактирования машинно-генерируемого изображения документа (т.е. примененные, измененные или замененные идентификаторы) встраиваются в отображаемое изображение. В одном варианте реализации отредактированные пользователем версии изображения сохраняются и впоследствии используются в качестве его исправленных версий.
После завершения необязательного этапа 140 способ 100 заканчивается на этапе 142.
На Фиг.3 представлен пример компьютеризованной платформы 300, на которой используется способ 100, изображенный на Фиг.1, в соответствии с одним вариантом реализации настоящего изобретения. Специалисту в данной области будет понятно, что аппаратные и программные конфигурации, изображенные на Фиг.3, могут меняться.
Платформа 300 по существу включает в себя компьютер 310, периферийные устройства 340 (сканеры, дисплеи, принтеры и т.д.) и необязательно подключена к сети 340 (например, внутренней сети, локальной/глобальной сети (LAN/WAN) или сети Интернет). В качестве компьютера 310 может использоваться рабочая станция общего или специального назначения, стационарный или мобильный компьютер или мобильное устройство связи (например, карманный компьютер (PDA), мобильный телефон и т.п.).
Компьютер 310 по существу включает в себя процессор 312, память 314, вспомогательные системы 318, системный интерфейс 302 и контроллер ввода/вывода - 316, обеспечивающий возможность связи с периферийными устройствами 340 и сетью 350. В качестве компонентов компьютера 310 могут использоваться аппаратные устройства, программные модули, микропрограммное обеспечение или их комбинации.
В изображенном варианте реализации в модуле памяти 314 хранится операционная система (ОС) 320 (например, Microsoft Windows®, GNU®/Linux® и т.д.) и прикладные программы (т.е. программные продукты для компьютера) 322. В альтернативных вариантах реализации по меньшей мере фрагменты ОС 320 и прикладные программы 322 могут находиться на удаленном вычислительном устройстве (например, сервере в сети 350), соединенном с компьютером 310.
Прикладные программы 322 на компьютере 310 включают в себя программу (-ы) OCR/ICR 324. В число считываемых процессором команд, подаваемых программой (-ами) OCR/ICR 324, входят команды, исполнение которых приводит к выполнению компьютером 310 следующих действий: (i) определение структурных блоков на машинно-генерируемом изображении сканированного документа и (ii) снабжение изображения линейными идентификаторами свойств и состояний интерпретации содержимого структурных блоков.
Другие считываемые процессором команды, подаваемые программой (-ами) OCR/ICR 324, дополнительно определяют функции и элементы таких идентификаторов, а также их использование для визуализации машинно-генерируемого изображения документа, как описано выше в отношении способа 100. Считываемые процессором команды также необязательно или дополнительно предлагают пользователям компьютера 310 инструменты GUI, выполненные с возможностью редактировать идентификаторы, используемые в сканированных документах.
Объекты настоящего изобретения были описаны выше в отношении визуализации машинно-генерируемых изображений документов, сформированных с использованием методов на основе OCR/ICR, однако предполагается, что фрагменты данного изобретения могут быть альтернативно или дополнительно реализованы в виде отдельных программных продуктов или элементов других программных продуктов. Также предполагается, что все утверждения, в которых перечислены принципы, объекты, варианты реализации изобретения и его конкретные примеры, охватывают как структурные, так и функциональные эквиваленты изобретения.
Специалистам в данной области будет понятно, что в устройства, способы и программные продукты настоящего изобретения можно вносить различные изменения, не отклоняясь от сущности или объема изобретения. Таким образом, предполагается, что настоящее изобретение включает в себя изменения, которые находятся в рамках объема изобретения и его эквивалентов.

Claims (21)

1. Способ сопровождения изображения документа средствами визуализации, содержащий:
обнаружение структурных блоков или их фрагментов на изображении документа с использованием технологии оптического распознавания символов; и
снабжение обнаруженных на изображении документа структурных блоков или их фрагментов визуально различимыми линейными идентификаторами, где каждый линейный идентификатор несет указание на свойства содержимого соответствующего структурного блока или его фрагмента, обнаруженные в ходе машинной интерпретации изображения;
отображение изображения документа, снабженного визуально различимыми линейными идентификаторами.
2. Способ по п. 1, в котором изображение документа обрабатывается методами оптического распознавания символов (OCR) или интеллектуального распознавания символов (ICR).
3. Способ по п. 1, в котором структурные блоки содержат текстовые объекты, графические/изображаемые объекты или их комбинацию.
4. Способ по п. 1, дополнительно содержащий:
применение идентификаторов для выборочного разделения, подчеркивания или штриховки по меньшей мере фрагментов структурных блоков.
5. Способ по п. 1, дополнительно содержащий:
использование идентификаторов, включающих (i) одиночные или множественные сплошные, штриховые, пунктирные, штрихпунктирные, ломаные или волнистые линии, имеющие участки одинаковой или разной ширины, или (ii) линии, образованные с использованием предварительно выбранных символов или предварительно выбранных геометрических эталонов.
6. Способ по п. 1, дополнительно содержащий:
размещение идентификаторов рядом с периферийными участками структурных блоков.
7. Способ по п. 1, в котором идентификаторы включают в себя (i) линии одного цвета или разных цветов или (ii) линии, имеющие элементы разных цветов.
8. Способ по п. 1, дополнительно содержащий:
предложение пользователям, работающим с изображением документа, инструментов графического интерфейса пользователя (GUI) для применения, изменения или замены идентификаторов структурных блоков.
9. Способ по п. 1, дополнительно содержащий:
встраивание в машинно-генерируемое изображение документа примененных, измененных или замененных идентификаторов.
10. Способ по п. 1, в котором указание на свойства содержимого соответствующего структурного блока или его фрагмента могут включать указание на тип содержимого структурного блока, направление чтения, ориентации символов текста, наличие текста, написанного на конкретных языках, степень уверенности в интерпретации содержимого.
11. Платформа для снабжения изображения документа средствами визуализации, содержащая:
локальное, удаленное, распределенное или сетевое вычислительное устройство; и
память, локально или удаленно соединенную с вычислительным устройством и хранящую команды, исполнение которых на вычислительном устройстве приводит к выполнению вычислительным устройством следующих действий:
обнаружение структурных блоков или их фрагментов на изображении документа с использованием технологии оптического распознавания символов; и
снабжение обнаруженных на изображении документа структурных блоков или их фрагментов визуально различимыми линейными идентификаторами, где каждый линейный идентификатор несет указание на свойства содержимого соответствующего структурного блока или его фрагмента, обнаруженные в ходе машинной интерпретации изображения;
отображение изображения документа, снабженного визуально различимыми линейными идентификаторами.
12. Платформа по п. 11, дополнительно содержащая сканирующее устройство, выполненное с возможностью получения по меньшей мере фрагментов изображения документа.
13. Платформа по п. 11, в которой:
изображение документа обрабатывается методами оптического распознавания символов (OCR) или интеллектуального распознавания символов (ICR); и
структурные блоки содержат текстовые объекты, графические/изображаемые объекты или их комбинацию.
14. Платформа по п. 11, в которой идентификаторы выполнены с возможностью выборочно разделять, подчеркивать или штриховать по меньшей мере фрагменты структурных блоков и содержат (i) одиночные или множественные сплошные, штриховые, пунктирные, штрихпунктирные, ломаные или волнистые линии, имеющие участки одинаковой или разной ширины, или (ii) линии, образованные с использованием предварительно выбранных символов или предварительно выбранных геометрических образцов.
15. Платформа по п. 11, в которой:
идентификаторы размещены рядом с периферийными участками структурных блоков; и
идентификаторы включают в себя (i) линии одинакового или разных цветов или (ii) линии, имеющие элементы разных цветов.
16. Платформа по п. 11, в которой:
пользователям, работающим с изображением документа, предлагаются инструменты графического пользовательского интерфейса (GUI) для применения, изменения и замены идентификаторов структурных блоков; и
примененные, измененные или замененные идентификаторы встраиваются в машинно-генерируемое изображение документа.
17. Носитель для хранения считываемых процессором команд, исполнение которых на вычислительном устройстве приводит к выполнению вычислительным устройством следующих действий для сопровождения изображения документа средствами визуализации:
обнаружение структурных блоков или их фрагментов на изображении документа с использованием технологии оптического распознавания символов; и
снабжение обнаруженных на изображении документа структурных блоков или их фрагментов визуально различимыми линейными идентификаторами, где каждый линейный идентификатор несет указание на свойства содержимого соответствующего структурного блока или его фрагмента, обнаруженные в ходе машинной интерпретации изображения;
отображение изображения документа, снабженного визуально различимыми линейными идентификаторами.
18. Носитель по п. 17, в котором в результате выполнения команд дополнительно происходит:
обработка изображения документа с использованием методов оптического распознавания символов (OCR) или интеллектуального распознавания символов (ICR).
19. Носитель по п. 17, в котором в результате выполнения команд дополнительно происходит:
применение идентификаторов для выборочного разделения, подчеркивания или штриховки по меньшей мере фрагментов структурных блоков; и
использование идентификаторов, содержащих (i) одиночные или множественные сплошные, штриховые, пунктирные, штрихпунктирные, ломаные или волнистые линии, имеющие участки одинаковой или разной ширины, или (ii) линии, образованные с использованием предварительно выбранных символов или предварительно выбранных геометрических эталонов.
20. Носитель по п. 17, в котором в результате выполнения команд дополнительно происходит:
размещение идентификаторов рядом с периферийными участками структурных блоков; и
использование идентификаторов, включающих в себя (i) линии одинакового или разных цветов или (ii) линии, имеющие элементы разных цветов.
21. Носитель по п. 17, в котором в результате выполнения команд дополнительно происходит:
предложение пользователям, работающим с изображением документа, инструментов графического интерфейса пользователя (GUI) для применения, изменения или замены идентификаторов структурных блоков; и
встраивание в машинно-генерируемое изображение документа примененных, измененных или замененных идентификаторов.
RU2014124525/08A 2014-06-17 2014-06-17 Визуализация машинно-генерируемого изображения документа RU2604668C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2014124525/08A RU2604668C2 (ru) 2014-06-17 2014-06-17 Визуализация машинно-генерируемого изображения документа
US14/508,617 US20150363658A1 (en) 2014-06-17 2014-10-07 Visualization of a computer-generated image of a document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014124525/08A RU2604668C2 (ru) 2014-06-17 2014-06-17 Визуализация машинно-генерируемого изображения документа

Publications (2)

Publication Number Publication Date
RU2014124525A RU2014124525A (ru) 2015-12-27
RU2604668C2 true RU2604668C2 (ru) 2016-12-10

Family

ID=54836422

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014124525/08A RU2604668C2 (ru) 2014-06-17 2014-06-17 Визуализация машинно-генерируемого изображения документа

Country Status (2)

Country Link
US (1) US20150363658A1 (ru)
RU (1) RU2604668C2 (ru)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2295154C1 (ru) * 2005-06-16 2007-03-10 "Аби Софтвер Лтд." Способ распознавания текстовой информации из графического файла с использованием словарей и дополнительных данных
US7400768B1 (en) * 2001-08-24 2008-07-15 Cardiff Software, Inc. Enhanced optical recognition of digitized images through selective bit insertion
RU2437152C2 (ru) * 2007-06-29 2011-12-20 Кэнон Кабусики Кайся Устройство обработки изображений, способ и компьютерная программа обработки изображений
US8718367B1 (en) * 2009-07-10 2014-05-06 Intuit Inc. Displaying automatically recognized text in proximity to a source image to assist comparibility

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434962A (en) * 1990-09-07 1995-07-18 Fuji Xerox Co., Ltd. Method and system for automatically generating logical structures of electronic documents
US5937084A (en) * 1996-05-22 1999-08-10 Ncr Corporation Knowledge-based document analysis system
US6562077B2 (en) * 1997-11-14 2003-05-13 Xerox Corporation Sorting image segments into clusters based on a distance measurement
US6694053B1 (en) * 1999-12-02 2004-02-17 Hewlett-Packard Development, L.P. Method and apparatus for performing document structure analysis
US7050630B2 (en) * 2002-05-29 2006-05-23 Hewlett-Packard Development Company, L.P. System and method of locating a non-textual region of an electronic document or image that matches a user-defined description of the region
US20040080795A1 (en) * 2002-10-23 2004-04-29 Bean Heather N. Apparatus and method for image capture device assisted scanning
US8571264B2 (en) * 2003-09-08 2013-10-29 Abbyy Development Llc Method of using structural models for optical recognition
US8054495B2 (en) * 2004-04-07 2011-11-08 Hewlett-Packard Development Company, L.P. Digital documents, apparatus, methods and software relating to associating an identity of paper printed with digital pattern with equivalent digital documents
US20060062453A1 (en) * 2004-09-23 2006-03-23 Sharp Laboratories Of America, Inc. Color highlighting document image processing
US8706475B2 (en) * 2005-01-10 2014-04-22 Xerox Corporation Method and apparatus for detecting a table of contents and reference determination
US7937653B2 (en) * 2005-01-10 2011-05-03 Xerox Corporation Method and apparatus for detecting pagination constructs including a header and a footer in legacy documents
JP4443443B2 (ja) * 2005-03-04 2010-03-31 富士通株式会社 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法
US7392473B2 (en) * 2005-05-26 2008-06-24 Xerox Corporation Method and apparatus for determining logical document structure
US20060290789A1 (en) * 2005-06-22 2006-12-28 Nokia Corporation File naming with optical character recognition
US7826665B2 (en) * 2005-12-12 2010-11-02 Xerox Corporation Personal information retrieval using knowledge bases for optical character recognition correction
JP4973063B2 (ja) * 2006-08-14 2012-07-11 富士通株式会社 表データ処理方法及び装置
JP4835459B2 (ja) * 2007-02-16 2011-12-14 富士通株式会社 表認識プログラム、表認識方法および表認識装置
US8260049B2 (en) * 2007-09-28 2012-09-04 Abbyy Software Ltd. Model-based method of document logical structure recognition in OCR systems
US8035855B2 (en) * 2008-02-01 2011-10-11 Xerox Corporation Automatic selection of a subset of representative pages from a multi-page document
US8107766B2 (en) * 2008-04-03 2012-01-31 Abbyy Software Ltd. Method and system for straightening out distorted text-lines on images
US8787690B2 (en) * 2008-11-12 2014-07-22 Abbyy Development Llc Binarizing an image
US8452086B2 (en) * 2009-07-10 2013-05-28 Palo Alto Research Center Incorporated System and user interface for machine-assisted human labeling of pixels in an image
US8340425B2 (en) * 2010-08-10 2012-12-25 Xerox Corporation Optical character recognition with two-pass zoning
US9223769B2 (en) * 2011-09-21 2015-12-29 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US9080882B2 (en) * 2012-03-02 2015-07-14 Qualcomm Incorporated Visual OCR for positioning
US9008443B2 (en) * 2012-06-22 2015-04-14 Xerox Corporation System and method for identifying regular geometric structures in document pages
US20140067631A1 (en) * 2012-09-05 2014-03-06 Helix Systems Incorporated Systems and Methods for Processing Structured Data from a Document Image
US9223756B2 (en) * 2013-03-13 2015-12-29 Adobe Systems Incorporated Method and apparatus for identifying logical blocks of text in a document
US9092688B2 (en) * 2013-08-28 2015-07-28 Cisco Technology Inc. Assisted OCR

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7400768B1 (en) * 2001-08-24 2008-07-15 Cardiff Software, Inc. Enhanced optical recognition of digitized images through selective bit insertion
RU2295154C1 (ru) * 2005-06-16 2007-03-10 "Аби Софтвер Лтд." Способ распознавания текстовой информации из графического файла с использованием словарей и дополнительных данных
RU2437152C2 (ru) * 2007-06-29 2011-12-20 Кэнон Кабусики Кайся Устройство обработки изображений, способ и компьютерная программа обработки изображений
US8718367B1 (en) * 2009-07-10 2014-05-06 Intuit Inc. Displaying automatically recognized text in proximity to a source image to assist comparibility

Also Published As

Publication number Publication date
US20150363658A1 (en) 2015-12-17
RU2014124525A (ru) 2015-12-27

Similar Documents

Publication Publication Date Title
US6226407B1 (en) Method and apparatus for analyzing computer screens
CA2676487C (en) Method for emphasizing differences in graphical appearance between an original document and a modified document with annotations
US20150169995A1 (en) Method and apparatus for finding differences in documents
US9772805B2 (en) Information processor and digital plate inspection method
AU2019229348B2 (en) Pre-filtering for visual object searching of documents
JP2010073099A (ja) 評価装置、評価方法およびプログラム
US9008425B2 (en) Detection of numbered captions
US20180321805A1 (en) Method for automatically applying page labels using extracted label contents from selected pages
RU2605078C2 (ru) Сегментация изображения для верификации данных
US11303769B2 (en) Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium
US9569146B2 (en) Information processor and automatic page replacement method
CN113704111A (zh) 页面自动化测试方法、装置、设备及存储介质
RU2604668C2 (ru) Визуализация машинно-генерируемого изображения документа
CN112084103B (zh) 界面测试方法、装置、设备和介质
RU2641452C2 (ru) Неполные эталоны
JP2009087270A (ja) 画像処理装置及びプログラム
CN112015634A (zh) 页面结构信息生成方法、装置和电子设备
JP5402936B2 (ja) Gui評価システム、gui評価方法およびgui評価用プログラム
CN114821618A (zh) 一种ofd阅读软件显示效果的分析方法
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
Chan et al. Application of optical character recognition in thermal image processing
US11228687B2 (en) Image processing system that computerizes document, control method thereof, and storage medium
JP7178445B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP7317886B2 (ja) 情報処理装置及び情報処理方法
JP4548062B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20170613

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20171031

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20180710

PC43 Official registration of the transfer of the exclusive right without contract for inventions

Effective date: 20181121

QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311