RU2538941C1 - Улучшения качества распознавания за счет повышения разрешения изображений - Google Patents

Улучшения качества распознавания за счет повышения разрешения изображений Download PDF

Info

Publication number
RU2538941C1
RU2538941C1 RU2013127165/08A RU2013127165A RU2538941C1 RU 2538941 C1 RU2538941 C1 RU 2538941C1 RU 2013127165/08 A RU2013127165/08 A RU 2013127165/08A RU 2013127165 A RU2013127165 A RU 2013127165A RU 2538941 C1 RU2538941 C1 RU 2538941C1
Authority
RU
Russia
Prior art keywords
image
video frame
displacement
images
block
Prior art date
Application number
RU2013127165/08A
Other languages
English (en)
Other versions
RU2013127165A (ru
Inventor
Иван Германович Загайнов
Василий Васильевич Логинов
Original Assignee
Общество с ограниченной ответственностью "Аби Девелопмент"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Аби Девелопмент" filed Critical Общество с ограниченной ответственностью "Аби Девелопмент"
Priority to RU2013127165/08A priority Critical patent/RU2538941C1/ru
Priority to US14/137,913 priority patent/US9256922B2/en
Publication of RU2013127165A publication Critical patent/RU2013127165A/ru
Application granted granted Critical
Publication of RU2538941C1 publication Critical patent/RU2538941C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

Изобретение относится к области обработки изображений, компьютерного зрения и анализа видеоданных. Техническим результатом является улучшение качества распознавания объекта. Способ включает получение серии изображений или последовательности видеокадров объекта; выбор изображения или видеокадра-аккумулятора и выполнение оценки перемещения элементов объекта относительно выбранного изображения или видеокадра-аккумулятора, по крайней мере, для одной полученной серии изображений или последовательности видеокадров; осуществление на основании проведенной оценки перемещения компенсации перемещения и накопление сигнала элементов объекта на основе выбранного изображения или видеокадра-аккумулятора, по крайней мере, для одной серии изображений или видеокадров; создание скомпенсированного изображения объекта высокого разрешения, полученного на основе компенсации и накопления сигнала; и осуществление распознавания объекта в полученном скомпенсированном изображении, обладающем высоким разрешением. 2 н. и 25 з.п. ф-лы, 6 ил.

Description

ОБЛАСТЬ ТЕХНИКИ
[0001] Настоящее изобретение относится способу обработки изображений, компьютерного зрения и анализа видеоданных. Одной из целей изобретения является существенное улучшение результатов Оптического (или Интеллектуального) распознавания символов на основе анализа и обработки набора исходных изображений.
УРОВЕНЬ ТЕХНИКИ
[0002] В настоящее время электронные устройства, такие как смартфоны, мобильные телефоны, портативные компьютеры, планшетные компьютеры, персональные компьютеры (ПК), персональные цифровые секретари и т.д., стали доступными по всему миру. Более того, мобильные устройства становятся все более портативными и производительными, так как всегда находятся под рукой и их производительность становятся сравнимой с производительностью персональных компьютеров, вычислительных центров и серверов. На рынке мобильных приложений и программного обеспечения существует множество программ, связанных со способами обработки снятых готовых изображений или записанных при помощи камер видеосигналов, встроенных в мобильные устройства. Среди упомянутых выше программ существуют программы для Оптического (или Интеллектуального) распознавания символов. Однако существующие приложения имеют ряд недостатков.
[0003] В большинстве случаев в процессе распознавания может возникнуть ситуация, в которой исходное изображение имеет недостаточное разрешение для того, чтобы быть идеально распознанным. Низкое разрешение исходного изображения может быть вызвано различными причинами: ограниченным разрешением матрицы камеры, встроенной в электронное устройство; недостатками оптической системы электронного устройства, алгоритмами кодирования данных или другими возможными факторами. Недостатки камеры электронного устройства, дрожание руки при съемке, неидеальные условия освещения также могут стать причинами возникновения дефектов на изображении, таких как оптические искажения, размытости, вызванные ограниченной скоростью затвора; зашумленности; эффект сглаживания; расфокусировка; блики на изображении и т.д. Дефекты на изображении могут помешать процессу дальнейшей его обработки. Однако в виду того, что существует потребность в получении точных результатов Оптического (или Интеллектуального) распознавания символов, существует спрос на изображения более высокого или улучшенного разрешения. Детали на изображении являются зачастую критически важными для выполнения известных способов компьютерной обработки изображения. Современные электронные устройства позволяют получить изображения одной и той же сцены с помощью встроенной камеры. Однако подобные изображения зачастую имеют низкое разрешение, но могут содержать критически важную информацию для пользователя. Например, в качестве объекта съемки может служить документ с контактами деловых партнеров (визитка). Или в другой ситуации, пользователь не имеет возможности сделать серию снимков одного документа в виду нехватки времени. Однако пользователь может записать (небольшое) видео, где в качестве интересующего объекта съемки выступает необходимый текстовый документ.
Данное изобретение позволяет существенно улучшить процесс последующего распознавания текстового изображения. Согласно описанному изобретению некоторое множество изображений, обладающих рядом искажений и низким разрешением, полученных при помощи камеры электронного устройства, используются для создания изображения высокого разрешения. При этом данное изобретение помогает избежать ряда недостатков, существующих в известных программных приложениях, описанных выше.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
[0004] Изобретение предоставляет собой метод, который включает в себя команду для устройства, операционной системы, программно-аппаратных средств и программного обеспечения, позволяющий получить идеально распознанное изображение высокого разрешения на основе некоторого множества изображений низкого разрешения, обладающих некоторыми искажениями, полученных при помощи камеры электронного устройства.
[0005] Для съемки изображения или видео, содержащего объект интереса, может использоваться камера, встроенная в электронное устройство. В описываемом изобретении объектом интереса является текстовая информация либо любая другая информация, содержащая символы. Согласно одному из способов реализации, изображение может быть получено из памяти электронного устройства либо из любых других доступных источников.
[0006] Данный раздел «Раскрытие изобретения» содержит в упрощенной форме набор неисключительных аспектов или понятий о настоящем изобретении, которые дополнительно описаны ниже в подробном описании. Эта часть не предназначена для идентификации ключевых или существенных признаков заявленного предмета изобретения и не предназначена для сужения области заявленного объекта изобретения.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0007] Дополнительные цели, признаки и преимущества настоящего изобретения будут очевидными из прочтения последующего описания осуществления изобретения со ссылкой на прилагаемые чертежи, на которых:
[0008] Фиг.1 иллюстрируют пример получения множества изображения одной и той же сцены, отображаемой на дисплее электронного устройства в соответствии с реализацией настоящего изобретения;
[0009] Фиг.2 является блок-схемой алгоритма, иллюстрирующего реализацию описанного изобретения;
[0010] Фиг.3А и 3Б иллюстрируют один и тот же участок изображения документа. Фиг.3А иллюстрирует исходное изображение в серии кадров, полученных с помощью камеры электронного устройства. Фиг.3Б иллюстрирует изображение, полученное на основе применения описываемого изобретения.
[0011] Фиг.4 иллюстрирует результаты эксперимента по распознаванию исходных кадров и распознаванию изображений, полученных при помощи накопления сигнала.
[0012] Фиг.5 иллюстрирует пример компьютерной системы, на которой может быть реализовано настоящее изобретение.
[0013] ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
[0014] Настоящее изобретение предназначено для улучшения результатов распознавания текстового изображения, которое основано на воссоздании изображения высокого разрешения из множества изображений или последовательности видеокадров, полученных при помощи камеры электронного устройства, обладающих низким разрешением и рядом искажений (недостатков).
[0015] На первом этапе все текстовые изображения (например, визитные карточки) могут быть получены при помощи камеры, встроенной в электронное устройство, и могут быть сохранены в памяти устройства. Видеопоследовательность кадров может быть записана заранее или загружена из внешних источников (например, Интернет) в хранилище памяти электронного устройства. Вследствие низкого разрешения полученных снимков (или кадров видеопоследовательности) текстовых документов, многие их них не приемлемы для дальнейшей обработки, в частности для Оптического (или Интеллектуального) распознавания символов. В большинстве случаев текстовые изображения, полученные камерой портативных устройств, обладают низким разрешением и могут содержать в различной степени всевозможные виды дефектов, таких как размытость, шум, расфокусировка, блики и т.д. Низкое разрешение и дефекты могут стать причиной ошибок распознавания. Поэтому для получения идеальных (значительно улучшенных) результатов распознавания, требуется повышенное качество изображения.
[0001] Обычно для целей распознавания текста на изображении электронное устройство пользователя может включать модуль, выполняющий Оптическое (или Интеллектуальное) распознавание символов локально на устройстве. Оптическое (или Интеллектуальное) распознавание символов может быть выполнено на сервере, доступ к которому может быть осуществлен при помощи некоторых стандартов и протоколов, таких как WiFi, Zigbee, Bluetooth и т.д.
[0016] Оптическое распознавание символов предназначено для преобразования изображений или отображений бумажных документов (фотографий) в машиночитаемый редактируемый и доступный для поиска электронный файл. Типичная система оптического распознавания символов включает в себя устройство визуализации или компонент, воссоздающий изображение документа и программное обеспечение, обрабатывающее изображение. Как правило, данное программное обеспечение включает программы распознавания либо набор алгоритмов, выполняющие распознавание символов, букв, знаков, цифр и других единиц и сохраняющие их в машинно-редактируемом формате, т.е. в закодированном формате.
[0017] Например, возможна такая ситуация, когда пользователь хочет получить на свое электронное устройство изображение визитной карточки для последующего ее распознавания, извлечения текста и сохранения информации в памяти электронного устройства. В соответствии с описанием настоящего изобретения пользователю доступны как минимум два возможных варианта действий. Одним из вариантов действий может служить последовательная съемка одной и той же сцены (в нашем случае сценой является тестовый документ) с наличием некоторого смещения камеры от кадра к кадру, называемого относительным движением кадров. Вторая возможность, предоставляемая пользователю - это запись видеосъемки, содержащей необходимый документ.
[0018] Предполагается, что объект интереса (сцена) отличается от кадра к кадру незначительно. Изменения в искажении текстового документа (например, визитной карточки) можно считать пренебрежимо малыми при фотографировании этого объекта на твердой устойчивой поверхности (например, на столе). Незначительные искажения могут быть вызваны несовершенствами поверхности или дефектами самого документа, такими как складки, пятна, царапины и т.д. Такие несовершенства не изменяются при переходе от кадра к кадру, или от изображения к изображению. Считается, что они могут присутствовать на каждом кадре.
[0019] Также предполагается, что движение в сцене вызвано в основном движением камеры электронного устройства в руках пользователя. Движения, вызванные естественным дрожанием рук пользователя при осуществлении съемки, могут быть компенсированы различными известными алгоритмами стабилизации.
[0020] В одной из реализации описываемого изобретения серия изображений (или кадров), содержащих один объект интереса, или сцену (в нашем случае сценой является документ с тестовой информацией), на шаге 201 (Фиг.2) загружаются в электронное устройство. Предполагается, что полученные изображения (кадры) могут содержать различные виды искажений (размытость, расфокусировку, блик и т.д.) и обладают низким разрешением. Далее полученное множество фотографий с искажениями и низким разрешением обрабатываются для воссоздания изображения с высоким разрешением (или как минимум изображения, обладающего более высоким разрешением по сравнению с исходными снимками). Так как последовательность кадров в видеосигнале можно принять за некоторое множество фотографий, то данный способ может быть применен к видеопоследовательности кадров видеосигнала. Восстановленное конечное изображение с высоким изображением подвергается оптическому (или интеллектуальному) распознаванию символов. Результаты распознавания становятся более точными вследствие повышения разрешения изображения.
[0021] Классические методы повышения изображения или воссоздания изображения, обладающего высоким разрешением, на основе обработки одного или нескольких наборов изображений сцены предполагают, что сцена содержит большое разнообразие изображаемых объектов, например людей, природу, архитектуру и т.д. Данное изобретение предназначено именно для обработки изображений, которые содержат текстовую информацию, символы, знаки и т.д. Например, такими документами могут быть визитные карточки, чеки, текстовые документы, счета, анкеты, бланки и т.д. Таким образом, изображения документов могут содержать текстовые блоки, таблицы, сепараторы, диаграммы, графики, печати и т.д. Таким типам документов характерна модель кусочно-постоянного сигнала, содержащего значительные по площади участки для фона (бумаги) и участки со ступенчатым сигналом для текста.
[0022] Фиг.1 представляет пример электронного устройства 102, имеющего дисплей 104 и кнопку камеры 106 для запуска и выполнения камерой съемки (или записи видео) сцены 108, где согласно описываемому изобретению сцена может быть представлена в виде текстовых документов, например в виде визитных карточек, чеков, счетов, анкет, форм и т.д. Цифровое представление сцены 108 на экране 104 может быть снято или записано камерой, встроенной в электронное устройство. В результате получена серия из N изображений (или кадров) 110 сцены 108, которая может быть сохранена в памяти (304) электронного устройства 102. Кнопка 106 может быть отображена на экране электронного устройства в виде виртуальной кнопки, в зависимости от интерфейса устройства, или реально существующей (т.е. физическая кнопка на экране связана с системным блоком электронного устройства 102). Контент, отображаемый на экране электронного устройства 104, может быть получен при помощи видоискателя камеры, который передает изображение документа на экран дисплея 104.
[0023] Электронное устройство 102 может представлять собой компьютер общего назначения, воплощенный в различных конфигурациях, таких как мобильный телефон, смартфон, сотовый телефон, цифровая камера, портативный компьютер или любое другое устройство, имеющее экран и камеру, или осуществляющий доступ к изображению либо устройству/компоненту, генерирующему изображение.
[0024] На Фиг.2 изображена блок-схема последовательных операций, выполняемых в соответствии с основным способом реализации изобретения - способом повышения разрешения изображения (или воссоздания изображения с высоким разрешением) для улучшения качества последующего распознавания. На шаге 201 цифровое представление объекта интереса (сцены) загружается в электронное устройство, например, в форме изображений или кадров видеопоследовательности.
[0025] Далее начинается обработка серии полученных изображений или кадров (110). Как можно точно на шаге 202 оценивается движение, или другими словами, перемещение, сцены (или объекта интереса) от одного изображения (кадра) к другому. Способ, описывающий перемещение объектов при переходе от одного изображения (или соседних кадров в видеопоследовательности) к другому изображению называется оценкой движения. Для этого могут использоваться различные модели движения. Рассмотрим как минимум две из них, использование которых предусматривает данное изобретение.
[0026] Согласно одному из способов реализации изобретения, снятое изображение (или кадры видео) разбиваются на непересекающиеся блоки пикселей, образуя матрицу блоков таким образом, что анализируемые изображения разделены на некоторую сетку. Параметры блоков из пикселей (ширина и длина) могут быть предварительно заданы. В большинстве случаев макроблоки из пикселей квадратные, например 16×16 пикселей.
[0027] Процесс анализа всех полученных изображений (кадров) в серии происходит попарно, то есть в каждый некоторый момент t два изображения сравниваются между собой и обрабатываются в соответствии с описанным ниже способом. В результате попарного анализа на выходе получается одно результирующее изображение. Это результирующее изображение аккумулирует информацию из двух обработанных ранее изображений. Обычно первое изображение (или кадр) в серии считается аккумулятором. Далее изображение-аккумулятор, полученное на предыдущем шаге, и следующее изображение в последовательности анализируются для добавления информации из этого текущего изображения к изображению-аккумулятору и т.д. Для удобства два изображения, анализируемые в некий момент t, могут быть обозначены как текущее изображение (или кадр) и опорное изображение (или кадр). Опорное изображение может быть предыдущим или последующим во времени.
[0028] После того как анализируемое изображение (или кадр) разделено на некоторую сетку, макроблоки текущего изображения сравниваются с соответствующим макроблоком опорного изображения и его ближайшими соседями для того, чтобы вычислить вектор перемещения. Вектор перемещения, описывающий сдвиг блока между двумя (последовательными) кадрами, вычисляется на основе множества всех возможных кандидатов в вектора перемещения. Число кандидатов векторов перемещения зависит от области поиска в текущем изображении. Чем больше область поиска в текущем изображении, тем большее число кандидатов в вектора перемещения для обрабатываемого блока в опорном изображении (или кадре). Полученный сдвиг для всех макроблоков в изображении (кадре) является оцененным перемещением в текущем анализируемом кадре.
[0029] Из всех кандидатов в вектора перемещения для макроблока выбирается один вектор, который обеспечивает наилучшее совмещение блоков в соответствии с одной из выбранных метрик отличий. Для этого используются различные алгоритмы совмещения блоков, например спиральный поиск, перекрестный поиск (CSA), трехуровневый алгоритм поиска, алгоритм полнового поиска (FSA), двухмерный алгоритмический поиск (TDL) и т.д.
[0030] Согласно нашему изобретению для уменьшения вычислительных затрат алгоритма, предлагается использовать многомасштабный способ поиска векторов перемещения. Его суть состоит в следующем: для изображений (кадров) строятся пирамиды многомасштабного представления изображения, например пирамиды гауссианов, из которых создаются изображения с уменьшенным вдвое (вчетверо и т.д.) разрешением. Соответствующие блоки в уменьшенных изображениях имеют во столько же раз меньшие размеры и вектора перемещения. Следовательно, на поиск приблизительного значения вектора перемещения потребуется гораздо меньше вычислений метрики отличий. После предварительной оценки векторов перемещения на изображениях с низким разрешением, вектора перемещения увеличиваются в два раза и уточняются для блоков на изображении с большим разрешением путем перебора возможных кандидатов в небольшой окрестности этих блоков. Процесс уточнения повторяется до тех пор, пока не будет произведено уточнение на изображении в оригинальном масштабе.
[0031] Алгоритмы согласования описывают процесс совмещения блока в текущем изображении с соответствующим блоком из опорного изображения. Совмещение основано на выходном значении некоторой метрики отличий, или другими словами некоторой функции затрат. Существует множество метрик отличий, например метод наименьших квадратов (МНК или MSE), сумма абсолютных разностей, сумма квадратов ошибок, сумма абсолютных преобразованных разностей и т.д. Формулы для подсчета MSE и MAD следующие:
M S E = 1 N 2 x = 1 N y = 1 N ( I C ( x , y ) I R ( x , y ) ) 2
Figure 00000001
M A D = 1 N 2 x = 1 N y = 1 N | I C ( x , y ) I R ( x , y ) |
Figure 00000002
Где IC(x, y) и IR(x, y) - интенсивности обрабатываемых пикселей в текущем блоке и опорном блоке соответственно, N - размер блока (в пикселях) в сетке, например N=4 для блока 4×4 пикселей.
Считается, что некоторый блок в текущем изображении, имеющий наименьшее значение метрики отличий, наиболее точно согласуется с соответствующим блоком в опорном изображении. Например, согласно описываемому способу оценки, из всех кандидатов в вектора перемещения может быть выбран тот вектор перемещения, у которого значение метрики отличия MSE наименьшее.
[0032] Несмотря на использование метрик отличий (или функции затрат) некоторые вектора движения могут быть выбраны ошибочно. Поэтому, чтобы удалить ошибочно найденные вектора перемещения из текущего рассмотрения и анализа, все вектора перемещения тестируются. Для этого используется различные критерии надежности, которые могут быть применены к макроблокам, каждый из которых имеет свои собственные вектора перемещения. Некоторые критерии надежности представлены ниже:
V α r ( I ) k σ ( 1 )
Figure 00000003
Вышеприведенная формула (1) означает, что дисперсия интенсивности пикселей I анализируемого блока не должна быть меньше порогового значения, который определяется уровнем шума (kσ), где k - адаптивный параметр, который может быть установлен эмпирически для каждого типа камеры, имеющей свои уникальные оптические характеристики.
[0033] Ввиду специфики сцены, содержащей текст или символы, в изображении или кадре существует множество блоков, содержащих только фон. Термин «блок, содержащий только фон» обозначает, что блок не содержит текст или другие символы и имеет относительно однородный цвет заливки. Макроблоки, содержащие только фон, должны быть удалены из последующего анализа. Причина тому следующая: после удаления блоков, содержащих только фон, результирующее поле векторов перемещения становится более гладким. Иначе, последующая интерполяция векторов перемещения для каждой точки может быть ошибочной. Поэтому только «надежные» блоки с текстом или символами должны обрабатываться в последующем анализе.
Другим критерием надежности, который использует свойство связности текстового документа (изображения), является следующее неравенство:
| V C V | < T , ( 2 )
Figure 00000004
где VC - вектор перемещения текущего анализируемого блока, 〈V〉 - средний вектор среди смежных соседних блоков текущего блока, T - заранее заданное пороговое значение. Формула (2) означает, что вектор перемещения текущего анализируемого блока VC не должен сильно отличаться от среднего вектора перемещения соседних блоков 〈V〉 на величину, превосходящую заранее заданное пороговое значение.
Если макроблоки и вектора движения не удовлетворяют описанным выше критериям надежности, то такие блоки считаются «ненадежными» и удаляются из дальнейшего анализа изображения (кадра).
[0034] Обнаружение «ненадежных» блоков непосредственно учитывает тип анализируемого изображения (кадра). Существенной разницей от фотографических сцен, содержащих людей, природу или архитектуру, является то, что сцены в описываемом изобретении содержат текстовую информацию, символы, цифры, знаки и т.д. Текстовые изображения могут быть представлены при помощи кусочно-постоянного сигнала, который наиболее подходит для изображений подобного типа. Это означает, что сигнал (функция) содержит значительные участки фона (бумаги) и участки со ступенчатым сигналом (текст). Использование критериев (1) и (2) полностью оправдано спецификой сцены, содержащей текстовую информацию, поэтому они обеспечивают более точную оценку движения и компенсацию движения, что отличает этот метод от других методов, используемых для обработки сцен на фотографии или видео, на которых объекты представлены в виде людей, природы, архитектуры и т.д.
[0035] Чтобы уменьшить вероятность ошибки во время оценки перемещения между кадрами, макроблоки, находящиеся на границе изображения вдоль его периметра, считаются «ненадежными» и удаляются из последующего анализа. Это связано с тем, что граничные блоки имеют значительные оптические искажения, вызванные существенными сдвигами в сцене, которые могут привести к значимым ошибкам в оценке перемещения объекта между изображениями (или кадрами). Более того, удаляются не только граничные блоки изображения, но и удаляется из дальнейшего анализа некоторая полоса шириной в несколько блоков вдоль периметра изображения. Для различных типов изображений ширина такой полосы может варьироваться от 5 до 10 блоков. Поэтому процесс оценки движения и процесс сопоставления блоков выполняется только на основе внутренних блоков изображения.
[0036] Как было указано выше, процесс анализа выполняется только на основе «надежных» блоков. Информация в надежных макроблоках интерполируется на ту часть изображения, откуда блоки были удалены на предыдущем шаге как «ненадежные». Для этого создаются квадратные окна из макроблоков таким образом, что «ненадежные» блоки с отсутствующими (неопределенными) значениями векторов перемещения находятся в центре таких окон, в результате чего они носят название центрированных окон. Компоненты вектора в отсутствующем центральном «ненадежном» блоке внутри окна (например, размером 3×3 блока) рассчитываются на основе компонент векторов соседних смежных «надежных» блоков в итеративном порядке. Например, компоненты вектора центрального удаленного блока могут быть вычислены как среднее значение всех соответствующих компонент векторов, окружающих «надежных» блоков. Если соседние блоки тоже являются «ненадежными», то вектор компонент в центральном блоке остается неизменным. Описанный выше метод выполняется итеративно до тех пор, пока всем частям изображения, откуда были удалены «ненадежные» блоки, будут присвоены некоторые значения вектора, рассчитанные на основе окружающих смежных «надежных» блоков.
[0037] В результате описанной выше процедуры строится поле векторов перемещения для текущего и опорного изображений, которое описывает двухмерное перемещение для каждого блока. Однако поле выбранных векторов перемещения может быть зашумленным. Поэтому поле векторов перемещения сглаживается. Сглаживание выполняется независимо для каждой компоненты вектора. Чтобы удалить шум с поля векторов перемещения, могут применяться различные типы фильтров, например свертка с центрированным окном большего размера. Такой тип сверки косвенно учитывает модель сцены, на которой объектом интереса является текстовый документ. Вектора движения смежных соседних блоков не должны значительно отличаться.
[0038] После оценки перемещения сцены между двумя изображениями (или кадрами) на шаге 203 выполняется процесс компенсации движения второго изображения (или кадра) к первому (опорному или аккумулирующему) для того, чтобы получить новое изображение, скомпенсированное по движению относительно опорного изображения. Если процедура выполняется независимо для каждого блока, то в полученном изображении возникнет главный недостаток этого метода. Недостаток заключается в возникновении неоднородности на границах между блоками, т.е. проявятся «блочные артефакты». «Блочные артефакты» представлены резкими вертикальными и горизонтальными краями, которые могут быть легко обнаружены человеческим глазом. Чтобы избежать описанный выше недостаток оценки перемещения, для векторов перемещения может быть применена билинейная интерполяция. Значения векторов перемещения, вычисленные для соответствующих блоков, интерполируются для конкретных пикселей внутри изображения с помощью билинейной интерполяции.
[0039] В альтернативной реализации описываемого изобретения может быть использована другая предлагаемая модель движения. Эта модель движения использует вектора перемещения, полученные только на основе надежных блоков. Вектора перемещения могут быть рассчитаны на основе способа, описанного в первой реализации изобретения. Согласно второй модели движения, перемещение в сцене хорошо описывается перспективным преобразованием. Параметры данного перспективного преобразования надежным образом подбираются. В результате вектора перемещения из «надежных» блоков образуют переопределенную систему нелинейных уравнений, решением которой является оптимальный вектор параметров перспективного преобразования. Для решения этой системы может быть использована алгоритм Левенберга-Маркварда (LMA). В качестве начального вектора параметров задается тождественное преобразование, что значительно ускоряет процедуру поиска. Получаемые в результате параметры перспективного преобразования определяют вектор перемещения для каждого пикселя изображения. Использование модели перспективного преобразования полностью подбирается для специфики сцены, а именно текстового документа на твердой поверхности. Движение в изображении вызвано только движением камеры. Это обуславливает точность оценки движения в описываемой модели и делает невозможным для применения ее в общем случае, где сцена содержит не текстовую информацию.
[0040] Максимум надежности достигается в оценке движения объекта межу кадрами при применении двух описанных моделей совместно. Каждая из этих моделей учитывает отличительную черту сцены, которая содержит текстовый документ. Поэтому модели движения, представленные в описании выше, могут быть объедены в одну модель. Объединенная модель может описываться уравнением (3), в котором каждая из моделей движения имеет свои веса. Эти веса могут зависеть от нескольких параметров: от типа документа, параметров камеры и т.д. В этом случае вектор движения для каждой точки определяется как взвешенная сумма векторов перемещения из первой и второй модели для каждой точки изображения:
V = k V 1 + ( 1 k ) V 2 ( 3 )
Figure 00000005
где k - весовой параметр, который подбирается эмпирически для различных типов исходных документов, V1, V2 - вектора перемещения из первой и второй модели движения соответственно. Другие модели движения также могут быть применены и включены в уравнение для вычисления взвешенного вектора перемещения. Полученный взвешенный вектор перемещения более надежен, так как содержит информацию, полученную из различных моделей.
[0041] В результате применения билинейной интерполяции каждый пиксель на изображении (кадре) имеет свой уникальный вектор перемещения, слегка отличающийся от соседей. В другой реализации результирующее изображение получается путем бикубической интерполяции сигналов каждой точки, определенной при помощи векторов перемещения. После процесса компенсации движения второго изображения (или кадра) к первому изображению (или кадру) создается скомпенсированное изображение.
[0042] Алгоритм улучшения качества может включать процедуру повышения пространственного разрешения, т.е. процесс изменения размера изображения (или кадра). Повышение пространственного разрешения может быть достигнуто несколькими методами на различных этапах описываемого изобретения. Одним из способов является геометрическое увеличение одного исходного изображения (или кадра). Второй способ заключается в геометрическом увеличении при попиксельной компенсации движения с использованием бикубической интерполяции. Процедура бикубической интерполяции в более высокое разрешение производится один раз для каждого кадра перед этапом накопления сигнала. Первое анализируемое изображение (или кадр) увеличивается без движения, последующие - с учетом векторов перемещения. «Шумоподобные» артефакты бикубической интерполяции в процессе накопления усредняются и подавляются путем аккумулирующих процедур. Поэтому результирующее текстовое изображение становится более «гладким», имеет улучшенное качество. Это означает, что символы в текстовых блоках результирующего изображения фильтруются от шума, края символов сглаживаются.
[0043] Процедура накопления (аккумулирования) сигнала на шаге 204 заключается в добавлении сигнала (информации) из текущего обрабатываемого изображения в опорное изображение-аккумулятор. Например, первое изображение (или кадр) из серии снимков может считаться аккумулятором. Аккумулятором также может считаться наилучшее по качеству изображение в серии снимков. Процедура накопления сигнала может осуществляться одним из следующих способов.
[0044] Согласно первому способу реализации накопление сигнала происходит после того, как на шаге 203 каждое изображение из серии снимков было скомпенсировано по движению относительно опорного изображения. То есть для каждого изображения в серии были выполнены процедуры оценки движения и компенсации по движению относительно выбранного опорного изображения. В результате создается новый набор изображений, включающий в себя одно опорное изображение и изображения, скомпенсированные по движению относительно данного опорного изображения. Далее все скомпенсированные по движению изображения и опорное изображение усредняются, в итоге формируется одно результирующее изображение с накопленным сигналом.
[0045] Согласно второму способу реализации накопление сигнала происходит последовательно на каждом шаге после осуществления компенсации движения. Для этого также выбирается изображение-аккумулятор, по отношению к которому будет проводиться компенсация движения остальных изображений в серии снимков. Далее из серии снимков выбирается другое изображение, не являющееся аккумулятором. К нему применяется процедура компенсации движения. В результате чего на выходе создается новое скомпенсированное изображение. Далее информация из полученного скомпенсированного изображения добавляется в аккумулятор. Аккумулятор обновляется. Далее выбирается следующее изображение из серии снимков, аналогичным образом создается скомпенсированное по отношению к аккумулятору изображение. Снова происходит усреднение нового скомпенсированного изображения и обновленного аккумулятора. Таким образом, данная процедура накопления сигнала продолжается до тех пор, пока не будет обработано достаточное количество исходных изображений. В результате такого способа накопления сигнала формируется единственное накопленное изображение.
[0046] Накопление сигнала может выполняться путем простого усреднения сигнала, полученного из аккумулятора и текущего изображения (или кадра) с различными весами. Для равномерного усреднения между всеми кадрами в серии вес добавляемого кадра может вычисляться как:
W n = 1 n
Figure 00000006
где n - номер добавляемого кадра.
Вес аккумулятора Wa может быть вычислен в соответствии со следующим уравнением:
Wa=1-Wn
В других альтернативных реализациях для накопления сигнала могут быть использованы более сложные методы. Эти методы учитывают для каждого элемента (пикселя) добавляемого изображения информацию о его окружении, а также информацию, полученную из аккумулятора (значение дисперсии, локального контраста и т.д.).
[0047] Результат обработки аккумулятора и очередного текущего обрабатываемого кадра перемещается и накапливается в аккумуляторе. Далее процедура накопления информации повторяется для последующих изображений (кадров) в серии.
[0048] В результате накопления обработанных N изображений (кадров) получается изображение, имеющее высокое разрешение (или повышенное) 205. Качество конечного изображения может быть оценено, например, при помощи отношения полезного сигнала к шуму или на основе результатов последующего оптического распознавания символов.
[0049] Результат накопления сигнала носит экспоненциальный характер. Это означает, что наибольший прирост качества происходит при накоплении нескольких первых, например, 5-7 изображений (кадров). Далее процесс замедляется, после некоторой итерации, например на 20 кадре, прирост оказывается несущественным и дальнейший процесс накопления не имеет смысла. Для более быстрого и эффективного накопления полезного сигнала можно отсортировать имеющиеся кадры по предварительной интегральной оценке их качества. Оценка качества учитывает различные типы дефектов (например, смаз, расфокусировка, блики и т.д.). После сортировки изображений (кадров) процесс накопления сигнала начинается с изображения, обладающего наилучшим качеством, который далее будет выполнять роль аккумулятора сигнала.
[0050] На Фиг.4 приведены результаты эксперимента по распознаванию исходных кадров, полученных с мобильного устройства, позволяющего делать фотографии с разрешением 1280×720 пикселей, и кадров, полученных в результате накопления сигнала с увеличением в 2 раза. Использовались обе модели движения. Видно, что процесс накопления полезного сигнала носит экспоненциальный характер, наибольший прирост качества распознавания происходит при накоплении информации из первых 5-8 кадров, далее процесс замедляется, после 20 кадра прирост оказывается несущественным и дальнейший процесс накопления не имеет смысла.
[0051] На заключительном шаге 206 к полученному изображению, обладающему высоким разрешением, применяется Оптическое или Интеллектуальное распознавание символов. За счет повышенного качества конечного изображения, результаты распознавания становятся точнее. Результирующее изображение также может быть подвергнуто любым другим известным способам обработки текстовых изображений.
[0052] Так Фиг.3А и Фиг.3Б демонстрируют один и тот же участок изображения документа. На Фиг.3А показано одно из исходных изображений в серии кадров, полученных с помощью камеры электронного устройства. Фиг.3Б иллюстрирует изображение, полученное на основе применения описываемого изобретения, а именно повышения разрешения изображения методом «Super Resolution». Как можно видеть, качество изображения существенно возросло. Улучшенное качество изображения значительно сокращает ошибки при распознавании.
[0053] На Фиг.5 приведен возможный пример вычислительного средства 500, которое может быть использовано для внедрения настоящего изобретения, осуществленного так, как было описано выше. Вычислительное средство 500 включает в себя, по крайней мере, один процессор 502, соединенный с памятью 504. Процессор 502 может представлять собой один или более процессоров, может содержать одно, два или более вычислительных ядер. Память 504 может представлять собой оперативную память (ОЗУ), а также содержать любые другие типы и виды памяти, в частности устройства энергонезависимой памяти (например, флэш-накопители) и постоянные запоминающие устройства, например жесткие диски и т.д. Кроме того, может считаться, что память 504 включает в себя аппаратные средства хранения информации, физически размещенные где-либо еще в составе вычислительного средства 500, например кэш-память в процессоре 502, память, используемую в качестве виртуальной и хранимую на внешнем либо внутреннем постоянном запоминающем устройстве 510.
[0054] Вычислительное средство 500 также обычно имеет некоторое количество входов и выходов для передачи информации вовне и получения информации извне. Для взаимодействия с пользователем вычислительное средство 500 может содержать одно или более устройств ввода (например, клавиатура, мышь, сканер и т.д.) и устройство отображения 508 (например, жидкокристаллический дисплей). Вычислительное средство 500 также может иметь одно или более постоянных запоминающих устройств 510, например привод оптических дисков (CD, DVD или другой), жесткий диск, ленточный накопитель. Кроме того, вычислительное средство 500 может иметь интерфейс с одной или более сетями 512, обеспечивающими соединение с другими сетями и вычислительными устройствами. В частности, это может быть локальная сеть (LAN), беспроводная сеть Wi-Fi, соединенные со всемирной сетью Интернет или нет. Подразумевается, что вычислительное средство 500 включает подходящие аналоговые и/или цифровые интерфейсы между процессором 502 и каждым из компонентов 504, 506, 508, 510 и 512.
[0055] Вычислительное средство 500 работает под управлением операционной системы 514 и выполняет различные приложения, компоненты, программы, объекты, модули и т.д., указанные обобщенно цифрой 516.
[0056] Вообще программы, исполняемые для реализации способов, соответствующих данному изобретению, могут являться частью операционной системы или представлять собой обособленное приложение, компоненту, программу, динамическую библиотеку, модуль, скрипт либо их комбинацию.
[0057] Настоящее описание излагает основной изобретательский замысел авторов, который не может быть ограничен теми аппаратными устройствами, которые упоминались ранее. Следует отметить, что аппаратные устройства прежде всего предназначены для решения узкой задачи. С течением времени и с развитием технического прогресса такая задача усложняется или эволюционирует. Появляются новые средства, которые способны выполнить новые требования. В этом смысле следует рассматривать данные аппаратные устройства с точки зрения класса решаемых ими технических задач, а не чисто технической реализации на некой элементной базе.

Claims (27)

1. Способ повышения качества распознавания объекта на воссозданном на основе серий кадров изображении объекта, обладающем высоким разрешением, включающий, по меньшей мере, однократное осуществление следующей последовательности действий:
- получение серии изображений или последовательности видеокадров объекта;
- выбор изображения или видеокадра-аккумулятора и выполнение оценки перемещения элементов объекта относительно выбранного изображения или видеокадра-аккумулятора, по крайней мере, для одной полученной серии изображений или последовательности видеокадров;
- осуществление на основании проведенной оценки перемещения компенсации перемещения и накопление сигнала элементов объекта на основе выбранного изображения или видеокадра-аккумулятора, по крайней мере, для одной серии изображений или видеокадров;
- создание скомпенсированного изображения объекта высокого разрешения, полученного на основе компенсации и накоплении сигнала; и
- осуществление распознавания объекта в полученном скомпенсированном изображении, обладающем высоким разрешением.
2. Способ по п.1, в котором осуществление оценки перемещения включает:
- разделение каждого изображения или видеокадра последовательности на непересекающиеся блоки пикселей;
- сравнение блоков пикселей из текущего изображения или видеокадра последовательности с соответствующим блоком пикселей из выбранного изображения или видеокадра-аккумулятора последовательности;
- вычисление векторов перемещения для каждого блока пикселей, где вектор перемещения описывает сдвиг блока между двумя изображениями или видеокадрами, в котором сдвиг, вычисленный для каждого блока пикселей в изображении или видеокадре, является оцененным перемещением для текущего анализируемого кадра.
3. Способ по п.1, в котором вычисление векторов перемещения включает использование многомасштабного способа поиска векторов перемещения, где многомасштабный метод поиска векторов перемещения включает вычисление пирамид гауссианов.
4. Способ по п.1, дополнительно включающий этапы удаления из анализа ненадежных блоков пикселей, которые не удовлетворяют критериям надежности.
5. Способ по п.4, в котором критерий надежности блока описывается следующим неравенством:
| V C V | < T
Figure 00000007
,
где VC - вектор перемещения текущего анализируемого блока, 〈V〉 - средний вектор среди смежных соседних блоков текущего блока, T - заранее заданное пороговое значение.
6. Способ по п.4, в котором критерий надежности блока описывается следующим неравенством:
V α r ( I ) k σ
Figure 00000008
,
где I - это дисперсия интенсивности пикселей анализируемого блока, kσ - уровень шума.
7. Способ по п.1, в котором вычисление оценки перемещения и компенсация перемещения включают:
- попарное сравнение текущего изображения или видеокадра с выбранным изображением или видеокадром-аккумулятором;
- создание скомпенсированного изображения путем накопления сигнала на основе упомянутого попарного сравнения.
8. Способ по п.1, в котором дополнительно содержатся этапы осуществления алгоритмов стабилизации устройства, обеспечивающего получение серии изображений или последовательности видеокадров.
9. Способ по п.1, в котором вычисление компенсации перемещения включает расчет множества возможных векторов перемещения и выбор вектора перемещения из множества возможных векторов перемещения на основе одного из алгоритмов совмещения блоков, где алгоритм совмещения блоков описывает совмещение блока из текущего изображения или кадра с соответствующим блоком в опорном изображении.
10. Способ по п.7, в котором алгоритм совмещения основан на результирующем значении метрики подобия.
11. Способ по п.7, в котором выбор вектора перемещения из множества возможных векторов перемещения основан на критерии наилучшего совмещения блоков, обеспечивающего данным вектором перемещения в соответствие с одной из выбранных метрик отличий.
12. Способ по п.1, в котором дополнительно содержатся этапы удаления из анализа блоков, которые содержат только фон.
13. Способ по п.1, в котором дополнительно содержатся этапы удаления из расчета векторов перемещения блоков пикселей, находящихся вдоль периметра изображения или кадра.
14. Способ по п.1, в котором дополнительно содержатся этапы:
- удаления из расчета векторов перемещения ненадежных блоков пикселей, где ненадежные блоки не удовлетворяют критериям надежности;
- замещение каждого такого ненадежного блока пикселей блоком, компоненты пикселей которого вычислены на основе информации из соседних надежных блоков пикселей на основе применения одного из известных способов интерполяции.
15. Способ по п.1, в котором дополнительно содержатся этапы расчета векторов движения на основе применения модели движения перспективного преобразования.
16. Способ по п.1, в котором дополнительно содержатся этапы сглаживания каждой компоненты векторов перемещения для удаления шума с поля векторов перемещения путем применения одного из фильтров.
17. Способ по п.1, в котором дополнительно содержатся этапы применения билинейной интерполяции для поля векторов перемещения.
18. Способ по п.1, в котором дополнительно содержатся этапы процедуры компенсации перемещения, применяемые последовательно к каждому следующему изображению или видеокадру последовательности, и воссоздание скомпенсированного по движению изображения после итеративной процедуры накопления сигнала.
19. Способ по п.1, в котором дополнительно содержатся этапы процедуры повышения пространственного увеличения разрешения, т.е. процесс изменения размера изображения или видеокадра.
20. Способ по п.19, в котором пространственное увеличение разрешения достигается за счет геометрического увеличения одного исходного изображения или видеокадра.
21. Способ по п.19, в котором пространственное увеличение разрешения достигается за счет геометрического увеличения при попиксельной компенсации движения с использованием бикубической интерполяции.
22. Способ по п.21, в котором геометрическое увеличение при попиксельной компенсации движения с использованием бикубической интерполяции включает следующие этапы:
- увеличение первого обрабатываемого изображения без движения;
- увеличение последующих изображений или кадров с учетом векторов перемещения.
23. Способ по п.1, в котором процедура накопления сигнала заключается в добавлении информации из текущего изображения или видеокадра в изображение или видеокадр-аккумулятор, где аккумулятором может считаться первое изображение или видеокадр в полученной серии последовательности.
24. Способ по п.1, в котором процедура накопления сигнала включает усреднение сигнала, полученного из изображения или видеокадра-аккумулятора, и текущего изображения или видеокадра с различными весами.
25. Способ по п.24, в котором процедура накопления сигнала включает добавление результатов обработки изображения или видеокадра-аккумулятора и очередного текущего обрабатываемого изображения или видеокадра в аккумулятор.
26. Способ по п.1, в котором дополнительно содержатся этапы сортировки исходных изображений или видеокадров в соответствии с начальной оценкой качества каждого изображения или видеокадра на основе количества дефектов, содержащихся в нем.
27. Система повышения качества распознавания объекта на воссозданном на основе серий кадров изображении объекта, обладающем высоким разрешением, включающая:
- средство осуществления съемки;
- процессор;
- взаимодействующее с процессором электронное хранилище памяти;
- процессор выполнен с возможностью выполнения программных инструкций, включающих, по крайней мере, однократное осуществление следующей последовательности действий:
- получение серии изображений или последовательности видеокадров объекта;
- выбор изображения или видеокадра-аккумулятора и выполнение оценки перемещения элементов объекта относительно выбранного изображения или видеокадра-аккумулятора, по крайней мере, для одной полученной серии изображений или последовательности видеокадров;
- осуществление на основании проведенной оценки перемещения компенсации перемещения и накопление сигнала элементов объекта на основе выбранного изображения или видеокадра-аккумулятора, по крайней мере, для одной серии изображений или видеокадров;
- создание скомпенсированного изображения объекта высокого разрешения, полученного на основе компенсации и накоплении сигнала; и
- осуществление распознавания объекта в полученном скомпенсированном изображении, обладающем высоким разрешением.
RU2013127165/08A 2013-06-14 2013-06-14 Улучшения качества распознавания за счет повышения разрешения изображений RU2538941C1 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2013127165/08A RU2538941C1 (ru) 2013-06-14 2013-06-14 Улучшения качества распознавания за счет повышения разрешения изображений
US14/137,913 US9256922B2 (en) 2013-06-14 2013-12-20 Applying super resolution for quality improvement of OCR processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2013127165/08A RU2538941C1 (ru) 2013-06-14 2013-06-14 Улучшения качества распознавания за счет повышения разрешения изображений

Publications (2)

Publication Number Publication Date
RU2013127165A RU2013127165A (ru) 2014-12-20
RU2538941C1 true RU2538941C1 (ru) 2015-01-10

Family

ID=52019257

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013127165/08A RU2538941C1 (ru) 2013-06-14 2013-06-14 Улучшения качества распознавания за счет повышения разрешения изображений

Country Status (2)

Country Link
US (1) US9256922B2 (ru)
RU (1) RU2538941C1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2619712C1 (ru) * 2016-05-13 2017-05-17 Общество с ограниченной ответственностью "Аби Девелопмент" Оптическое распознавание символов серии изображений
RU2718426C1 (ru) * 2019-07-10 2020-04-02 федеральное государственное автономное образовательное учреждение высшего образования "Южный федеральный университет" (Южный федеральный университет) Устройство восстановления папиллярных узоров оптечатка пальца

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2541353C2 (ru) * 2013-06-19 2015-02-10 Общество с ограниченной ответственностью "Аби Девелопмент" Автоматическая съемка документа с заданными пропорциями
US9465774B2 (en) 2014-04-02 2016-10-11 Benoit Maison Optical character recognition system using multiple images and method of use
US20160088178A1 (en) * 2014-09-18 2016-03-24 Breezyprint Corporation System for video-based scanning and analysis
US10108856B2 (en) 2016-05-13 2018-10-23 Abbyy Development Llc Data entry from series of images of a patterned document
US10366480B2 (en) 2016-07-01 2019-07-30 Analytical Mechanics Associates, Inc. Super-resolution systems and methods
TWI616843B (zh) * 2016-09-12 2018-03-01 粉迷科技股份有限公司 動態影像去背方法、系統與電腦可讀取儲存裝置
US10223584B2 (en) * 2016-11-01 2019-03-05 Ncr Corporation Document detection
CN106604057A (zh) * 2016-12-07 2017-04-26 乐视控股(北京)有限公司 视频处理方法及装置
US10638168B2 (en) 2018-09-06 2020-04-28 International Business Machines Corporation Detecting minimum viable display resolution of media content using optical character recognition
CN109446887B (zh) * 2018-09-10 2022-03-25 易诚高科(大连)科技有限公司 一种针对图像质量主观评测的图像场景描述生成方法
CN111435422B (zh) * 2019-01-11 2024-03-08 商汤集团有限公司 动作识别方法、控制方法及装置、电子设备和存储介质
RU2721186C1 (ru) * 2019-07-22 2020-05-18 Общество с ограниченной ответственностью "Аби Продакшн" Оптическое распознавание символов документов с некопланарными областями
CN113780266A (zh) * 2021-09-18 2021-12-10 武汉众邦银行股份有限公司 一种h5实现身份证扫描识别ocr的方法、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2006141518A (ru) * 2006-11-24 2008-06-10 Корпораци "Самсунг Электроникс Ко., Лтд." (KR) Способ распознавания текстовых документов
RU2431889C1 (ru) * 2010-08-06 2011-10-20 Дмитрий Валерьевич Шмунк Способ суперразрешения изображений и нелинейный цифровой фильтр для его осуществления

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3869475D1 (de) * 1987-06-02 1992-04-30 Siemens Ag Verfahren zur ermittlung von bewegungsvektorfeldern aus digitalen bildsequenzen.
US4979136A (en) * 1988-03-01 1990-12-18 Transitions Research Corporation Processing system and method for enhancing image data
JP3276547B2 (ja) * 1995-12-01 2002-04-22 シャープ株式会社 画像認識方法
JP3747737B2 (ja) * 2000-05-10 2006-02-22 日本電気株式会社 広域精細画像生成方法及びシステム並びにコンピュータ可読記録媒体
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
US7953295B2 (en) 2006-06-29 2011-05-31 Google Inc. Enhancing text in images
US8031940B2 (en) 2006-06-29 2011-10-04 Google Inc. Recognizing text in images using ranging data
US8098934B2 (en) 2006-06-29 2012-01-17 Google Inc. Using extracted image text
JP5094601B2 (ja) 2008-07-09 2012-12-12 キヤノン株式会社 画像処理装置及び画像処理方法ならびにプログラム
JP4875117B2 (ja) 2009-03-13 2012-02-15 株式会社東芝 画像処理装置
US20110128385A1 (en) * 2009-12-02 2011-06-02 Honeywell International Inc. Multi camera registration for high resolution target capture
KR101383238B1 (ko) * 2011-03-07 2014-04-08 케이비에이2, 인코포레이티드 이벤트 또는 지리적 위치에 있는 이미지 제공자들로부터의 분석 데이터 수집을 위한 시스템 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2006141518A (ru) * 2006-11-24 2008-06-10 Корпораци "Самсунг Электроникс Ко., Лтд." (KR) Способ распознавания текстовых документов
RU2431889C1 (ru) * 2010-08-06 2011-10-20 Дмитрий Валерьевич Шмунк Способ суперразрешения изображений и нелинейный цифровой фильтр для его осуществления

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2619712C1 (ru) * 2016-05-13 2017-05-17 Общество с ограниченной ответственностью "Аби Девелопмент" Оптическое распознавание символов серии изображений
RU2718426C1 (ru) * 2019-07-10 2020-04-02 федеральное государственное автономное образовательное учреждение высшего образования "Южный федеральный университет" (Южный федеральный университет) Устройство восстановления папиллярных узоров оптечатка пальца
RU2718426C9 (ru) * 2019-07-10 2020-12-29 федеральное государственное автономное образовательное учреждение высшего образования "Южный федеральный университет" (Южный федеральный университет) Устройство восстановления папиллярных узоров отпечатка пальца

Also Published As

Publication number Publication date
US9256922B2 (en) 2016-02-09
RU2013127165A (ru) 2014-12-20
US20140369556A1 (en) 2014-12-18

Similar Documents

Publication Publication Date Title
RU2538941C1 (ru) Улучшения качества распознавания за счет повышения разрешения изображений
US8379120B2 (en) Image deblurring using a combined differential image
US9692939B2 (en) Device, system, and method of blind deblurring and blind super-resolution utilizing internal patch recurrence
US8390704B2 (en) Image deblurring using a spatial image prior
EP2415015B1 (en) Barcode processing
US8203615B2 (en) Image deblurring using panchromatic pixels
US9262684B2 (en) Methods of image fusion for image stabilization
US9531962B2 (en) Image set alignment and combination processing
US8594464B2 (en) Adaptive super resolution for video enhancement
US9275448B2 (en) Flash/no-flash imaging for binarization
US9965832B2 (en) Method for performing super-resolution on single images and apparatus for performing super-resolution on single images
JP2013512626A (ja) シーン内の正確な及び相対的な被写体距離を推定するためのアルゴリズム
JP6703314B2 (ja) フォーカス検出
US10051274B2 (en) Image processing apparatus, method of calculating information according to motion of frame, and storage medium
US10477220B1 (en) Object segmentation in a sequence of color image frames based on adaptive foreground mask upsampling
JP2011045078A (ja) カメラベースの文書画像処理のための適応的ボケ除去
US20180182086A1 (en) Method for assessing the quality of an image of a document
Munoz-Mejias et al. A low-complexity pre-processing system for restoring low-quality QR code images
Zhang et al. Deep motion blur removal using noisy/blurry image pairs
US10785484B2 (en) Motion vector calculation method, information processing apparatus, recording medium recording motion vector calculation program
US10819983B1 (en) Determining a blurriness score for screen capture videos
McCrackin et al. Strategic image denoising using a support vector machine with seam energy and saliency features
Yu et al. Removing blur kernel noise via a hybrid ℓ p norm
JP5963166B2 (ja) 画像復元装置、方法、及びプログラム
JP2014063290A (ja) 画像処理装置およびプログラム

Legal Events

Date Code Title Description
QB4A Licence on use of patent

Free format text: LICENCE

Effective date: 20151118

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20161213

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20170613

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20171031

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20180710

PC43 Official registration of the transfer of the exclusive right without contract for inventions

Effective date: 20181121

QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311