RU2556461C2 - Способ автоматизированного поиска эталонных печатей - Google Patents

Способ автоматизированного поиска эталонных печатей Download PDF

Info

Publication number
RU2556461C2
RU2556461C2 RU2013151137/08A RU2013151137A RU2556461C2 RU 2556461 C2 RU2556461 C2 RU 2556461C2 RU 2013151137/08 A RU2013151137/08 A RU 2013151137/08A RU 2013151137 A RU2013151137 A RU 2013151137A RU 2556461 C2 RU2556461 C2 RU 2556461C2
Authority
RU
Russia
Prior art keywords
images
seals
round
found
predetermined
Prior art date
Application number
RU2013151137/08A
Other languages
English (en)
Other versions
RU2013151137A (ru
Inventor
Александр Александрович Чепарухин
Екатерина Александровна Пшехотская
Сергей Сергеевич Рябов
Original Assignee
Закрытое акционерное общество "ИнфоВотч"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Закрытое акционерное общество "ИнфоВотч" filed Critical Закрытое акционерное общество "ИнфоВотч"
Priority to RU2013151137/08A priority Critical patent/RU2556461C2/ru
Publication of RU2013151137A publication Critical patent/RU2013151137A/ru
Application granted granted Critical
Publication of RU2556461C2 publication Critical patent/RU2556461C2/ru

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов. Техническим результатом является повышение быстродействия при выявлении в любом документе заранее заданной эталонной круглой печати. Предложен способ автоматизированного поиска заранее заданных эталонных круглых печатей. Способ включает в себя этап, на котором осуществляют сбор коллекции различных заранее заданных изображений как содержащих круглые печати, так и не содержащих круглые печати. Далее согласно способу осуществляют обучение каскадных классификаторов на собранных коллекциях изображений и преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем. А также выявляют области в электронном файле анализируемого документа, где предположительно может располагаться печать, и осуществляют сравнение найденных областей с заранее заданными эталонами.

Description

Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов.
Из уровня техники известны способы распознавания и поиска данных, в том числе изображений. Например, заявка на изобретение РФ №2012110605, система добавления метаданных, способ и устройство поиска изображения и способ добавления жеста для этого, 27.09.2013, которая включает в том числе и способ поиска изображения, содержащего извлечение по меньшей мере одних метаданных относительно изображения посредством анализа изображения; добавление метаданных к изображению и сохранение изображения с добавленными метаданными во внешнем устройстве и поиск по меньшей мере одного изображения из изображений, сохраненных во внешнем устройстве, на основе метаданных.
Недостатком известного способа является то, что для поиска изображения используются метаданные и не используется информация непосредственно из изображения, в данном случае при отсутствии таких метаданных изображение будет невозможно найти.
Наиболее близким техническим решением к предлагаемому изобретению является способ обнаружения лиц на изображении с применением каскада классификаторов (патент на изобретение РФ №2427911, опубликовано 27.08.2011).
Недостатком указанного способа является ограниченная возможность по поиску изображений только в виде лиц.
Технический результат, на решение которого направлено заявленное изобретение, заключается в создании быстрого, качественного и универсального способа, который позволил бы выявлять в любом документе заданную эталонную круглую печать.
Особенность способа по настоящему изобретению состоит в том, что если достаточно определить только наличие круглой печати, эталонные печати задавать не требуется.
Данный технический результат достигается посредством того, что в способе, включающем в себя использование каскадных класификаторов, предусматривается выполнение следующих операций:
- сбор коллекции различных изображений как содержащих круглые печати, так и не содержащих круглые печати;
- обучение каскадных классификаторов на собранных коллекциях изображений;
- преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем;
- сохранение преобразованных изображений печатей на запоминающем устройстве;
- выявление областей в электронном файле анализируемого документа, где предположительно может располагаться печать;
- сравнение найденных областей с заранее заданными эталонами;
- формирование результата, состоящего из эталонов, найденных в анализируемом документе.
Способ автоматизированного поиска эталонных печатей осуществляют следующим образом.
Используемый алгоритм состоит из двух ступеней:
1. На изображении ищутся области (заданные окнами - ограничивающими квадратами), похожие на круглую печать.
2. Найденные «подозрительные» области сравниваются с загруженными пользователем эталонами печатей.
Такая схема позволила достигнуть приемлемого качества и скорости работы.
Первая ступень настроена так, чтобы баланс ошибок был смещен в сторону ложноположительных срабатываний: практически все изображения печатей пропускаются до второй ступени, но вместе с ними могут попадаться и объекты, не являющиеся печатями.
На вторую ступень попадает небольшое количество подозрительных окон, что значительно сокращает пространство поиска и соответственно время работы детектора.
Для нахождения областей, похожих на круглую печать, был применен каскадный классификатор Виолы-Джонса. Указанный детектор представляет собой каскад очень простых классификаторов (принцип бустинга), основанных на признаках Хаара. Это позволяет отсекать большую часть окон на ранних стадиях, не прогоняя их через весь каскад. За счет этого достигается высокая скорость работы - детектор Виолы-Джонса широко используется для детектирования лиц (например, WO 2008064395 (PCT/AU 2007/001169)), в том числе в портативных устройствах в режиме real-time.
Общий принцип многих детекторов: изображение обрабатывается скользящим окном; для каждого окна решается независимо задача бинарной классификации: есть ли объект на изображении или нет. Если ответ положительный, то в данной позиции найден искомый объект. Размер скользящего окна варьируется от минимального до максимального с заданным множителем.
В способе используется реализация каскадного классификатора из OpenCV. Для обучения использовалась компьютерная программа «Traincascade».
Примеры реализации.
В компании ЗАО «ИнфоВотч» прошли испытания предложенного способа, а именно была создана большая коллекция круглых печатей, а также не-печатей (отрицательных примеров), состоящая примерно из 10.000 изображений. За основу были взяты различные изображения печатей и не-печатей (в частности, выкачанные автоматически из сети Интернет по разным запросам к Google Images), а также внутренняя коллекция документов с печатями компании.
Со всех изображений печати вырезались с помощью детектора окружностей Хафа, а затем с помощью отдельной компьютерной программы из каждого такого изображения создавалось еще несколько путем применения различных операций: поворота на случайный угол и изменения яркости на случайную величину (в пределах некоторого диапазона).
Отобранные каскадным классификатором окна сравниваются с эталонами, загруженными пользователем.
Однако сравнивать их напрямую нельзя, поскольку печать может быть повернута, а также слегка смещена и отмасштабирована относительно эталона. Поэтому используется преобразование Фурье-Меллина:
- К исходным изображениям применяется преобразование Фурье.
- Затем они переводятся в log-полярные координаты.
- Вычисляется фазовая корреляция, которая характеризует близость изображений.
После первых двух преобразований поворот и масштабирование представляются в виде линейных смещений.
Во время вычисления фазовой корреляции снова применяется преобразование Фурье, затем результаты перемножаются и выполняется обратное преобразование Фурье. Значения в ячейках полученной матрицы соответствуют близости изображений, полученных смещением исходных на величину, соответствующую данной ячейке.
Таким образом, благодаря выполненным преобразованиям достигается инвариантность относительно поворота, а также (в определенных пределах) смещения и масштабирования.
Мерой сходства изображения считается максимальное значение в сглаженной матрице фазовой корреляции. Если она превышает заданный порог, то детектор срабатывает.
Способ может работать только с круглыми печатями, поскольку именно на этом классе объектов был обучен каскадный классификатор.
Благодаря описанным взаимосвязанным действиям при использовании указанного способа значительно увеличивается скорость работы и повышается ее качество.
Анализ заявленного технического решения на соответствие условиям патентоспособности показал, что указанные в независимом пункте формулы признаки являются существенными и взаимосвязаны между собой с образованием устойчивой совокупности неизвестной на дату приоритета из уровня техники необходимых признаков, достаточной для получения требуемого синергетического (сверхсуммарного) технического результата.
Свойства, регламентированные в заявленном способе отдельными признаками, общеизвестны из уровня техники и не требуют дополнительных пояснений.
Таким образом, вышеизложенные сведения свидетельствуют о выполнении при использовании заявленного технического решения следующей совокупности условий:
- объект, воплощающий заявленное техническое решение, при его осуществлении предназначен для использования в области, касающейся обнаружения изображений, и может быть использован при обнаружении круглых печатей;
- для заявленного объекта в том виде, как он охарактеризован в независимом пункте формулы изобретения, подтверждена возможность его осуществления с помощью вышеописанных в материалах заявки известных из уровня техники на дату приоритета средств и методов;
- объект, воплощающий заявленное техническое решение, при его осуществлении способен обеспечить достижение усматриваемого заявителем технического результата.

Claims (1)

  1. Способ автоматизированного поиска заранее заданных эталонных круглых печатей, включающий в себя использование каскадных классификаторов, отличающийся тем, что предусматривает выполнение следующих операций:
    сбор коллекции различных заранее заданных изображений как содержащих круглые печати, так и не содержащих круглые печати;
    обучение каскадных классификаторов на собранных коллекциях изображений;
    преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем;
    сохранение преобразованных изображений печатей на запоминающем устройстве;
    выявление областей в электронном файле анализируемого документа, где предположительно может располагаться печать;
    сравнение найденных областей с заранее заданными эталонами;
    формирование результата, состоящего из эталонов, найденных в анализируемом документе.
RU2013151137/08A 2013-11-18 2013-11-18 Способ автоматизированного поиска эталонных печатей RU2556461C2 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2013151137/08A RU2556461C2 (ru) 2013-11-18 2013-11-18 Способ автоматизированного поиска эталонных печатей

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2013151137/08A RU2556461C2 (ru) 2013-11-18 2013-11-18 Способ автоматизированного поиска эталонных печатей

Publications (2)

Publication Number Publication Date
RU2013151137A RU2013151137A (ru) 2015-05-27
RU2556461C2 true RU2556461C2 (ru) 2015-07-10

Family

ID=53284738

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013151137/08A RU2556461C2 (ru) 2013-11-18 2013-11-18 Способ автоматизированного поиска эталонных печатей

Country Status (1)

Country Link
RU (1) RU2556461C2 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018111918A1 (en) * 2016-12-12 2018-06-21 Texas Instruments Incorporated Methods and systems for analyzing images in convolutional neural networks
RU2750395C1 (ru) * 2020-08-19 2021-06-28 Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС" Способ оценки действительности документа при помощи оптического распознавания текста на изображении круглого оттиска печати/штампа на цифровом изображении документа

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004220261A (ja) * 2003-01-14 2004-08-05 Toshiba Corp 特定画像領域検出装置、紙葉類処理装置、特定画像領域検出方法、および紙葉類処理方法
CN101162506A (zh) * 2007-11-02 2008-04-16 北京大学 圆形印章的印鉴图像检索方法
RU2427911C1 (ru) * 2010-02-05 2011-08-27 Фирма "С1 Ко., Лтд." Способ обнаружения лиц на изображении с применением каскада классификаторов
RU2445699C1 (ru) * 2007-11-28 2012-03-20 Люмэкс Ас Способ обработки данных оптического распознавания символов (ocr), где выходные данные включают в себя изображения символов с нарушенной видимостью

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004220261A (ja) * 2003-01-14 2004-08-05 Toshiba Corp 特定画像領域検出装置、紙葉類処理装置、特定画像領域検出方法、および紙葉類処理方法
CN101162506A (zh) * 2007-11-02 2008-04-16 北京大学 圆形印章的印鉴图像检索方法
RU2445699C1 (ru) * 2007-11-28 2012-03-20 Люмэкс Ас Способ обработки данных оптического распознавания символов (ocr), где выходные данные включают в себя изображения символов с нарушенной видимостью
RU2427911C1 (ru) * 2010-02-05 2011-08-27 Фирма "С1 Ко., Лтд." Способ обнаружения лиц на изображении с применением каскада классификаторов

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
САРАЕВ А.А. и др. "Выделение графических примитивов для анализа структуры документа на примере локализации печатей", опубликовано по данным сайта <URL: http://www.web.archive.org> 05.09.2012, 6 стр. [он-лайн] [найдено 2014-09-11], найдено в Интернет: <URL: http://itas2012.iitp.ru/pdf/1569605143.pdf&gt. *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018111918A1 (en) * 2016-12-12 2018-06-21 Texas Instruments Incorporated Methods and systems for analyzing images in convolutional neural networks
RU2750395C1 (ru) * 2020-08-19 2021-06-28 Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС" Способ оценки действительности документа при помощи оптического распознавания текста на изображении круглого оттиска печати/штампа на цифровом изображении документа

Also Published As

Publication number Publication date
RU2013151137A (ru) 2015-05-27

Similar Documents

Publication Publication Date Title
US11132555B2 (en) Video detection method, server and storage medium
US10176200B2 (en) Efficient image matching for large sets of images
US9626555B2 (en) Content-based document image classification
US10430663B2 (en) Method, electronic device and non-transitory computer readable storage medium for image annotation
Rodriguez-Serrano et al. Label embedding for text recognition.
Minetto et al. T-HOG: An effective gradient-based descriptor for single line text regions
Loos et al. An automated chimpanzee identification system using face detection and recognition
US11461386B2 (en) Visual recognition using user tap locations
RU2668717C1 (ru) Генерация разметки изображений документов для обучающей выборки
US20120099796A1 (en) Image patch descriptors
WO2019136897A1 (zh) 图像处理方法、装置、电子设备及存储介质
US9165184B2 (en) Identifying matching images
De Campos et al. Images as sets of locally weighted features
McBride et al. A comparison of skin detection algorithms for hand gesture recognition
Nanni et al. Combining face and eye detectors in a high-performance face-detection system
Schaeffer A Comparison of Keypoint Descriptors in the Context of Pedestrian Detection: FREAK vs. SURF vs. BRISK
Talukder et al. Connected component based approach for text extraction from color image
RU2556461C2 (ru) Способ автоматизированного поиска эталонных печатей
Karappa et al. Detection of sign-language content in video through polar motion profiles
Rios-Cabrera et al. Boosting masked dominant orientation templates for efficient object detection
Zheng et al. Quantifying contextual information for object detection
Liang et al. Pedestrian detection based on sparse coding and transfer learning
Wójcikowski Histogram of oriented gradients with cell average brightness for human detection
Karakuş et al. A deep learning based fast face detection and recognition algorithm for forensic analysis
Jhansi et al. Sketch Based Image Retrieval with Cosine Similarity.

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner