RU2556461C2 - Способ автоматизированного поиска эталонных печатей - Google Patents
Способ автоматизированного поиска эталонных печатей Download PDFInfo
- Publication number
- RU2556461C2 RU2556461C2 RU2013151137/08A RU2013151137A RU2556461C2 RU 2556461 C2 RU2556461 C2 RU 2556461C2 RU 2013151137/08 A RU2013151137/08 A RU 2013151137/08A RU 2013151137 A RU2013151137 A RU 2013151137A RU 2556461 C2 RU2556461 C2 RU 2556461C2
- Authority
- RU
- Russia
- Prior art keywords
- images
- seals
- round
- found
- predetermined
- Prior art date
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов. Техническим результатом является повышение быстродействия при выявлении в любом документе заранее заданной эталонной круглой печати. Предложен способ автоматизированного поиска заранее заданных эталонных круглых печатей. Способ включает в себя этап, на котором осуществляют сбор коллекции различных заранее заданных изображений как содержащих круглые печати, так и не содержащих круглые печати. Далее согласно способу осуществляют обучение каскадных классификаторов на собранных коллекциях изображений и преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем. А также выявляют области в электронном файле анализируемого документа, где предположительно может располагаться печать, и осуществляют сравнение найденных областей с заранее заданными эталонами.
Description
Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов.
Из уровня техники известны способы распознавания и поиска данных, в том числе изображений. Например, заявка на изобретение РФ №2012110605, система добавления метаданных, способ и устройство поиска изображения и способ добавления жеста для этого, 27.09.2013, которая включает в том числе и способ поиска изображения, содержащего извлечение по меньшей мере одних метаданных относительно изображения посредством анализа изображения; добавление метаданных к изображению и сохранение изображения с добавленными метаданными во внешнем устройстве и поиск по меньшей мере одного изображения из изображений, сохраненных во внешнем устройстве, на основе метаданных.
Недостатком известного способа является то, что для поиска изображения используются метаданные и не используется информация непосредственно из изображения, в данном случае при отсутствии таких метаданных изображение будет невозможно найти.
Наиболее близким техническим решением к предлагаемому изобретению является способ обнаружения лиц на изображении с применением каскада классификаторов (патент на изобретение РФ №2427911, опубликовано 27.08.2011).
Недостатком указанного способа является ограниченная возможность по поиску изображений только в виде лиц.
Технический результат, на решение которого направлено заявленное изобретение, заключается в создании быстрого, качественного и универсального способа, который позволил бы выявлять в любом документе заданную эталонную круглую печать.
Особенность способа по настоящему изобретению состоит в том, что если достаточно определить только наличие круглой печати, эталонные печати задавать не требуется.
Данный технический результат достигается посредством того, что в способе, включающем в себя использование каскадных класификаторов, предусматривается выполнение следующих операций:
- сбор коллекции различных изображений как содержащих круглые печати, так и не содержащих круглые печати;
- обучение каскадных классификаторов на собранных коллекциях изображений;
- преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем;
- сохранение преобразованных изображений печатей на запоминающем устройстве;
- выявление областей в электронном файле анализируемого документа, где предположительно может располагаться печать;
- сравнение найденных областей с заранее заданными эталонами;
- формирование результата, состоящего из эталонов, найденных в анализируемом документе.
Способ автоматизированного поиска эталонных печатей осуществляют следующим образом.
Используемый алгоритм состоит из двух ступеней:
1. На изображении ищутся области (заданные окнами - ограничивающими квадратами), похожие на круглую печать.
2. Найденные «подозрительные» области сравниваются с загруженными пользователем эталонами печатей.
Такая схема позволила достигнуть приемлемого качества и скорости работы.
Первая ступень настроена так, чтобы баланс ошибок был смещен в сторону ложноположительных срабатываний: практически все изображения печатей пропускаются до второй ступени, но вместе с ними могут попадаться и объекты, не являющиеся печатями.
На вторую ступень попадает небольшое количество подозрительных окон, что значительно сокращает пространство поиска и соответственно время работы детектора.
Для нахождения областей, похожих на круглую печать, был применен каскадный классификатор Виолы-Джонса. Указанный детектор представляет собой каскад очень простых классификаторов (принцип бустинга), основанных на признаках Хаара. Это позволяет отсекать большую часть окон на ранних стадиях, не прогоняя их через весь каскад. За счет этого достигается высокая скорость работы - детектор Виолы-Джонса широко используется для детектирования лиц (например, WO 2008064395 (PCT/AU 2007/001169)), в том числе в портативных устройствах в режиме real-time.
Общий принцип многих детекторов: изображение обрабатывается скользящим окном; для каждого окна решается независимо задача бинарной классификации: есть ли объект на изображении или нет. Если ответ положительный, то в данной позиции найден искомый объект. Размер скользящего окна варьируется от минимального до максимального с заданным множителем.
В способе используется реализация каскадного классификатора из OpenCV. Для обучения использовалась компьютерная программа «Traincascade».
Примеры реализации.
В компании ЗАО «ИнфоВотч» прошли испытания предложенного способа, а именно была создана большая коллекция круглых печатей, а также не-печатей (отрицательных примеров), состоящая примерно из 10.000 изображений. За основу были взяты различные изображения печатей и не-печатей (в частности, выкачанные автоматически из сети Интернет по разным запросам к Google Images), а также внутренняя коллекция документов с печатями компании.
Со всех изображений печати вырезались с помощью детектора окружностей Хафа, а затем с помощью отдельной компьютерной программы из каждого такого изображения создавалось еще несколько путем применения различных операций: поворота на случайный угол и изменения яркости на случайную величину (в пределах некоторого диапазона).
Отобранные каскадным классификатором окна сравниваются с эталонами, загруженными пользователем.
Однако сравнивать их напрямую нельзя, поскольку печать может быть повернута, а также слегка смещена и отмасштабирована относительно эталона. Поэтому используется преобразование Фурье-Меллина:
- К исходным изображениям применяется преобразование Фурье.
- Затем они переводятся в log-полярные координаты.
- Вычисляется фазовая корреляция, которая характеризует близость изображений.
После первых двух преобразований поворот и масштабирование представляются в виде линейных смещений.
Во время вычисления фазовой корреляции снова применяется преобразование Фурье, затем результаты перемножаются и выполняется обратное преобразование Фурье. Значения в ячейках полученной матрицы соответствуют близости изображений, полученных смещением исходных на величину, соответствующую данной ячейке.
Таким образом, благодаря выполненным преобразованиям достигается инвариантность относительно поворота, а также (в определенных пределах) смещения и масштабирования.
Мерой сходства изображения считается максимальное значение в сглаженной матрице фазовой корреляции. Если она превышает заданный порог, то детектор срабатывает.
Способ может работать только с круглыми печатями, поскольку именно на этом классе объектов был обучен каскадный классификатор.
Благодаря описанным взаимосвязанным действиям при использовании указанного способа значительно увеличивается скорость работы и повышается ее качество.
Анализ заявленного технического решения на соответствие условиям патентоспособности показал, что указанные в независимом пункте формулы признаки являются существенными и взаимосвязаны между собой с образованием устойчивой совокупности неизвестной на дату приоритета из уровня техники необходимых признаков, достаточной для получения требуемого синергетического (сверхсуммарного) технического результата.
Свойства, регламентированные в заявленном способе отдельными признаками, общеизвестны из уровня техники и не требуют дополнительных пояснений.
Таким образом, вышеизложенные сведения свидетельствуют о выполнении при использовании заявленного технического решения следующей совокупности условий:
- объект, воплощающий заявленное техническое решение, при его осуществлении предназначен для использования в области, касающейся обнаружения изображений, и может быть использован при обнаружении круглых печатей;
- для заявленного объекта в том виде, как он охарактеризован в независимом пункте формулы изобретения, подтверждена возможность его осуществления с помощью вышеописанных в материалах заявки известных из уровня техники на дату приоритета средств и методов;
- объект, воплощающий заявленное техническое решение, при его осуществлении способен обеспечить достижение усматриваемого заявителем технического результата.
Claims (1)
- Способ автоматизированного поиска заранее заданных эталонных круглых печатей, включающий в себя использование каскадных классификаторов, отличающийся тем, что предусматривает выполнение следующих операций:
сбор коллекции различных заранее заданных изображений как содержащих круглые печати, так и не содержащих круглые печати;
обучение каскадных классификаторов на собранных коллекциях изображений;
преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем;
сохранение преобразованных изображений печатей на запоминающем устройстве;
выявление областей в электронном файле анализируемого документа, где предположительно может располагаться печать;
сравнение найденных областей с заранее заданными эталонами;
формирование результата, состоящего из эталонов, найденных в анализируемом документе.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2013151137/08A RU2556461C2 (ru) | 2013-11-18 | 2013-11-18 | Способ автоматизированного поиска эталонных печатей |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2013151137/08A RU2556461C2 (ru) | 2013-11-18 | 2013-11-18 | Способ автоматизированного поиска эталонных печатей |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2013151137A RU2013151137A (ru) | 2015-05-27 |
RU2556461C2 true RU2556461C2 (ru) | 2015-07-10 |
Family
ID=53284738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013151137/08A RU2556461C2 (ru) | 2013-11-18 | 2013-11-18 | Способ автоматизированного поиска эталонных печатей |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2556461C2 (ru) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018111918A1 (en) * | 2016-12-12 | 2018-06-21 | Texas Instruments Incorporated | Methods and systems for analyzing images in convolutional neural networks |
RU2750395C1 (ru) * | 2020-08-19 | 2021-06-28 | Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС" | Способ оценки действительности документа при помощи оптического распознавания текста на изображении круглого оттиска печати/штампа на цифровом изображении документа |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004220261A (ja) * | 2003-01-14 | 2004-08-05 | Toshiba Corp | 特定画像領域検出装置、紙葉類処理装置、特定画像領域検出方法、および紙葉類処理方法 |
CN101162506A (zh) * | 2007-11-02 | 2008-04-16 | 北京大学 | 圆形印章的印鉴图像检索方法 |
RU2427911C1 (ru) * | 2010-02-05 | 2011-08-27 | Фирма "С1 Ко., Лтд." | Способ обнаружения лиц на изображении с применением каскада классификаторов |
RU2445699C1 (ru) * | 2007-11-28 | 2012-03-20 | Люмэкс Ас | Способ обработки данных оптического распознавания символов (ocr), где выходные данные включают в себя изображения символов с нарушенной видимостью |
-
2013
- 2013-11-18 RU RU2013151137/08A patent/RU2556461C2/ru active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004220261A (ja) * | 2003-01-14 | 2004-08-05 | Toshiba Corp | 特定画像領域検出装置、紙葉類処理装置、特定画像領域検出方法、および紙葉類処理方法 |
CN101162506A (zh) * | 2007-11-02 | 2008-04-16 | 北京大学 | 圆形印章的印鉴图像检索方法 |
RU2445699C1 (ru) * | 2007-11-28 | 2012-03-20 | Люмэкс Ас | Способ обработки данных оптического распознавания символов (ocr), где выходные данные включают в себя изображения символов с нарушенной видимостью |
RU2427911C1 (ru) * | 2010-02-05 | 2011-08-27 | Фирма "С1 Ко., Лтд." | Способ обнаружения лиц на изображении с применением каскада классификаторов |
Non-Patent Citations (1)
Title |
---|
САРАЕВ А.А. и др. "Выделение графических примитивов для анализа структуры документа на примере локализации печатей", опубликовано по данным сайта <URL: http://www.web.archive.org> 05.09.2012, 6 стр. [он-лайн] [найдено 2014-09-11], найдено в Интернет: <URL: http://itas2012.iitp.ru/pdf/1569605143.pdf>. * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018111918A1 (en) * | 2016-12-12 | 2018-06-21 | Texas Instruments Incorporated | Methods and systems for analyzing images in convolutional neural networks |
RU2750395C1 (ru) * | 2020-08-19 | 2021-06-28 | Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС" | Способ оценки действительности документа при помощи оптического распознавания текста на изображении круглого оттиска печати/штампа на цифровом изображении документа |
Also Published As
Publication number | Publication date |
---|---|
RU2013151137A (ru) | 2015-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11132555B2 (en) | Video detection method, server and storage medium | |
US10176200B2 (en) | Efficient image matching for large sets of images | |
US9626555B2 (en) | Content-based document image classification | |
US10430663B2 (en) | Method, electronic device and non-transitory computer readable storage medium for image annotation | |
Rodriguez-Serrano et al. | Label embedding for text recognition. | |
Minetto et al. | T-HOG: An effective gradient-based descriptor for single line text regions | |
Loos et al. | An automated chimpanzee identification system using face detection and recognition | |
US11461386B2 (en) | Visual recognition using user tap locations | |
RU2668717C1 (ru) | Генерация разметки изображений документов для обучающей выборки | |
US20120099796A1 (en) | Image patch descriptors | |
WO2019136897A1 (zh) | 图像处理方法、装置、电子设备及存储介质 | |
US9165184B2 (en) | Identifying matching images | |
De Campos et al. | Images as sets of locally weighted features | |
McBride et al. | A comparison of skin detection algorithms for hand gesture recognition | |
Nanni et al. | Combining face and eye detectors in a high-performance face-detection system | |
Schaeffer | A Comparison of Keypoint Descriptors in the Context of Pedestrian Detection: FREAK vs. SURF vs. BRISK | |
Talukder et al. | Connected component based approach for text extraction from color image | |
RU2556461C2 (ru) | Способ автоматизированного поиска эталонных печатей | |
Karappa et al. | Detection of sign-language content in video through polar motion profiles | |
Rios-Cabrera et al. | Boosting masked dominant orientation templates for efficient object detection | |
Zheng et al. | Quantifying contextual information for object detection | |
Liang et al. | Pedestrian detection based on sparse coding and transfer learning | |
Wójcikowski | Histogram of oriented gradients with cell average brightness for human detection | |
Karakuş et al. | A deep learning based fast face detection and recognition algorithm for forensic analysis | |
Jhansi et al. | Sketch Based Image Retrieval with Cosine Similarity. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PD4A | Correction of name of patent owner |