RU2637989C2 - Способ и устройство для идентификации целевого объекта на изображении - Google Patents

Способ и устройство для идентификации целевого объекта на изображении Download PDF

Info

Publication number
RU2637989C2
RU2637989C2 RU2015111423A RU2015111423A RU2637989C2 RU 2637989 C2 RU2637989 C2 RU 2637989C2 RU 2015111423 A RU2015111423 A RU 2015111423A RU 2015111423 A RU2015111423 A RU 2015111423A RU 2637989 C2 RU2637989 C2 RU 2637989C2
Authority
RU
Russia
Prior art keywords
image
subsets
exceed
areas
lines
Prior art date
Application number
RU2015111423A
Other languages
English (en)
Other versions
RU2015111423A (ru
Inventor
Цигуй ВАНГ
Юнь ПЭН
Original Assignee
ЗетТиИ Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ЗетТиИ Корпорейшн filed Critical ЗетТиИ Корпорейшн
Publication of RU2015111423A publication Critical patent/RU2015111423A/ru
Application granted granted Critical
Publication of RU2637989C2 publication Critical patent/RU2637989C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

Изобретение относится к способу и устройству для идентификации целевого объекта на изображении, которые касаются технологии обработки изображений. Технический результат заключается в повышении точности идентификации объекта на изображении. Способ включает следующее: точки на изображении разделяют на множество подмножеств согласно областям и линиям на изображении; затем выполняется сравнение данных в каждом подмножестве с данными целевого объекта, которые хранятся в базе данных, так что целевой объект, соответствующий данным в базе данных, выбирается из изображения; тогда области и линии, соответствующие подмножествам, которые превышают заданный порог, выделяют на экране дисплея, поэтому целевой объект выделяется на экране дисплея, благодаря чему целевой объект на изображении идентифицируется и выделяется на экране дисплея. 2 н. и 6 з.п. ф-лы, 3 ил.

Description

Область техники
Данное изобретение касается технологии обработки изображений и, в частности, способа и устройства для идентификации целевого объекта на изображении.
Предпосылки создания изобретения
В настоящее время при рассмотрении изображения только изображение, которое сформировано исходной съемкой, может рассматриваться непосредственно, а в некоторых сценариях специального применения пользователи хотят иметь возможность сосредоточить внимание на рассмотрении определенного объекта на группе изображений, например, это, возможно, будет сосредоточение внимания на зданиях на изображениях при изучении архитектуры.
Если пользователь должен сосредоточиться на рассмотрении некоторого объекта на изображении, он может выполнять только визуальный поиск объекта на изображении, так что при недостаточной опытности пользователя, вероятно, будут пропуски.
Сущность изобретения
Формы осуществления данного изобретения предлагают способ и устройство для идентификации целевого объекта на изображении, чтобы осуществлять идентификацию целевого объекта на изображении и выделять его на экране дисплея.
Согласно одному аспекту данного изобретения предлагается способ идентификации целевого объекта на изображении, который включает следующее:
изображение анализируется, и точки на изображении разделяют на множество подмножеств согласно областям и линиям на изображении;
проводится сравнение данных в каждом подмножестве с данными целевого объекта, которые хранятся в базе данных, и определяют подмножества, степень соответствия которых превышает заданный порог; и
области и линии, соответствующие подмножествам, которые превышают заданный порог, выделяют.
Согласно другому аспекту данного изобретения предлагается устройство для идентификации целевого объекта на изображении, содержащее:
блок разделения, сконфигурированный так, чтобы анализировать изображение и разделять точки на изображении на множество подмножеств согласно областям и линиям на изображении;
блок сравнения, сконфигурированный так, чтобы проводить сравнение данных в каждом подмножестве с данными целевого объекта, которые хранятся в базе данных, и определять те подмножества, для которых степень соответствия превышает заданный порог; и
блок отображения, сконфигурированный так, чтобы выделять на экране дисплея области и линии, соответствующие подмножествам, которые превышают заданный порог.
Формы осуществления данного изобретения предлагают способ и устройство для идентификации целевого объекта на изображении. Способ включает следующее: точки на изображении разделяют на множество подмножеств согласно областям и линиям на изображении; затем проводится сравнение данных в каждом подмножестве с данными целевого объекта, которые хранятся в базе данных, так что целевой объект, соответствующий данным в базе данных, выбирается из изображения; тогда области и линии, соответствующие подмножествам, которые превышают заданный порог, выделяют, и, следовательно, целевой объект выделяется, таким образом целевой объект на изображении идентифицируется и выделяется на экране дисплея.
Описание чертежей
На фиг. 1 показана блок-схема способа идентификации целевого объекта на изображении согласно форме осуществления данного изобретения.
На фиг. 2 показана блок-схема предпочтительного способа идентификации для целевого объекта на изображении согласно форме осуществления данного изобретения.
На фиг. 3 показана структурная схема устройства для идентификации целевого объекта на изображении согласно форме осуществления данного изобретения.
Подробное описание форм осуществления изобретения
Формы осуществления данного изобретения предлагают способ и устройство для идентификации целевого объекта на изображении. Способ включает следующее: точки на изображении разделяют на множество подмножеств согласно областям и линиям на изображении; затем проводится сравнение данных в каждом подмножестве с данными целевого объекта, которые хранятся в базе данных, так что целевой объект, соответствующий данным в базе данных, выбирается из изображения; тогда области и линии, соответствующие подмножествам, которые превышают заданный порог, выделяются, и следовательно, целевой объект выделяется на экране дисплея, таким образом целевой объект на изображении идентифицируется и выделяется на экране дисплея.
Как показано на фиг. 1, форма осуществления данного изобретения предлагает способ идентификации целевого объекта на изображении, включающий:
шаг S101, изображение анализируется, и точки на изображении разделяют на множество подмножеств согласно областям и линиям на изображении;
шаг S102, проводится сравнение данных в каждом подмножестве с данными целевого объекта, которые хранятся в базе данных, и определяются подмножества, степень соответствия которых превышает заданный порог; и
шаг S103, области и линии, соответствующие подмножествам, которые превышают заданный порог, выделяют.
Следовательно, когда изображение необходимо отобразить, сначала изображение анализируется и определяются данные областей и линий, соответствующих данным в базе данных, и затем области и линии выделяют, чтобы облегчить пользователю идентификацию целевого объекта.
На шаге S101 выполняется анализ изображения, так что точки на изображении разделяют на различные подмножества, которые включают изолированные точки, непрерывные кривые или непрерывные области. Общие способы для анализа изображения включают вычисление лапласиана над гауссианом (Laplacian Of Gaussian, LOG), алгоритм Оцу (максимизации дисперсии между классами), алгоритм Бернсена, бинаризации на основе значения локального экстремума (Local Extreme Value Based Binarization, LEVBB) и т.д.
Здесь алгоритм Оцу будет создавать погрешность бинаризации для гистограммы, которая является изображением с одним пиком или несколькими пиками с перемежающимися значениями уровня серого целевого и фонового пикселей; алгоритм Бернсена может правильно выполнять бинаризацию, но он создает большое количество паразитных изображений, чувствителен к шуму и имеет недостатки и проблемы, такие как пропуски частей цели и паразитные изображения; и алгоритм LEVBB имеет лучшие результаты, может эффективно устранять паразитные изображения, создаваемые алгоритмом Бернсена, и нечувствителен к шуму, но при сильном изменении освещенности часть результатов будет неправильна, и будет происходить слипание символов в тексте.
Алгоритм LOG может противостоять сильному изменению освещенности и шумовым помехам, и хорошо сохранять оригинальную форму цели, чтобы получать лучший результат. С использованием алгоритма LOG выполняется обнаружение края изображения на основе перехода лапласиана через нуль, определение, принадлежат цели или фону пиксели с двух сторон края в точке перехода через нуль, и определение атрибутов однородных областей (фона или цели) на изображении согласно атрибутам окрестностей. Способ может преодолеть проблему пропуска частей цели и паразитных изображений в алгоритме Бернсена, и он также преодолевает недостаток восприимчивости к шуму и неравномерной освещенности алгоритма Оцу, и алгоритм LOG дает лучший результат, чем алгоритм LEVBB.
В случае когда система имеет высокие уровни в отношении скорости обработки, емкости памяти и стабильности, характерная точка LOG будет идеальным выбором, и разделение на подмножества может быть реализовано извлечением характерных точек LOG.
Таким образом, на шаге S101 шаг анализа изображения и разделения точек на изображении на множество подмножеств согласно областям и линиям на изображении, в частности, включает:
изображение анализируется алгоритмом вычисления лапласиана над гауссианом (LOG), и точки на изображении разделяются на множество подмножеств согласно областям и линиям на изображении.
Соответственно, на шаге S102 данные характерного образца LOG определенного целевого объекта сохраняются в базе данных и хранящиеся данные образца охватывают влияния различных изменений окружающей среды (масштаб, вращение, освещенность, разбиение на блоки и т.д.) на изображение, и в общем хранящиеся данные образца могут гарантировать изменения, имеющие высокую адаптируемость и устойчивость. Например, при выполнении контролируемого обучения для характерных образцов LOG изображения, с использованием папоротникового (ferns) классификатора, составленного древовидной структурой принятия решений, это может дополнительно гарантировать, что хранящиеся образцы данных могут обеспечивать изменения, имеющие высокую адаптируемость и устойчивость.
На шаге S103, шаг выделения на экране дисплея областей и линий, соответствующих подмножествам, которые превышают заданный порог, включает, в частности, следующее:
выполняется улучшенная визуализация для областей и линий, соответствующих подмножествам, которые превышают заданный порог; и/или
отображается информация, соответствующая подмножествам, которые превышают заданный порог.
Здесь при выполнении улучшенной визуализации ввод данных в устройство визуализации может быть матрицей положений и вывод данных из устройства воспроизведения может быть данными изображения после улучшенной визуализации.
Для идентифицированного целевого объекта может отображаться релевантная информация, то есть информация, соответствующая подмножествам, которые превышают заданный порог. Релевантная информация содержит символы, изображения, телевизионные и звуковые сигналы. Когда никакая релевантная информация не хранится в базе данных, пользователь может вводить релевантную информацию и при этом перед шагом отображения информации, соответствующей подмножествам, которые превышают заданный порог, включаются также следующие шаги:
из базы данных получается информация, соответствующая подмножествам, которые превышают заданный порог; или
получается информация, вводимая пользователем и соответствующая подмножествам, которые превышают заданный порог.
Конечно, есть много способов выделения целевого объекта, например отображение специальных меток и очерчивание рамкой, которые не описываются здесь исчерпывающе.
Когда изображение является панорамным изображением, оно требует анализа каждого кадра изображения в панорамном изображении по отдельности, что, в частности, включает:
когда изображение является панорамным изображением, на шаге S101 шаг анализа изображения и разделения точек на изображении на множество подмножеств согласно областям и линиям на изображении, в частности, включает следующее:
каждый кадр на панорамном изображении анализируется, и точки в каждом кадре изображения разделяют на множество подмножеств согласно областям и линиям на изображении; и
на шаге S103 шаг выделения на экране дисплея областей и линий, соответствующих подмножествам, которые превышают заданный порог, в частности, включает:
определение, отображены ли на предыдущем кадре изображения области и линии, являющиеся теми же самыми, что и области и линии, соответствующие подмножествам, которые превышают заданный порог в текущем кадре изображения, и если да, то области и линии, соответствующие подмножествам, которые превышают заданный порог в текущем кадре изображения, не отображают, а если нет, то области и линии, соответствующие подмножествам, которые превышают заданный порог на текущем кадре изображения, выделяют.
Способ идентификации целевого объекта на изображении согласно формам осуществления данного изобретения будет описан ниже подробно с идентификацией целевого объекта на панорамном изображении в качестве примера, как показано на фиг. 2, этот способ включает:
шаг S201, характерная информация каждого кадра изображения на панорамном изображении анализируется, извлекают характерные точки LOG, и точки на изображении разделяют на множество подмножеств согласно областям и линиям на изображении;
шаг S202, проводится сравнение данных в каждом подмножестве с данными целевого объекта, которые хранятся в базе данных, и определяют подмножества, степень соответствия которых превышает заданный порог. Для учета влияния различных изменений окружающей среды (масштаб, вращение, освещенность, разбиение на блоки и т.д.) на изображение во время сравнения выполняется контролируемое обучение на характерных образцах LOG изображения с использованием папоротникового (ferns) классификатора, составленного древовидной структурой принятия решений, так чтобы гарантировать алгоритм, имеющий высокую адаптируемость и устойчивость к изменениям при достаточном контролируемом обучении, таким образом идентификация сцены завершается;
шаг S203, выполняется операция улучшенной визуализации для идентифицированного целевого объекта, и отображается релевантная информация об идентифицированном целевом объекте, причем релевантная информация может содержать символы, изображения, телевизионные и звуковые сигналы;
в течение процесса улучшенной визуализации следует обратить внимание на операцию стыковки предыдущих и последующих кадров изображения: если предыдущий кадр изображения отображает информацию целевого объекта, то последующий кадр изображения не будет отображать информацию целевого объекта;
шаг S204, для идентифицированного целевого объекта принимается релевантная информация, вводимая пользователем; релевантная информация может содержать символы, изображения, телевизионные и звуковые сигналы.
Формы осуществления данного изобретения предлагают также устройство для идентификации целевого объекта на изображении. Соответственно, как показано на фиг. 3, устройство включает:
блок разделения 301, сконфигурированный, чтобы анализировать изображение, разделяя точки на изображении на множество подмножеств согласно областям и линиям на изображении;
блок сравнения 302, сконфигурированный, чтобы проводить сравнение данных в каждом подмножестве с данными целевого объекта, которые хранятся в базе данных, и определять подмножества, для которых степень соответствия превышает заданный порог; и
блок отображения 303, сконфигурированный, чтобы выделять области и линии, соответствующие подмножествам, которые превышают заданный порог.
Здесь блок разделения 301, в частности, сконфигурирован так, чтобы анализировать изображение алгоритмом вычисления лапласиана над гауссианом (LOG) и разделять точки на изображении на множество подмножеств согласно областям и линиям на изображении.
Блок отображения 303 сконфигурирован, в частности, чтобы выполнять улучшенную визуализацию для областей и линий, соответствующих подмножествам, которые превышают заданный порог; и/или
блок отображения 303 сконфигурирован, в частности, чтобы отображать информацию, соответствующую подмножествам, которые превышают заданный порог.
Блок отображения 303 сконфигурирован также, чтобы перед отображением информации, соответствующей подмножествам, которые превышают заданный порог, получать информацию, соответствующую подмножествам, которые превышают заданный порог, из базы данных; или
блок отображения 303 сконфигурирован, чтобы перед отображением информации, соответствующей подмножествам, которые превышают заданный порог, получать данные, вводимые пользователем и соответствующие подмножествам, которые превышают заданный порог.
Когда изображение является панорамным изображением, блок разделения 301, в частности, конфигурируется так, чтобы анализировать каждый кадр в панорамном изображении и разделять точки на каждом кадре изображения на множество подмножеств согласно областям и линиям на изображении; и
блок отображения 303 конфигурируется, в частности, так, чтобы определять, отображены ли на предыдущем кадре изображения области и линии, являющиеся теми же самыми, что и области и линии, соответствующие подмножествам, которые превышают заданный порог в текущем кадре изображения, и если да, то области и линии, соответствующие подмножествам, которые превышают заданный порог в текущем кадре изображения, не отображают, а если нет, то области и линии, соответствующие подмножествам, которые превышают заданный порог на текущем кадре изображения, выделяют.
Формы осуществления данного изобретения предлагают способ и устройство для идентификации целевого объекта на изображении. Способ включает следующее: точки на изображении разделяют на множество подмножеств согласно областям и линиям на изображении; затем проводится сравнение данных в каждом подмножестве с данными целевого объекта, которые хранятся в базе данных, так что целевой объект, соответствующий данным в базе данных, выбирается из изображения; тогда области и линии, соответствующие подмножествам, которые превышают заданный порог, выделяют, следовательно, целевой объект выделяется, таким образом целевой объект на изображении идентифицируется и выделяется.
Специалистам в данной области техники будет понятно, что форма осуществления изобретения может быть реализована как способ, система или программное изделие для компьютера. Поэтому данное изобретение может принимать форму осуществления полностью аппаратными средствами, полностью программными средствами или форму осуществления, комбинирующую программные и аппаратные аспекты. Кроме того, данное изобретение может принимать форму программного изделия для компьютера, которое реализуется на одном или нескольких пригодных для использования компьютером носителях хранения данных (включая, но не ограничиваясь этим, запоминающее устройство на магнитных дисках, постоянное запоминающее устройство на компакт-диске (Compact Disc Readonly Memory, CD-ROM) и оптическим запоминающее устройство), содержащих пригодные для использования компьютерами коды программы.
Данное описание изобретения ссылается на схему алгоритма и/или блок-схему программного изделия для компьютера, устройства (системы) и способа. Должно быть понятно, что каждый поток данных и/или блок на схеме алгоритма и/или блок-схеме, а также комбинация потоков данных и/или блоков на схеме алгоритма и/или блок-схеме может быть реализован посредством команд компьютерной программы. Эти команды компьютерной программы могут подаваться на универсальный компьютер, специализированный компьютер, встраиваемый процессор или процессор других программируемых устройств обработки данных, чтобы генерировать машину, такую как устройство, сконфигурированное для осуществления функции, определяемой в одном или нескольких потоках данных на схеме алгоритма, и/или блок-схеме, и/или в одном или нескольких блоках на блок-схеме, посредством команд, выполняемых процессором других программируемых устройств обработки данных или компьютера.
Эти команды компьютерной программы также могут храниться на машиночитаемом накопителе данных, способном к управлению компьютером или другим программируемым устройством обработки данных, чтобы работать определенным образом, так чтобы команды, хранящиеся на машиночитаемом накопителе данных, генерировали изделие, включая командное устройство, которое осуществляет функцию, определяемую в одном или нескольких потоках на схеме алгоритма и/или в одном или нескольких блоках на блок-схеме.
Эти команды компьютерной программы также могут загружаться в компьютер или другие программируемые устройства обработки данных, чтобы выполнять серию рабочих шагов на компьютере (или других программируемых устройствах обработки данных), чтобы генерировать реализуемую компьютером обработку, поэтому команды, выполняемые на компьютере (или других программируемых устройствах), обеспечивают шаги для осуществления функции, определяемой в одном или нескольких потоках на схеме алгоритма и/или в одном или нескольких блоках на блок-схеме.
Хотя описываются предпочтительные формы осуществления изобретения, специалисты в данной области техники могут предложить альтернативные изменения и разновидности для этих форм осуществления, когда они узнают основную идею изобретения. Поэтому предполагается, что формула изобретения интерпретируется как включающие предпочтительные формы осуществления и все изменения и разновидности, входящие в пределы объема изобретения.
Очевидно, что специалисты в данной области техники могут осуществить различные изменения и улучшении для данного изобретения без отступления от его объема. Таким образом, если все изменения и улучшения находятся в объеме формулы данного изобретения и подобных технологий, данное изобретение предполагает включение этих изменений и улучшений.

Claims (30)

1. Способ идентификации целевого объекта на изображении, включающий:
анализ изображения и разделение точек на изображении на множество подмножеств согласно областям и линиям на изображении;
выполнение сравнения данных в каждом подмножестве с данными целевого объекта, которые хранятся в базе данных, и определение тех подмножеств, степень соответствия которых превышает заданный порог; и
выделение областей и линий, соответствующих тем подмножествам, которые превышают заданный порог;
когда изображение является панорамным изображением, шаг анализа изображения и разделения точек на изображении на множество подмножеств согласно областям и линиям на изображении включает:
анализ каждого кадра в панорамном изображении и разделение точек в каждом кадре изображения на множество подмножеств согласно областям и линиям на изображении; и
шаг выделения областей и линий, соответствующих подмножествам, которые превышают заданный порог, включает:
определение, отображены ли на предыдущем кадре изображения области и линии, являющиеся теми же самыми, что и области и линии, соответствующие подмножествам, которые превышают заданный порог в текущем кадре изображения, и если результат определения положителен, то области и линии, соответствующие подмножествам, которые превышают заданный порог в текущем кадре изображения, не отображают, а если результат определения отрицателен, то области и линии, соответствующие подмножествам, которые превышают заданный порог в текущем кадре изображения, выделяют.
2. Способ по п. 1, отличающийся тем, что шаг анализа изображения и разделения точек на изображении на множество подмножеств согласно областям и линиям на изображении включает:
анализ изображения алгоритмом вычисления лапласиана над гауссианом (LOG) и разделение точек на изображении на множество подмножеств согласно областям и линиям на изображении.
3. Способ по п. 1, отличающийся тем, что шаг выделения на экране дисплея областей и линий, соответствующих подмножествам, которые превышают заданный порог, включает:
выполнение улучшенной визуализации для областей и линий, соответствующих подмножествам, которые превышают заданный порог; и/или
отображение информации, соответствующей подмножествам, которые превышают заданный порог.
4. Способ по п. 3, отличающийся тем, что перед отображением информации, соответствующей подмножествам, которые превышают заданный порог, он включает также:
получение информации, соответствующей подмножествам, которые превышают заданный порог, из базы данных; или
получение информации, вводимой пользователем и соответствующей подмножествам, которые превышают заданный порог.
5. Устройство для идентификации целевого объекта на изображении, содержащее:
блок разделения, сконфигурированный, чтобы анализировать изображение и разделять точки на изображении на множество подмножеств согласно областям и линиям на изображении;
блок сравнения, сконфигурированный, чтобы проводить сравнение данных в каждом подмножестве с данными целевого объекта, которые хранятся в базе данных, и определять те подмножества, для которых степень соответствия превышает заданный порог; и
блок отображения, сконфигурированный, чтобы выделять на экране дисплея области и линии, соответствующие подмножествам, которые превышают заданный порог;
когда изображение является панорамным изображением,
блок разделения дополнительно сконфигурирован так, чтобы анализировать каждый кадр на панорамном изображении и разделять точки в каждом кадре изображения на множество подмножеств согласно областям и линиям на изображении; и
блок отображения дополнительно сконфигурирован так, чтобы определять, отображаются ли на предыдущем кадре изображения области и линии, являющиеся теми же самыми, что и области и линии, соответствующие подмножествам, которые превышают заданный порог в текущем кадре изображения, и если результат определения положителен, то блок отображения не конфигурирован для отображения областей и линий, соответствующих подмножествам, которые превышают заданный порог на текущем кадре изображения, а если результат определения отрицательный, то блок отображения конфигурирован для выделения областей и линий, соответствующих подмножествам, которые превышают заданный порог на текущем кадре изображения.
6. Устройство по п. 5, отличающееся тем, что блок разделения дополнительно сконфигурирован для анализа изображения алгоритмом вычисления лапласиана над гауссианом (LOG) и разделения точек на изображении на множество подмножеств согласно областям и линиям на изображении.
7. Устройство по п. 5, отличающееся тем, что
блок отображения дополнительно сконфигурирован, чтобы выполнять улучшенную визуализацию для областей и линий, соответствующих подмножествам, которые превышают заданный порог; и/или
блок отображения дополнительно сконфигурирован, чтобы отображать информацию, соответствующую подмножествам, которые превышают заданный порог.
8. Устройство по п. 7, отличающееся тем, что
блок отображения дополнительно сконфигурирован так, чтобы перед отображением информации, соответствующей подмножествам, которые превышают заданный порог, получать из базы данных информацию, соответствующую подмножествам, которые превышают заданный порог; или
блок отображения дополнительно сконфигурирован так, чтобы перед отображением информации, соответствующей подмножествам, которые превышают заданный порог, получать информацию, вводимую пользователем и соответствующую подмножествам, которые превышают заданный порог.
RU2015111423A 2012-09-21 2013-09-16 Способ и устройство для идентификации целевого объекта на изображении RU2637989C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201210360651.2 2012-09-21
CN201210360651.2A CN103679129A (zh) 2012-09-21 2012-09-21 一种图像中的目标物体识别方法及装置
PCT/CN2013/083578 WO2014044158A1 (zh) 2012-09-21 2013-09-16 一种图像中的目标物体识别方法及装置

Publications (2)

Publication Number Publication Date
RU2015111423A RU2015111423A (ru) 2016-11-10
RU2637989C2 true RU2637989C2 (ru) 2017-12-08

Family

ID=50316621

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015111423A RU2637989C2 (ru) 2012-09-21 2013-09-16 Способ и устройство для идентификации целевого объекта на изображении

Country Status (6)

Country Link
US (1) US20150248592A1 (ru)
EP (1) EP2899671A4 (ru)
JP (1) JP6240199B2 (ru)
CN (1) CN103679129A (ru)
RU (1) RU2637989C2 (ru)
WO (1) WO2014044158A1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2746840C1 (ru) * 2020-09-08 2021-04-21 ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ КАЗЕННОЕ ВОЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "Военная академия Ракетных войск стратегического назначения имени Петра Великого" МИНИСТЕРСТВА ОБОРОНЫ РОССИЙСКОЙ ФЕДЕРАЦИИ Способ поиска и идентификации токсичных осколков разрушившегося в результате аварийных воздействий ядерно- и радиационно опасного объекта

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10552933B1 (en) 2015-05-20 2020-02-04 Digimarc Corporation Image processing methods and arrangements useful in automated store shelf inspections
US10482361B2 (en) 2015-07-05 2019-11-19 Thewhollysee Ltd. Optical identification and characterization system and tags
US9740951B2 (en) * 2015-09-11 2017-08-22 Intel Corporation Technologies for object recognition for internet-of-things edge devices
CN105447489B (zh) * 2015-11-13 2018-11-16 浙江传媒学院 一种图片ocr识别系统的字符与背景粘连噪声消除方法
US20170169572A1 (en) * 2015-12-15 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method and electronic device for panoramic video-based region identification
US11087272B2 (en) * 2016-03-29 2021-08-10 Bossa Nova Robotics Ip, Inc. System and method for locating, identifying and counting items
WO2018163699A1 (ja) * 2017-03-06 2018-09-13 株式会社Spiral 飛行体の制御システム、その制御装置および目印部
CN107729528A (zh) * 2017-10-30 2018-02-23 珠海市魅族科技有限公司 一种建筑物信息获取方法及装置、计算机装置和计算机可读存储介质
US10387554B1 (en) 2018-02-19 2019-08-20 International Business Machines Corporation Applying matching data transformation information based on a user's editing of data within a document
CN110297483B (zh) * 2018-03-21 2020-12-18 广州极飞科技有限公司 待作业区域边界获取方法、装置,作业航线规划方法
JP7120093B2 (ja) * 2019-03-15 2022-08-17 トヨタ自動車株式会社 部品判別装置及び部品判別方法
CN110377218B (zh) * 2019-06-26 2021-09-28 北京奇艺世纪科技有限公司 数据处理方法、装置、计算机设备和存储介质
US11774842B2 (en) 2019-08-16 2023-10-03 Bossa Nova Robotics Ip, Inc. Systems and methods for image capture and shelf content detection
US11107238B2 (en) * 2019-12-13 2021-08-31 Zebra Technologies Corporation Method, system and apparatus for detecting item facings
CN111080674B (zh) * 2019-12-18 2023-11-14 上海无线电设备研究所 一种基于混合高斯模型的多目标isar关键点提取方法
CN111583247B (zh) * 2020-05-12 2023-11-03 中南大学 一种图像二值化处理方法及装置
CN111598897B (zh) * 2020-05-13 2023-03-28 西安工程大学 基于Otsu和改进Bernsen的红外图像分割方法
CN116647644B (zh) * 2023-06-06 2024-02-20 上海优景智能科技股份有限公司 基于数字孪生技术的校园交互式监控方法以及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020126905A1 (en) * 2001-03-07 2002-09-12 Kabushiki Kaisha Toshiba Mathematical expression recognizing device, mathematical expression recognizing method, character recognizing device and character recognizing method
US20070076112A1 (en) * 2005-10-05 2007-04-05 Hitachi, Ltd. Stereo image-pickup apparatus
RU2346326C2 (ru) * 2007-03-01 2009-02-10 Виталий Семенович Титов Способ калибровки радиальной дисторсии оптической подсистемы системы технического зрения
RU2459251C2 (ru) * 2010-09-15 2012-08-20 Закрытое Акционерное Общество "Нанотехнология Мдт" Способ выделения локальных объектов на цифровых изображениях поверхности

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5767893A (en) * 1995-10-11 1998-06-16 International Business Machines Corporation Method and apparatus for content based downloading of video programs
JP3799861B2 (ja) * 1999-02-24 2006-07-19 株式会社日立製作所 画像合成装置、画像合成方法を実行させるプログラムが記録された記録媒体
CN100547603C (zh) * 2007-08-08 2009-10-07 华中科技大学 一种地面建筑物识别定位方法
JP5031617B2 (ja) * 2008-02-25 2012-09-19 パイオニア株式会社 関連領域特定装置及び方法、並びに画像認識装置及び方法
KR101661269B1 (ko) * 2008-09-02 2016-09-29 에꼴 뽈리떼끄닉 뻬데랄 드 로잔느 (으뻬에프엘) 휴대용 디바이스 상의 이미지 주석
US9195898B2 (en) * 2009-04-14 2015-11-24 Qualcomm Incorporated Systems and methods for image recognition using mobile devices
KR20110085728A (ko) * 2010-01-21 2011-07-27 삼성전자주식회사 휴대용 단말기에서 건물 영역을 인식하기 위한 장치 및 방법
CN102279929B (zh) * 2010-06-13 2013-03-27 中国科学院电子学研究所 一种基于对象语义树模型的遥感人造地物目标识别方法
JP5706647B2 (ja) * 2010-09-03 2015-04-22 キヤノン株式会社 情報処理装置、およびその処理方法
US9208548B1 (en) * 2013-05-06 2015-12-08 Amazon Technologies, Inc. Automatic image enhancement

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020126905A1 (en) * 2001-03-07 2002-09-12 Kabushiki Kaisha Toshiba Mathematical expression recognizing device, mathematical expression recognizing method, character recognizing device and character recognizing method
US20070076112A1 (en) * 2005-10-05 2007-04-05 Hitachi, Ltd. Stereo image-pickup apparatus
RU2346326C2 (ru) * 2007-03-01 2009-02-10 Виталий Семенович Титов Способ калибровки радиальной дисторсии оптической подсистемы системы технического зрения
RU2459251C2 (ru) * 2010-09-15 2012-08-20 Закрытое Акционерное Общество "Нанотехнология Мдт" Способ выделения локальных объектов на цифровых изображениях поверхности

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2746840C1 (ru) * 2020-09-08 2021-04-21 ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ КАЗЕННОЕ ВОЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "Военная академия Ракетных войск стратегического назначения имени Петра Великого" МИНИСТЕРСТВА ОБОРОНЫ РОССИЙСКОЙ ФЕДЕРАЦИИ Способ поиска и идентификации токсичных осколков разрушившегося в результате аварийных воздействий ядерно- и радиационно опасного объекта

Also Published As

Publication number Publication date
CN103679129A (zh) 2014-03-26
EP2899671A1 (en) 2015-07-29
JP2015532988A (ja) 2015-11-16
US20150248592A1 (en) 2015-09-03
RU2015111423A (ru) 2016-11-10
WO2014044158A1 (zh) 2014-03-27
EP2899671A4 (en) 2016-01-20
JP6240199B2 (ja) 2017-11-29

Similar Documents

Publication Publication Date Title
RU2637989C2 (ru) Способ и устройство для идентификации целевого объекта на изображении
US10896349B2 (en) Text detection method and apparatus, and storage medium
US10121095B2 (en) Method and device for recognizing subject area of image
RU2693906C2 (ru) Основанный на правилах анализ важности видео
CN105868758B (zh) 图像中文本区域检测方法、装置及电子设备
US8358837B2 (en) Apparatus and methods for detecting adult videos
US8873845B2 (en) Contextual dominant color name extraction
CN105184763B (zh) 图像处理方法和装置
CN106940799B (zh) 文本图像处理方法和装置
EP2506218B1 (en) Method, terminal, and computer-readable recording medium for trimming a piece of image content
CN111462183A (zh) 一种基于注意力机制双流网络的行为识别方法及系统
US20120163708A1 (en) Apparatus for and method of generating classifier for detecting specific object in image
WO2022089170A1 (zh) 字幕区域识别方法、装置、设备及存储介质
US20150042837A1 (en) Image acquiring method and electronic device
RU2014127535A (ru) Автоматизация анализа изображения
CN110460838B (zh) 一种镜头切换的检测方法、装置及计算机设备
CN108805116A (zh) 图像文本检测方法及其系统
CN112749696B (zh) 一种文本检测方法及装置
CN105260428A (zh) 图片处理方法和装置
CN108665769B (zh) 基于卷积神经网络的网络教学方法以及装置
KR101833943B1 (ko) 동영상의 주요 장면을 추출 및 탐색하는 방법 및 시스템
JP2012252691A (ja) 画像からテキスト筆画画像を抽出する方法及び装置
US9053383B2 (en) Recognizing apparatus and method, program, and recording medium
Qi et al. Cascaded cast shadow detection method in surveillance scenes
Selvaperumal et al. Haar wavelet transform based text extraction from complex videos