RU2563152C2 - Способ и устройство многоканального детектирования признаков изображения - Google Patents

Способ и устройство многоканального детектирования признаков изображения Download PDF

Info

Publication number
RU2563152C2
RU2563152C2 RU2012118502/08A RU2012118502A RU2563152C2 RU 2563152 C2 RU2563152 C2 RU 2563152C2 RU 2012118502/08 A RU2012118502/08 A RU 2012118502/08A RU 2012118502 A RU2012118502 A RU 2012118502A RU 2563152 C2 RU2563152 C2 RU 2563152C2
Authority
RU
Russia
Prior art keywords
image
color
channel
point
detector
Prior art date
Application number
RU2012118502/08A
Other languages
English (en)
Other versions
RU2012118502A (ru
Inventor
Павел Сергеевич Смирнов
Петр Константинович Семенов
Александр Николаевич Редкин
Дмитрий Анатольевич Гусев
Original Assignee
Интел Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Интел Корпорейшн filed Critical Интел Корпорейшн
Publication of RU2012118502A publication Critical patent/RU2012118502A/ru
Application granted granted Critical
Publication of RU2563152C2 publication Critical patent/RU2563152C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

Изобретение относится к устройствам и системам для машинного зрения, обнаружения признаков изображения, а также к приложениям и методике распознавания изображения. Технический результат заключается в снижении потерь информации об изображении за счет использования данных спектра полного изображения путем преобразования изображения в одноканальное представление на промежуточной стадии. Технический результат достигается за счет способа, который включает выполнение локального поиска локального оптимального цвета в локальном окружении многоканального изображения, проецирование локальным окружением многоканального изображения на одноканальное основание и применение одноканального детектора к этому спроецированному локальному окружению. 4 н.п. ф-лы, 18 ил.

Description

ОБЛАСТЬ ТЕХНИКИ
Раскрытая технология относится к схемам и системам и, более конкретно, к устройствам и системам для машинного зрения, обнаружения признаков изображения, а также к приложениям и методике распознавания изображения.
Мобильная дополненная реальность (MAR) является важной технологией для сегодняшних компьютеров, смартфонов, игровых консолей и домашних систем развлечения. Некоторые примеры приложений, которые основаны на MAR, включают сцены аннотирования (например, виртуальный туризм), идентификацию объектов (например, посещение магазина) и распознавание жестов, управляющих видеоиграми или телевидением. Процесс распознавания изображения обычно включает: (1) идентификацию признаков изображения или точек интереса и (2) сравнение этих признаков изображения из запроса или целевого изображения с признаками из базы данных изображений. Успешная реализация MAR обычно требует, чтобы ключевые признаки изображения были достоверно обнаружены при ряде условий, включая масштабирование изображения, поворот, смещение, изменения интенсивности и отображения шума.
Примеры точек интереса и признаков изображения включают следующее: края, блобы (например, области изображения, у которых нет никакой внутренней структуры), гребни (например, линейно расширяемые блобы), блобы пространства масштаба, углы, кресты и переходы областей, краев и гребней. Современные детекторы признаков используют инварианты уровня яркости или некоторые фотометрические инварианты, основанные на эмуляции человеческого зрения или некоторой цветовой модели, такой как гауссов подход или коэффициент Кубелки-Мунка, или другой фотометрический подход. Имеются случаи, где "изображение" является рядом каналов, который не может непосредственно представлять человеческий "цвет". Например, на фигуре 1 показаны полутоновые, цветные и спектрозональные (с условным отображением канала к цвету) изображения.
На фигуре 2 представлен пример спектрозонального изображение Аризонского лесного пожара из снимков усовершенствованного космического теплоэмиссионного и отражательного радиометра (АСТРА) в Галерее лаборатории реактивного движения. В этом примере изображения в RGB на левых полосах 3, 2, и 1 отображают растительность красным цветом. Большая темная область представляет горелый лес, и небольшие облака дыма видны на краях, где имеет место активное возгорание. Изображение справа заменяет полоса 8 коротковолнового инфракрасного излучения (SWIR) для полосы 3. Яркие красные пятна представляют активный огонь, который является видимым, потому что при длине волны SWIR имеется возможность проникновения света через дым.
Кроме того, в существующих системах, каналы могут быть отображены не только по интенсивности микроволнового канала, но и по каналу радара/лазерного локатора (например, с доплеровским сдвигом частоты) или по сверхзвуковому каналу дальномера или Z-датчиков различного типа. Например, на фигуре 3 показан пример карты глубины датчика Microsoft Kinect Z-sensor. Однако фотометрические подходы не годятся для типов каналов, обсужденных выше, потому что диапазон и значения распределения скорости существенно отличаются от распределения спектральной мощности видимого электромагнитного поля.
Например, современные методики, такие как SURF and SIFT, используют преобразование многоканального (например, цветного) входного изображения в одноканальный (например, полутоновый) входного изображения как необходимую предварительную стадию, теряя, таким образом, существенную информацию об изображении. Хотя некоторые современные методики пытаются использовать карту цветов изображения, такие методы не в состоянии использовать данные спектра полного изображения путем преобразования изображения в "специальное" одноканальное представление на некоторой промежуточной стадии, или попыткой локализовать признаки изображения некоторой глобальной мерой значения.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Варианты воплощения раскрытой технологии иллюстрируются посредством примера, без ограничения изобретения, на чертежах, на которых одинаковые цифровые позиции относятся к одинаковым элементам.
Фигура 1 - шкала полутонов, цветные и спектрозональные (с условным отображением канала к цвету) изображения.
Фигура 2 - пример спектрозональные изображение Аризонского лесного пожара, полученного из усовершенствованного космического теплоэмиссионного и отражательного радиометра (АСТРА) со снимка, представленного в Галерее лаборатории реактивного движения.
Фигура 3 - пример карты глубины датчика Microsoft Kinect Z-sensor.
На фигуре 4 показаны различные представления одноканального изображения, в котором расцвечивание полутонового изображения не дает дополнительной информации.
На фигуре 5 показано эквивалентное преобразование цветового пространства, в котором цвета поворачиваются на 11 16 π
Figure 00000001
вокруг RGB-вектора {5, -7, 3}.
Фигура 6 - пример теста Эйлера, в котором переход к полутонам уничтожает признаки изображения.
Фигура 7 - пример теста на дальтонизм.
Фигура 8 - детерминант, основанный на реакции и гессенского детектора для теста на дальтонизм, показанного на фигуре 7.
На фигуре 9 показан слабоинтенсивный блоб в некотором канале, расположенном в сильноинтенсивной седловой точке в другом канале.
На фигуре 10 показан отклик текущего, то есть существующего многоканального детектора для различных масштабов, в которых нет никакого отклика для блоба.
На фигуре 11 показан отклик одноканального детектора для различных масштабов, в которых классический детектор обнаруживает блоб крупного масштаба.
На фигуре 12 показан пример, демонстрирующий, как многоканальный детектор может получить преимущество по сравнению с одноканальным детектором.
На фигуре 13 показан отклик многоканального детектора на блоб в сцене седловой точки для различных масштабов, в которых блоб распознается в седловой точке.
На фигуре 14 показан цветной отклик многоканального детектора на тест на дальтонизм для различных масштабов.
На фигуре 15 показан пример выхода колоршифта для тестовых изображений, в которых не распознаются все блобы, и тест на дальтонизм не проводился.
На фигуре 16 показан пример цветного выхода детектора Харриса для тестовых изображений, в которых тест Эйлера не проводился.
На фигуре 17 показан пример усиленного цветного выхода детектора Харриса для тестовых изображений, в которых тест Эйлера также не проводился.
На фигуре 18 показан пример системы, в которой могут быть выполнены варианты воплощения раскрытой технологии.
ПОДРОБНОЕ ОПИСАНИЕ
Во многих известных алгоритмах машинного зрения для обнаружения признаков изображения используют яркость только определенной цветовой модели. Хотя во многих случаях эти способы могут быть эффективными, можно показать, что такие преобразования информации о полном изображении уменьшают эффективность обнаружения из-за вызванных этим способом ограничений.
Варианты воплощения раскрытой технологии включают реализацию формального подхода к конструкции многоканального детектора в точке интереса для произвольного числа каналов, независимо от природы данных с максимальными преимуществами, которые могут быть достигнуты при использовании информации от этих дополнительных каналов. Некоторые реализации могут быть упомянуты здесь как универсальный устойчивый многоканальный детектор признаков (GRoM), который основан на описанных здесь методиках и включает ряд иллюстративных примеров, чтобы выделить его отличие от существующих способов.
Преобразуя многоканальное изображение в одноканальное изображение, можно получить хорошие результаты в естественных изображениях. Однако здесь могут быть точки интереса, скрытые от такого детектора из-за присущего ему дальтонизма. Например, современные способы объединения компонентов цвета имеют тенденцию терять значительную часть информации от источника после изменения масштабов и смещений каналов в изображении. Применение раскрываемой здесь технологии помогает избежать таких недостатков, идентифицируя точки интереса, как в пространственных, так и в спектральных областях, и используя информацию от всех компонентов цвета. Это приводит к значительно более высокой производительности, особенно в синергетических тестах. Например, на фигуре 6 (обсуждаемой ниже) показана схема Эйлера-Венна, которая является тестом для обнаружения пересечений блоба. Такие подходы могут использоваться не только в визуальных изображениях с тремя каналами, но также и в изображениях большого размера, и в изображениях от произвольных источников, включая карты глубины, доплеровские сдвиги и плотность заселенности.
В дополнение к местоположению точек интереса блоба описанные здесь методики могут быть расширены для любого числа типов, например, таких как края и гребни. В таких случаях может быть применена соответствующая модификация к условию цветового подпространства.
Многоканальные особенности детектора точек интереса
А. Общие требования
В этом разделе определены общие требования для идеальных универсальных детекторов точки интереса и для многоканальных детекторов, особенно с целью расширения известных алгоритмов одноканального детектора.
(1) Тривиальное изображение
Для тривиального изображения (например, постоянного изображения), где величины изображения не зависят от пространственных координат, набор точек интереса, обнаруженных детектором φ, должен быть пустым:
∀(x,y):I(x,y)=const⇒φ(I)≡Ø
Тривиальные каналы могут быть легко удалены в многоканальном изображении, как в случае удаления неиспользованного (например, постоянного) α-канала в α-изображении RGB.
2) Контрастная инвариантность
Предположим, что нетривиальное изображение J является результатом равномерного масштабирования и преобразования смещения значений нетривиального изображения I:
∃c,k≠0: J(x,y)=kI(x,y)+c
Если детектор φ обнаруживает точки интереса Р в изображении I, тот же самый набор должен быть обнаружен в J:
∀c,k≠Q⇒φ(I)≡φ(c+kI)
3) Совместимость представлений одноканального изображения
Представим многоканальное изображение J={J1, J2 …, JN}, как карту нетривиального одноканального изображения каналов от 1 до N с его собственным однородным масштабированием, и сместим преобразование для каждого канала, где существует, по меньшей мере, один нетривиальный канал. Например, на фигуре 4 показаны различные представления одноканального изображения, в котором расцвечивание полутонового изображения не дает дополнительной информации.
Наборы точек интереса, найденных одноканальным детектором φ1 в изображении I и многоканальным детектором φN в многоканальном изображении J, то есть репликация изображения I, должны быть эквивалентными:
∀(i,x,y)∃ ki≠0: Ji(x,y)=ci+kiI(x,y)⇒φ1(I)≡φN(J)
Для данного представления изображения подобные детекторы должны привести к тому же результату без "фантомных" обнаружений в эквивалентном многоканальном изображении. Тесты детектора белого поля позволят проверять на дефекты такого типа. Эквивалентность одноканальных и многоканальных изображений с точки зрения детектора признаков позволит сократить количество линейно зависимых каналов.
4) Неисключительная инвариантность преобразования канала
Представим, что изображение J={J1, J2, …, JM} М-каналов является преобразованием изображения N-каналов I={I1, I2, …, В} к основе нового канала (например, "цвет"), используя матрицы преобразования канала KM,N=(ki,j) и вектор смещения канала cM=(ci):
( i = 1 M , x , y ) : J i ( x , y ) = c i + j = 1 N k i , j I j ( x , y )
Figure 00000002
Например, на фигуре 5 показано эквивалентное преобразование цветового пространства, в котором цвета поворачиваются на 11 16 π
Figure 00000003
вокруг RGB-вектора {5, -7, 3}.
Если показатель (КМ, N)=N и, таким образом, преобразование является обратимым, то наборы точек интереса, обнаруженных в изображениях I и J, должны быть эквивалентны:
rank(KM,N)=N⇒φN(I)≡φM(J)
Если М>N, то изображение J имеет линейно зависимые каналы. Для каждого изображения с линейно зависимыми каналами существует преобразование, которое формирует изображение с линейно-независимыми каналами (например, сокращение до линейно независимой основы каналов). Предположение, что объединение наборов точек интереса, обнаруженных одноканальным детектором во всех каналах, является надмножеством или эквивалентно множеству точек, обнаруженных многоканальным детектором, не является истиной, как это показано на следующем примере.
На фигуре 6 представлен пример схемы Эйлера-Венна, в которой переход к полутонам уничтожает признаки изображения. Детектор края может обнаружить все края в данном изображении. Объединение всех наборов краев каналов эквивалентно набору краев для полноцветного детектора. Но детекторы блоба канала могут найти эти точки интереса только в его "собственном" наборе канала и не может найти блобы во всех пересечениях и объединениях производных. Только "синергетический" детектор, который использует информацию от различных каналов, может обнаружить все такие точки интереса.
Хотя некоторое основанное на цвете преобразование может отобразить все подмножества (например, основной набор, пересечения и объединения) этой схемы к новому цветовому фону, где каждое подмножество "цвета" отображается в его собственном канале, объединение наборов точек интереса, обнаруженных одноканальными детекторами отдельно в каждом новом канале, в этом простом случае эквивалентно целому многоканальному набору точек интереса.
5) Преобразования к сокращенному основанию
Преобразование каналов с показателем (KM, N)<N не эквивалентно начальному изображению с точки зрения детектора. Начальное изображение может иметь точки интереса, которые могут быть найдены в каналах, которые являются ортогональными к новому основанию. Это может упоминаться как эффект "дальтонизма". На фигуре 7 показан пример теста на дальтонизм, а на фигуре 8 показан детерминант основанного на гессенском отклике детектора для теста на дальтонизм, показанного на фигуре 7. На фигуре 8 показано, что цветной узор не распознается в шкале полутонов.
6) Критерии фрагментации
Если изображение разделяется на фрагменты пространственной области, то объединение наборов обнаруженных фрагментов точек интереса должно быть подмножеством набора обнаруженных точек интереса целого изображения.
Фрагменты изображения могут использовать уникальные преобразования каналов, которые подчеркивают обнаружение точки интереса по сравнению с целым изображением. Если точка интереса находится в таком улучшенном фрагменте, то эта точка должна быть найдена также в целом изображении. Оценки детектора точки интереса (например, обнаружение улучшений) должны быть локальными в пространстве. Например, если флэш-память камеры используется для некоторого изображения, то контрастность, яркость и световой спектр отличались бы для дальних объектов и близких объектов. Соответственно, глобальная статистика канала в этом случае обычно не является достоверной.
В. Современные детекторы признаков изображения
Алгоритмы для обнаружения точки интереса обычно применяют свертку с доменным пространством ядер фильтра и затем анализируют полученные отклики как скалярные величины, вычисляя градиенты, операторы Лапласа или находя локальные максимальные величины.
Преобразование откликов цвета в скалярные величины для цветных изображений в детекторах может иметь множество недостатков, как объяснено ниже. Относительно теста на дальтонизм (см., например, фигуры 7 и 8 выше), шифт-детектора (например, используя разницу гауссиан или аппроксимацию LoG, вычисление лапласиан с гауссианами) и детектор движения (например, используя гессенский алгоритм) используют только скалярные величины. Цветное изображение преобразуется в шкалу полутонов до обработки изображения SIFT или SURF. Эти алгоритмы не могут обнаружить точки интереса в тестовых изображениях на дальтонизм, таких как показанные на фигурах 7 и 8.
Многоканальный детектор, основанный на позитивных правилах для определяющих гессенских значений, изменяет скалярные величины со скалярным продуктом векторов величин в каналах. Из-за использования дифференциальных операторов этот подход является инвариантным к постоянным компонентам в сигналах из различных каналов. Но он не является инвариантным к диапазону величин в каналах.
Чтобы продемонстрировать недостаток этого принципа, можно взять специальное цветное изображение, такое как слабоинтенсивный блоб в некотором канале, расположенном в сильноинтенсивной седловой точке в другом канале, как показано в примере на фигуре 9. На фигуре 9 показан слабый зеленый блоб и сильное асимметричное красное седло: два коррелированных признака изображения. Известный многоканальный детектор не может распознать эту функцию (например, слабый блоб), но его одноканальный аналог может. Для RGB-примера текущий детектор приводит к следующему выражению:
< ( L x , x R L x , x G L x , x B ) , ( L y , y R L y , y G L y , y B ) > < ( L x , y R L x , y G L x , y B ) , ( L x , y R L x , y G L x , y B ) > = 1 ( L x , x 1 L y , y 1 L x , y 1 L x , y 1 )
Figure 00000004
Это выражение имеет сильные компоненты Lx,у, которые соответствуют седловой точке. Они подавляют слабые положительные величины, соответствующие блобу, и результатом является отрицательная величина. Но детектор, основанный на гессенской детерминанте, ищет только положительные величины. Классический основанный на интенсивности одноканальный детектор может распознать эти признаки. Например, на фигуре 10 показан отклик текущего многоканального детектора для различных масштабов, в которых нет никакого отклика для блоба. на фигуре 11 показан отклик одноканального детектора для различных масштабов, в которых классический детектор обнаруживает блоб в крупном масштабе. Соответственно, этот многоканальный детектор ненадежен.
Другие современные детекторы вычисляют многоканальные гессенские компоненты независимо для каждого канала. При таком подходе к изображению применяются операции свертки, сопровождаемые производной Гауссова ядра. Из-за линейности этой операции это эквивалентно линейной комбинации каналов изображения. Следовательно, такой подход потенциально связан с дальтонизмом. Другими словами, существуют изображения, которые могут ухудшиться в постоянной области из-за этой линейной комбинации. Кроме того, для этих типов изображений должны быть линейные комбинации, которые позволяют распознавать потерянные признаки.
УНИВЕРСАЛЬНЫЙ УСТОЙЧИВЫЙ МНОГОКАНАЛЬНЫЙ (GRoM) ДЕТЕКТОР ПРИЗНАКОВ ИЗОБРАЖЕНИЯ
Возможные сдвиги сигнала требуют использования дифференциальных способов детектирования. Масштабирование сигналов, возможно с инверсией, ограничивает использование абсолютных порогов. Использование поиска локальных экстремальных значений является предпочтительным. Испытание слабого блоба, расположенного в сильном седле (см., например, фигуру 9 и приведенное выше описание), демонстрирует, что нет никакой универсальной цветовой модели, которая позволяет отличить такую точку интереса. Поэтому для каждой точки интереса должен быть выполнен локальный поиск (например, в соответствии с требованием (6) выше) в компонентах канала, чтобы найти оптимальный "цвет" для точки интереса. Задача многоканального обнаружения может быть сведена к следующему: поиск "локального оптимального цвета" (например, точное решение проблемы максимизации), преобразование локального окружения из многоканального изображения до одноканального основания, и применение одноканального детектора в локальном окружении.
"Цвет" относится к вектору, который определяет проекцию величин канала к одиночному каналу (например, преобразование в шкалу полутонов). Одноканальная функция отклика детектора определяет способ для оптимального (или "дифференциального" для приблизительного (субоптимального) решения поиска) выбора "цвета". Вычисление матрицы Гесса величин канала, связанных с Гауссовым ядром, которое было преобразовано в некоторый "лучший цвет блоба", собственные величины λ1 и λ2 такой матрицы Гесса Н для блоба должны быть оба положительными (или оба отрицательными, поскольку указатель направления не является существенным) и отношение разницы характеристического числа к сумме собственных величин (Tr(Н)), должно быть как можно меньше (например, наиболее симметричный блоб). Это отношение может быть эквивалентом эксцентриситета конической секции ∈ (например, по сравнению с "округлостью блоба" q = 4 D e t ( H ) T r ( H ) 2
Figure 00000005
).
Величина эксцентричности ∈ может помочь классифицировать текущую точку: блоб (∈<1), гребень (∈=1) или седловая точка (∈>1). Критерии обнаружения блоба в этой точке являются локальным максимумом лапласиан (Tr(Н)) многоканальных "цветных" проекций к выбранному "лучшему цветному" вектору. В некоторых вариантах воплощения алгоритм на основе GRoM для детектора блоба показан ниже как Алгоритм 1, где "лучшим цветом блоба" и является лапласиан, чьи компоненты без двоичных компонентов подавляются фактором эксцентриситета:
Алгоритм 1 - алгоритм GRoM
1. Вычислить "локальный" дифференциальный цвет
1.1. Вычислить тензор Гесса в точке (x0,y0):
H = ( L x , x ( x 0 , y 0 ) L x , y ( x 0 , y 0 ) L x , x ( x 0 , y 0 ) L x , y ( x 0 , y 0 ) )
Figure 00000006
1.2. Вычислить "лучший цвет блоба":
u = ( sgn ( L i ) Re det H i ) i = 0 n 1
Figure 00000007
где Hi и Li обозначает соответственно гессиан и лапласиан в некоторой точке (x, y), вычисленной только в канале i-th.
2. Тест для экстремальной точки в (x0,y0) (как максимальная проекция к u):
∀(xi,yi)∈neighborhood of(x0,y0):
〈u,Lx,x(x0,y0)+Ly,y(x0,y0)〉> 〈u,Lx,x(xi,yi)+Ly,y(xi,yi)〉
Возможности многоканального детектора, основанного на матрице Лапласа, могут быть продемонстрированы в синергетическом тесте. Многоканальное изображение имеет пересекающиеся блобы в различных каналах. Это пересечение создает новый признак в изображении. Можно преобразовать изображение из RGB в градации серого: например, 30% красного, 59% зеленого и 11% синего. Однако, как следует из схемы Эйлера-Венна на фигуре 6, такое преобразование приводит к потере большой части информации, и черный цвет кодирует 11% начальной интенсивности. Многоканальный детектор в состоянии распознать больше признаков изображения, чем одноканальный конкурент, как можно видеть из фигуры 12, например. Этот тест показывает, что если используется вырожденная матрица от начального цветового пространства до градации серого, то признаки одноканального детектора не будут распознаны в преобразованном изображении.
В противоположность этому, варианты воплощения раскрытой здесь технологии могут включать детектор, который в состоянии обнаружить все точки интереса в изображении на фигуре 6, например, так же как слабый блоб на фигуре 9 (см., например, фигуру 13). Такой детектор также успешно выдерживает тест на дальтонизм (см., например, отклики детектора, показанные на фигуре 14). Детектор признаков изображения GRoM, как описано здесь, не является "еще одним детектором цвета блоба", но, скорее способом разработки многоканального детектора. В некоторых вариантах воплощения детектор признаков изображения GRoM может использовать другой "лучший цветной" алгоритм поиска для максимизации отклика детектора Харриса-Стивенса R=Det(H)-k Tr(H), например.
Некоторые классические подходы к детектору признаков изображения включают определение признаков изображения как триплета (x, y, σ), где x и y являются пространственными координатами и σ является масштабом. Для этого триплета признаки, расположенные в (x, y), имеют максимальную величину значащей меры среди всех точек ее окружения Sσ (x, y). Значащая мера "скручивает" векторную информацию о цвете в скаляр. Кроме того, поскольку этой мерой является глобальная переменная, она не зависит от точки (x, y). Некоторые варианты воплощения раскрытой технологии могут включать определение признака изображения как тетраду (x, y, σ, v), где v является "локальным" цветом признака, расположенного в точке (x, y), причем v может быть выбран так, чтобы сделать меру, имеющую максимум в (x, y) наборе Sσ,v (x, y) и полутоновое окружение, Sσ,v (x, y), которое может быть выдано, когда оно проецирует цвета точек от Sσ (x, y) на v.
Классический бесцветный подход к проблеме должен определить признак изображения как точку, которая доминирует в ее полутоновом окружении, как некоторая скалярная мера. Тогда как последние подходы пытаются определить признак изображения как точку, которая доминирует в ее цветовом окружении, той же скалярной мерой, варианты воплощения раскрытой технологии могут включать определение признака изображения как точки, которая доминирует в ее цветовом окружении, спроецированную на ее "локальную" полутоновую плоскость в цветовом пространстве скалярной мерой. Определяя признак изображения таким образом, он становится "исходно" многоканальным (например, цветным), и соответствующий детектор признаков в состоянии использовать информацию о полном изображении и определить местоположение большего количества признаков изображения, чем современные детекторы.
НЕДОСТАТКИ ИЗВЕСТНЫХ ДЕТЕКТОРОВ ПРИЗНАКОВ ИЗОБРАЖЕНИЯ, КОТОРЫЕ УСТРАНЯЮТСЯ РАСКРЫТОЙ ТЕХНОЛОГИЕЙ
В отличие от известных цветных детекторов, таких как «колоршифт» и детекторы цвета Харриса, например, детектор признаков изображения GRoM в соответствии с раскрытой здесь технологией хорошо работает с тестовыми изображениями, такими как слабоинтенсивный блоб в сильноинтенсивном седле (см., например, фигуру 9), в схеме Эйлера-Венна (см., например, фигуру 6) и в тесте на дальтонизм (см., например, фигуру 7), как обсуждено выше.
Детектор колоршифт является детектором блобов. На фигуре 15, на который используется обозначение визуализации колоршифт для точек интереса, показан пример выхода колоршифт для тестовых изображений, в которых не распознаются все блобы, а тест на дальтонизм не проводился. Следовательно, детектор колоршифт не удовлетворяет ни одному из контрольных примеров.
Детектор цвета Харриса является угловым детектором. Есть два варианта детектора цвета Харриса: классический и усиленный. На фигуре 16 показан примерный выход детектора цвета Харриса для тестовых изображений, в которых не выполняется тест Эйлера. На фигуре 16 можно видеть, что хотя детектор может хорошо работать с седлом и в тесте на дальтонизмом благодаря угловому обнаружению блоба, он не работает со схемой Эйлера-Венна. Усиленный детектор цвета Харриса демонстрирует то же самое поведение и имеет те же недостатки, как это можно видеть на фигуре 17.
На фигуре 18 показан пример системы 1800, в которой могут быть выполнены варианты воплощения раскрытой технологии. Система 1800 может включать, без ограничения, вычислительное устройство, такое как ноутбук, мобильное устройство, такое как карманный или планшетный компьютер, или коммуникационное устройство, такое как смартфон. Система 1800 включает корпус 1802, дисплей 1804 в корпусе 1802, камера 1806 в корпусе 1802, процессор 1808 в корпусе 1802 и память 1810 в корпусе 1802. Процессор 1808 может включать видеопроцессор или другой тип процессора. Камера 1806 может обеспечить входное изображение, которое будет отправлено процессору 1808. Память 1810 может сохранять выходное изображение, которое поступает после обработки, выполняемой на входном изображении процессором 1808. Процессор 1808 может выполнить фактически любую комбинацию различных операций обработки описанных выше изображений.
Описанные здесь методики могут быть включены в различную аппаратную архитектуру. Например, варианты воплощения раскрытой технологии могут быть выполнены как одного или комбинации следующих технических решений: одного или нескольких микрокристаллов или интегральных схем, смонтированных на материнской плате, графического процессора и/или видеопроцессора, многоядерного процессора, жестко закодированной логики, программного обеспечения, сохраняемого запоминающим устройством и выполняемого микропроцессором, встроенного микропрограммного обеспечения, специализированной интегральной схемы (ASIC), и/или программируемого пользователем массива логических элементов (FPGA). Термин "логика", как он использующийся здесь, может включать, например, программное обеспечение, аппаратные средства или любую их комбинацию.
Хотя здесь были описаны и показаны на фигурах определенные варианты воплощения, обычные специалисты в данной области могут заменить определенные варианты воплощения, показанные и описанные здесь, большим разнообразием альтернативных и/или эквивалентных решений не выходя из объема вариантов воплощения раскрытой технологии. Настоящая заявка имеет целью покрыть любую адаптацию или изменения вариантов воплощения, иллюстрированных и описанных здесь. Поэтому предполагается, что варианты воплощения раскрытой технологии ограничиваются только следующими пунктами формулы изобретения и их эквивалентами.

Claims (4)

1. Способ определения признака изображения в изображении как тетрады (х, y, σ, v), в котором х и y - пространственные координаты, σ - масштаб, a v является локальным цветом признака изображения, расположенного в точке (х, y), которая имеет максимум значащей меры в каждой точке ее цветового окружения Sσ, v (х, y); и
определения полутонового окружения Sσ, v (х, y), основанного на том, как полутоновое окружение проецирует цвета точек от Sσ (х, y) на v.
2. Энергонезависимый машиночитаемый носитель, сохраняющий команды, которые при выполнении их процессором, инициируют процессор на выполнение следующих операций:
определения признака изображения в изображении как тетрады (х, y, σ, v), в котором х и y - пространственные координаты, σ - масштаб, a v является локальным цветом признака изображения, расположенного в точке (х, y), которая имеет максимум значащей меры в каждой точке ее цветового окружения Sσ, v (х, y); и
определения полутонового окружения Sσ, v (х, y), основанного на том, как полутоновое окружение проецирует цвета точек от Sσ (х, y) на v.
3. Устройство определения признака изображения, содержащее:
входной порт, сконфигурированный для получения изображения; и
видеопроцессор, сконфигурированный для:
определения признака изображения в изображении как тетрады (х, y, σ, v), в котором х и y - пространственные координаты, σ - масштаб, a v является локальным цветом признака изображения, расположенного в точке (х, y), которая имеет максимум значащей меры в каждой точке ее цветового окружения Sσ, v (х, y); и
определения полутонового окружения Sσ, v (х, y), основанного на том, как полутоновое окружение проецирует цвета точек от Sσ (х, y) на v.
4. Переносное вычислительное устройство для определения признака изображения, содержащее:
корпус;
дисплей, связанный с корпусом;
камеру, связанную с корпусом;
память, расположенную в указанном корпусе; и
процессор, установленный в корпусе и предназначенный для:
определения признака изображения в изображении как тетрады (х, y, σ, v), в котором х и y - пространственные координаты, σ - масштаб, a v является локальным цветом признака изображения, расположенным в точке (х, y), которая имеет максимум значащей меры в каждой точке ее цветового окружения Sσ, v (х, y);
определения полутонового окружения Sσ, v (х, y), основанного на том, как полутоновое окружение проецирует цвета точек от Sσ (х, y) на v;
инициирования дисплея на визуальное представление выходного изображения, полученного из определения; и
передачи выходного изображения в память.
RU2012118502/08A 2011-12-29 2011-12-29 Способ и устройство многоканального детектирования признаков изображения RU2563152C2 (ru)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/RU2011/001040 WO2013100779A1 (en) 2011-12-29 2011-12-29 Generalized robust multichannel feature detector

Publications (2)

Publication Number Publication Date
RU2012118502A RU2012118502A (ru) 2014-02-20
RU2563152C2 true RU2563152C2 (ru) 2015-09-20

Family

ID=48698076

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012118502/08A RU2563152C2 (ru) 2011-12-29 2011-12-29 Способ и устройство многоканального детектирования признаков изображения

Country Status (6)

Country Link
US (1) US20140219556A1 (ru)
JP (1) JP5710787B2 (ru)
KR (1) KR101435730B1 (ru)
CN (1) CN104303207B (ru)
RU (1) RU2563152C2 (ru)
WO (1) WO2013100779A1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2625940C1 (ru) * 2016-04-23 2017-07-19 Виталий Витальевич Аверьянов Способ воздействия на виртуальные объекты дополненной реальности

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3074925A1 (en) * 2013-11-28 2016-10-05 Intel Corporation Method for determining local differentiating color for image feature detectors
US20160253574A1 (en) 2013-11-28 2016-09-01 Pavel S. Smirnov Technologies for determining local differentiating color for image feature detectors
US9684831B2 (en) * 2015-02-18 2017-06-20 Qualcomm Incorporated Adaptive edge-like feature selection during object detection
JP6589381B2 (ja) * 2015-05-29 2019-10-16 三星ダイヤモンド工業株式会社 脆性材料基板における垂直クラックの形成方法および脆性材料基板の分断方法
US9551579B1 (en) * 2015-08-07 2017-01-24 Google Inc. Automatic connection of images using visual features

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6176521B1 (en) * 1998-01-16 2001-01-23 Robert J. Mancuso Variable color print with locally colored regions and method of making same
US6449389B1 (en) * 1999-09-24 2002-09-10 Xerox Corporation Method and apparatus for single channel color image segmentation using local context based adaptive weighting
RU2332716C2 (ru) * 2006-08-29 2008-08-27 Самсунг Электроникс Ко., Лтд. Способ и устройство анизотропной фильтрации динамического видеоизображения

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7050606B2 (en) * 1999-08-10 2006-05-23 Cybernet Systems Corporation Tracking and gesture recognition system particularly suited to vehicular control applications
US7085409B2 (en) * 2000-10-18 2006-08-01 Sarnoff Corporation Method and apparatus for synthesizing new video and/or still imagery from a collection of real video and/or still imagery
WO2002086416A2 (en) * 2001-04-25 2002-10-31 Amnis Corporation Method and apparatus for correcting crosstalk and spatial resolution for multichannel imaging
US6862366B2 (en) * 2001-09-13 2005-03-01 Seiko Epson Corporation Techniques for scratch and date removal from scanned film
JP2003130811A (ja) * 2001-10-25 2003-05-08 Dainippon Screen Mfg Co Ltd 波長選択機能を利用した検査対象物の検査
RU2385492C2 (ru) * 2004-03-12 2010-03-27 Инджениа Текнолоджи Лимитед Способы, изделия и устройства для проверки подлинности
JP5047005B2 (ja) * 2008-02-29 2012-10-10 キヤノン株式会社 画像処理方法、パターン検出方法、パターン認識方法及び画像処理装置
JP5077088B2 (ja) * 2008-06-17 2012-11-21 住友電気工業株式会社 画像処理装置及び画像処理方法
US8755608B2 (en) * 2009-07-23 2014-06-17 Nec Corporation Marker generation device, marker generation detection system, marker generation detection device, marker, marker generation method, and program therefor
JP2011028420A (ja) * 2009-07-23 2011-02-10 Nec Corp マーカ生成装置、マーカ生成検出システム、マーカ生成検出装置、マーカ、マーカ生成方法及びプログラム
US8311338B2 (en) * 2009-09-15 2012-11-13 Tandent Vision Science, Inc. Method and system for learning a same-material constraint in an image
JP4990960B2 (ja) * 2009-12-24 2012-08-01 エヌ・ティ・ティ・コムウェア株式会社 物体識別装置、物体識別方法、および物体識別プログラム
WO2011100511A2 (en) * 2010-02-11 2011-08-18 University Of Michigan Methods for microcalification detection of breast cancer on digital tomosynthesis mammograms
US8606050B2 (en) * 2011-06-16 2013-12-10 Tandent Vision Science, Inc. Method for processing multiple images of a same scene

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6176521B1 (en) * 1998-01-16 2001-01-23 Robert J. Mancuso Variable color print with locally colored regions and method of making same
US6449389B1 (en) * 1999-09-24 2002-09-10 Xerox Corporation Method and apparatus for single channel color image segmentation using local context based adaptive weighting
RU2332716C2 (ru) * 2006-08-29 2008-08-27 Самсунг Электроникс Ко., Лтд. Способ и устройство анизотропной фильтрации динамического видеоизображения

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2625940C1 (ru) * 2016-04-23 2017-07-19 Виталий Витальевич Аверьянов Способ воздействия на виртуальные объекты дополненной реальности

Also Published As

Publication number Publication date
US20140219556A1 (en) 2014-08-07
CN104303207A (zh) 2015-01-21
AU2011383562A1 (en) 2013-07-11
JP2014507722A (ja) 2014-03-27
RU2012118502A (ru) 2014-02-20
KR20130086275A (ko) 2013-08-01
CN104303207B (zh) 2018-02-16
JP5710787B2 (ja) 2015-04-30
WO2013100779A1 (en) 2013-07-04
KR101435730B1 (ko) 2014-09-01

Similar Documents

Publication Publication Date Title
RU2563152C2 (ru) Способ и устройство многоканального детектирования признаков изображения
Lin et al. Line segment extraction for large scale unorganized point clouds
US9111355B1 (en) Selective color processing for vision systems that enables optimal detection and recognition
US9147255B1 (en) Rapid object detection by combining structural information from image segmentation with bio-inspired attentional mechanisms
KR102559202B1 (ko) 3d 렌더링 방법 및 장치
US20080317331A1 (en) Recognizing Hand Poses and/or Object Classes
US20150379371A1 (en) Object Detection Utilizing Geometric Information Fused With Image Data
US20120275701A1 (en) Identifying high saliency regions in digital images
US20170013195A1 (en) Wearable information system having at least one camera
JP2008257649A (ja) 画像認識装置
US20160371850A1 (en) Method and Apparatus for Detecting Targets
US9727785B2 (en) Method and apparatus for tracking targets
Lukoyanov et al. Modification of YAPE keypoint detection algorithm for wide local contrast range images
Wang et al. Combining semantic scene priors and haze removal for single image depth estimation
KR20160068186A (ko) 증강 현실 컨텐츠 제공 장치 및 방법
Lou et al. Smoke root detection from video sequences based on multi-feature fusion
EP3044734B1 (en) Isotropic feature matching
Yilmaz et al. Detection and localization of specular surfaces using image motion cues
Mu et al. Finding autofocus region in low contrast surveillance images using CNN-based saliency algorithm
KR20170103201A (ko) 정보표시를 위한 핵심선 추출 장치 및 방법
AU2011383562B2 (en) Generalized robust multichannel feature detector
CN114495058A (zh) 交通标志检测方法和装置
Zhang et al. Augmented visual feature modeling for matching in low-visibility based on cycle-labeling of Superpixel Flow
Liu et al. River detection using LBP and morphology in infrared image
KR101643550B1 (ko) 비선형 공간에서 고속 선명도 확산 방법을 이용하여 색상불변 특성을 검출하고 표현하는 시스템 및 그 방법

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20171230