RU2225034C2 - Способ и устройство, компьютерная программа, компьютерная система и считываемая компьютером память для представления и поиска объекта в изображении - Google Patents

Способ и устройство, компьютерная программа, компьютерная система и считываемая компьютером память для представления и поиска объекта в изображении Download PDF

Info

Publication number
RU2225034C2
RU2225034C2 RU2001109352/09A RU2001109352A RU2225034C2 RU 2225034 C2 RU2225034 C2 RU 2225034C2 RU 2001109352/09 A RU2001109352/09 A RU 2001109352/09A RU 2001109352 A RU2001109352 A RU 2001109352A RU 2225034 C2 RU2225034 C2 RU 2225034C2
Authority
RU
Russia
Prior art keywords
contour
image
representation
peaks
curvature
Prior art date
Application number
RU2001109352/09A
Other languages
English (en)
Other versions
RU2001109352A (ru
Inventor
Мирослав З. БОБЕР (GB)
Мирослав З. БОБЕР
Original Assignee
Мицубиси Денки Кабусики Кайся
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Мицубиси Денки Кабусики Кайся filed Critical Мицубиси Денки Кабусики Кайся
Publication of RU2001109352A publication Critical patent/RU2001109352A/ru
Application granted granted Critical
Publication of RU2225034C2 publication Critical patent/RU2225034C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Television Systems (AREA)
  • Picture Signal Circuits (AREA)

Abstract

Изобретение относится к представлению объекта, появляющегося в видеоизображении. Его использование для поиска объекта в изображении, хранящемся в мультимедийной базе данных, позволяет обеспечить технический результат в виде снижения сложности процедуры поиска и отождествления объекта. Этот технический результат достигается в способе представления объекта, появляющегося в изображении, путем обработки сигналов, соответствующих изображению, в котором на основе упомянутых сигналов получают множество значений координат для пиков контура объекта в масштабируемом пространстве кривизны и применяют масштабирующее или нелинейное преобразование к значениям координат, чтобы получить представление контура. При поиске вводят запрос в виде двумерного контура, получают представление этого контура, а затем и представление объекта в хранимых изображениях с использованием способа представления объекта, появляющегося в изображении, сравнивают это представление в виде запроса с каждым представлением для хранимого объекта, выбирают и отображают на дисплее по меньшей мере один результат, соответствующий изображению, содержащему объект, для которого сравнение указывает степень подобия между объектом в виде запроса и объектом. 4 с. и 13 з.п. ф-лы, 2 табл., 8 ил.

Description

Область техники, к которой относится изобретение
Изобретение относится к представлению объекта, появляющегося в неподвижном изображении или видеоизображении, таком как изображение, хранимое в мультимедийной базе данных, в частности, в целях поиска, и к способу и устройству для поиска объекта с использованием такого представления.
Уровень техники
В таких приложениях, как библиотеки изображений или видеотеки, желательно иметь эффективное представление и хранение контура или профиля объектов или частей объектов, появляющихся в неподвижных изображениях или видеоизображениях. В известном способе индексации и поиска на основе профиля используют представление в масштабированном пространстве кривизны (МПК-представление). Подробности МПК-представления можно найти в статьях "Робастное и эффективное индексирование профиля посредством масштабированного пространства кривизны" в сборнике "Труды Британской конференции по машинному зрению" ("Robust and Efficient Shape Indexing through Curvature Scale Space" Proc. British Machine Vision conference, c. 53-62, Эдинбург, Соединенное Королевство, 1966), и "Индексирование базы данных по составу профилей с использованием масштабированного пространства кривизны" в сборнике "Труды Коллоквиума Института инженеров-электриков по интеллектуальным базам данных" ("Indexing an Image Database by Shape Content using Curvature Scale Space" Proc. IEE Colloquium on Intelligent Databases, Лондон, 1966), причем авторами обеих статей являются Ф.Мохтарян, С.Аббаси и Дж.Киттлер (F. Mokhtarian, S.Abbasi and J.Kittler), а их библиографические данные упоминаются здесь в качестве ссылки.
В МПК-представлении используется функция кривизны для контура объекта, начиная с произвольной точки контура. Функцию кривизны исследуют по мере развертки профиля контура посредством ряда деформаций, которые сглаживают профиль. Более конкретно, вычисляют переходы через нуль производной функции кривизны, свернутой с семейством Гауссовских фильтров. Эти переходы через нуль отображают точками на графике, известном как масштабированное пространство кривизны, где ось x представляет нормализованную длину дуги кривой, а ось y - параметр развертки, в частности параметр применяемого фильтра. Точки на графике образуют петли, являющиеся характеристическими для контура. Каждая выпуклая или вогнутая часть контура объекта соответствует некоторой петле в изображении в МПК (МПК-изображении). Координаты пиков наиболее выпуклых петель в МПК-изображении используются в качестве представления контура.
Для поиска объектов в изображениях, хранимых в базе данных и отождествляемых с вводимым объектом, вычисляют МПК-представление вводимого профиля. Подобие между вводимым профилем и хранимыми профилями определяется путем сравнения положения и высоты пиков в соответствующих МПК-изображениях с использованием алгоритма отождествления.
При использовании известного МПК-представления проблема заключается в том, что пики для некоторого заданного контура основаны на функции кривизны, вычисление которой начинают с произвольной точки на контуре. Если начальная точка изменяется, то происходит циклический сдвиг вдоль оси x пиков в МПК-изображении. Так, при вычислении меры подобия нужно исследовать все возможные сдвиги или, по меньшей мере, наиболее вероятный сдвиг. Это приводит к повышенной сложности процедуры поиска и отождествления.
Поэтому в настоящем изобретении предложен способ представления объекта, появляющегося в неподвижном изображении или видеоизображении, путем обработки сигналов, соответствующих упомянутому изображению, заключающийся в том, что получают множество числовых значений, связанных с особенностями, появляющимися на контуре объекта, начиная со случайной точки на контуре, и применяют предварительно определенное упорядочение к упомянутым значениям, чтобы прийти к представлению контура. Упомянутые значения предпочтительно получают из МПК-представления упомянутого контура и они предпочтительно соответствуют значениям пиков в МПК (МПК-пиков).
Обнаружено, что путем применения преобразования, в частности, в значения в МПК (МПК-значения), как это сделано в настоящем изобретении, улучшается рабочая характеристика поиска объекта.
Сущность изобретения
Одним объектом изобретения является способ представления объекта, появляющегося в неподвижном изображении или видеоизображении, путем обработки сигналов, соответствующих изображению, заключающийся в том, что получают множество числовых значений, представляющих особенности, появляющиеся на контуре объекта, и применяют масштабирующее или нелинейное преобразование к упомянутым значениям, чтобы прийти к представлению контура.
В способе согласно одному объекту изобретения числовые значения отражают точки перегиба на контуре.
Заявленный способ заключается в том, что получают представление контура в масштабированном пространстве кривизны путем многоэтапного сглаживания контура с использованием параметра сглаживания, приводящего к множеству кривых контура, используют значения для особых точек на каждой кривой контура для получения кривых, характеристических для исходного контура, и выбирают координаты пиков упомянутых характеристических кривых, при этом упомянутое преобразование применяют к значениям координат пиков.
В заявленном способе особые точки могут быть связаны с кривизной каждой кривой контура.
Особые точки могут быть также связаны с максимумами и минимумами кривизны кривых контура.
Другим объектом изобретения является способ представления объекта, появляющегося в неподвижном или видеоизображении, путем обработки сигналов, соответствующих изображению, заключающийся в том, что получают представление контура объекта в масштабированном пространстве кривизны (МПК), выбирают координаты для пиков в этом масштабированном пространстве кривизны и применяют нетривиальное преобразование к значениям координат пиков, чтобы прийти к представлению контура объекта.
Согласно способу по второму объекту изобретения преобразование применяют к значениям координат, соответствующим параметру сглаживания в МПК-представлении.
Преобразование могут применять к значениям координат, соответствующим параметру длины дуги вдоль контура.
Преобразование может являться масштабирующим преобразованием.
Преобразование может также являться нелинейным преобразованием.
Преобразование могут осуществлять в виде z'=a•pow(z, b)+с, где a, b и с - константы и pow(z, b) обозначает z в степени b;
b может быть больше нуля и меньше 1;
b может находиться в диапазоне 0,25≤b≤0,75;
b может быть равен 0,5.
Еще одним объектом изобретения является способ поиска объекта в неподвижном изображении или видеоизображении путем обработки сигналов, соответствующих изображениям, заключающийся в том, что вводят запрос в виде двухмерного контура, получают описатель упомянутого контура с использованием упомянутых способов, получают описатель объектов в хранимых изображениях с использованием упомянутых способов, сравнивают упомянутый описатель в виде запроса с каждым описателем для хранимого объекта, выбирают и отображают на дисплее, по меньшей мере, один результат, соответствующий изображению, содержащему объект, для которого сравнение указывает некоторую степень подобия между объектом в виде запроса и упомянутым объектом.
Еще одним объектом изобретения является компьютерная система, которая запрограммирована для работы в соответствии с вышеупомянутыми способами.
Считываемый компьютером носитель информации хранит выполняемые компьютером этапы процесса осуществления вышеупомянутых способов.
Краткое описание чертежей
Фиг.1 изображает блок-схему базы видеоданных,
фиг.2 изображает чертеж контура объекта,
фиг.3 изображает МПК-представление контура, показанного на фиг.2,
фиг.4 изображает рисунок, иллюстрирующий представление профиля,
фиг.5 изображает чертеж профиля объекта,
фиг.6 изображает МПК-представление профиля, показанного на фиг.5,
фиг. 7 изображает преобразованное представление профиля, показанного на фиг.5,
фиг.8 изображает блок-схему, иллюстрирующую способ поиска.
Наилучший способ осуществления изобретения
Первый конкретный вариант осуществления
Фиг. 1 изображает компьютеризованную систему базы видеоданных в соответствии с конкретным вариантом осуществления изобретения. Система включает в себя блок 2 управления в виде компьютера, дисплей 4 в виде монитора, указательное устройство 6 в виде мыши, базу 8 данных изображений, включающую в себя хранимые неподвижные изображения и видеоизображения, и базу 10 данных описателей, хранящую описатели объектов или частей объектов, появляющихся в изображениях, хранимых в базе 8 данных изображений.
Описатель для профиля каждого интересующего объекта, появляющегося в изображении в базе данных изображений, создается блоком 2 управления и хранится в базе 10 данных описателей. Блок 2 управления получает описатели, работая под управлением подходящей программы, осуществляющей способ, описанный ниже.
Прежде всего, для заданного контура объекта получают МПК-представление. Это делают с использованием известного способа, описанного в одной из вышеупомянутых статей.
Более конкретно, контур выражают представлением Ψ=((х(u), y(u), u∈[0, 1] }, где u - параметр нормализованной длины дуги.
Контур сглаживают путем свертки Ψ с идентифицирующим Гауссовым ядром g(u, σ), а переходы через нуль кривизны развертывающей кривой проверяют при изменениях σ. Переходы через нуль идентифицируют, пользуясь следующим выражением для кривизны:
Figure 00000002

где
X(u, σ) = x(u, σ)*g(u, σ),
Y(u, σ) = y(u, σ)*g(u, σ),
и
Xu(u, σ) = x(u, σ)*gu(u, σ),
Xuu(u, σ) = x(u, σ)*guu(u, σ).
Здесь * обозначает свертку, а подстрочные индексы обозначают производные.
Число переходов через нуль кривизны изменяется с изменением σ, и если σ достаточно велико, то Ψ является выпуклой кривой без переходов через нуль.
Точки переходов через нуль отображают в виде точек на графике, известном как пространство изображений в МПК (МПК-изображений). Это приводит к множеству характеристических кривых. Пики характеристических кривых идентифицируют, а соответствующие координаты выделяют и сохраняют. Вообще говоря, это дает набор из n пар координат: [(х1, y1), (х2, y2),...,(хn, yn)], где n - число пиков, a xi - положение длины дуги i-го пика и yi - высота этого пика.
В этом конкретном варианте осуществления используют биномиальный фильтр с коэффициентами (1/4, 1/2, 1/4) в качестве приближения Гауссовского фильтра, достигая некоторого уменьшения сложности вычислений. Уменьшение сложности вычислений является результатом удобных коэффициентов фильтра, которые можно эффективно реализовать в процессоре цифровых сигналов или процессоре общего назначения.
Затем подвергают дополнительной обработке значения пиков или, иными словами, значения составляющей y для пиков. Более конкретно, значения y преобразуют, пользуясь таким преобразованием:
y'=a•pow(y,b)+c, (1)
где pow(y, b) обозначает y в степени b.
Это приводит к новому набору значений пиков: [(х'1, y'1), (х'2, y'2),... , (x'n, y'n)] , сохраняемых в базе данных описателей в качестве описателя контура.
В качестве конкретного примера отметим, что контур, показанный на фиг.2, приводит к МПК-изображению, показанному на фиг.3. Подробные значения координат пиков кривых в МПК-изображении приведены в табл. 1.
Затем применяют преобразование, заданное выше, при а=6, b=0,5 и с=0. Иными словами, извлекают корень квадратный из исходного значения у и умножают его на константу. Это приводит к значениям, приведенным в табл.2.
Здесь значения округлены до ближайшего целого числа, но можно использовать и другие округления.
Второй конкретный вариант осуществления
Другой пример изображен на фиг.4.
Фиг. 5 изображает еще один пример профиля объекта, в этом случае - черепахи. Фиг. 6 изображает МПК-пики для профиля, показанного на фиг.5. Фиг.7 изображает пики, показанные на фиг.6 и преобразованные с использованием преобразования, заданного в уравнении (1), приведенном выше, при а=6,5, b=0,5 и с=0.
В целях поиска используют сохраняемые описатели. Пользователь инициирует поиск, делая чертеж контура объекта на дисплее с использованием указательного устройства (этап 510). После этого блок 2 управления создает МПК-представление вводимого контура (этап 520), а затем применяет вышеописанное преобразование к значениям y (этап 530). После этого получаемый описатель вводимого контура сравнивают с каждым сохраненным описателем в базе данных описателей, именуемых ниже описателями модели, с использованием известной процедуры отождествления (этап 540).
Сравнение для отождествления осуществляют с использованием подходящего алгоритма, что приводит к получению меры подобия для каждого описателя в базе данных. Можно использовать известный алгоритм отождествления, такой как описанный в вышеупомянутых статьях. Такая процедура отождествления кратко описана ниже.
Задаваясь двумя профилями замкнутого контура: кривой Ψi изображения и кривой Ψm модели и соответствующими им наборами пиков: [(xi1, yi1), (xi2, yi2), ..., (xin, yin)] и [(xm1, ym1), (xm2, ym2),..., (xmn, ymn)], вычисляют меру подобия. Меру подобия определяют как суммарную стоимость отождествления пиков в модели с пиками в изображении. Отождествление, которое минимизирует общую стоимость, определяют с использованием динамического программирования. Алгоритм обеспечивает рекурсивное отождествление пиков из модели с пиками из изображения и вычисление стоимости каждого такого отождествления. Каждый пик модели может быть отождествлен только с одним пиком изображения, а каждый пик изображения может быть отождествлен только с одним пиком модели. Какой-либо пик модели и/или изображения может остаться неотождествленным, и для каждого неотождествленного пика имеется дополнительная штрафная стоимость. Два пика можно отождествить, если горизонтальное расстояние между ними меньше 0,2. Стоимость отождествления - это длина прямой линии между этими двумя отождествленными пиками. Стоимостью неотождествленного пика является его высота.
Если говорить подробнее, то алгоритм работает, создавая и расширяя некоторую древовидную структуру, в которой узлы соответствуют отождествленным пикам:
1. Создают начальный узел, состоящий из наибольшего максимума изображения (xik, yik) и наибольшего максимума модели (xir, yir).
2. Для каждого остающегося пика модели, который находится в пределах 80 процентов от наибольшего максимума пиков изображения, создают дополнительный начальный узел.
3. Инициализируют стоимость каждого начального узла, созданного на этапах 1 и 2, полагая ее равной абсолютной разности координаты y пиков изображения и модели, связанных этим узлом.
4. Для каждого начального узла, о котором шла речь на этапе 3, вычисляют параметр альфа-сдвига в МПК (МПК-сдвига), определяемый как разность пиков модели и изображения, отождествленных в этом начальном узле. Параметр сдвига будет разным для каждого узла.
5. Для каждого начального узла создают список узлов модели и список узлов изображения. Список содержит информацию о том, какие пики еще нужно отождествить. Для каждого начального узла отмечают пики, отождествленные в этом узле как "отождествленные", а все остальные пики - как "неотождествленные".
6. Рекурсивно расширяют узел с самой низкой стоимостью (начиная от каждого узла, созданного на этапах 1-6, и следуют по порожденным им узлам) до тех пор, пока не будет удовлетворено условие, указанное на этапе 8. Для расширения узла используют следующую процедуру.
7. Расширение узла.
Если, по меньшей мере, один пик изображения и один пик модели остались неотождествленными, то поступают следующим образом.
Выбирают неотождествленный максимум (xip, yip) в МПК (МПК-максимум) кривой изображения в наибольшем масштабе. Применяют параметр сдвига начального узла (вычисленный на этапе 4) для преобразования выбранного максимума в изображение модели в МПК (МПК-изображение модели) и теперь выбранный пик имеет координаты (xip-альфа, yip). Устанавливают местонахождение (xms, yms) ближайшего пика кривой модели, который не отождествлен. Если горизонтальное расстояние между этими двумя пиками меньше 0,2 (т.е. |xip-альфа|<0,2), то отождествляют эти два пика и определяют стоимость отождествления как длину прямой линии между этими двумя пиками. Прибавляют стоимость согласования к суммарной стоимости такого узла. Удаляют отождествленные пики из соответствующих списков, отмечая их как "отождествленные". Если горизонтальное расстояние между этими двумя пиками больше 0,2, то пик (xip, yip) модели отождествить нельзя. В этом случае прибавляют его высоту yip к суммарной стоимости и удаляют только пик (xip, yip) из списка пиков изображения, отмечая его как "отождествленный".
В противном случае (если остались неотождествленными только пики изображения или только пики модели) поступают следующим образом.
Определяют стоимость отождествления как высоту наивысшего неотождествленного пика изображения или модели и удаляют этот пик из списка.
8. Если после расширения узла на этапе 7 не остается неотождествленных пиков в обоих списках - изображения и модели, то завершают процедуру отождествления. Стоимость того узла является мерой подобия между кривыми изображения и модели. В противном случае переходят к этапу 7 и расширяют узел с самой низкой стоимостью.
Вышеуказанную процедуру повторяют, подставляя пики кривой изображения и пики кривой модели. Окончательное значение отождествления меньше двух.
В качестве еще одного примера отметим, что для каждого положения при упорядочении вычисляют расстояние между вводимым значением x и соответствующим значением x модели и расстояние между вводимым значением y и соответствующим значением y модели. Вычисляют суммарное расстояние по всем положениям, и чем меньше суммарное расстояние, тем точнее отождествление. Если числа пиков для вводимого профиля и модели различны, высота пика для остатков включается в суммарное расстояние.
Вышеупомянутые этапы повторяют для каждой модели в базе данных (этап 480).
Меры подобия, получаемые в результате сравнений при отождествлении, упорядочивают (этап 490), а затем объекты, соответствующие описателям, имеющим меры подобия, указывающие самое точное отождествление (т.е. в данном случае - наименьшие меры подобия), отображают для пользователя на дисплее 4 (этап 500). Число объектов, подлежащих отображению, может быть предварительно установлено или выбрано пользователем.
Третий конкретный вариант осуществления
Теперь будет описан альтернативный конкретный вариант осуществления. Этот конкретный вариант осуществления является таким же, как предыдущий конкретный вариант осуществления, за исключением того, что используется другое преобразование. Более конкретно, значения y преобразуются с использованием преобразования y'=а0+a1y.
Иными словами, применяется линейное масштабирующее преобразование.
Здесь а0=41, a1=0,19.
В одной вариации а0=0, a1=0,27.
Можно использовать и другие значения а0 и а1, если они подходят.
Процедура поиска и отождествления является, по существу, такой же, как описанная в предыдущем конкретном варианте осуществления.
Обнаружено, что применение некоторого преобразования, в частности линейного преобразования, обусловливающего масштабирование, или нелинейного преобразования, описанного выше, приводит к описателю, который менее чувствителен, например, к изменениям контура профиля в пределах некоторого класса объектов, вследствие чего обеспечивается улучшенный поиск с выборкой объектов.
В вышеописанных конкретных вариантах осуществления преобразование применяется к значениям в МПК (МПК-значениям) перед сохранением их в базе 10 данных описателей. В альтернативном варианте МПК-значения можно хранить в базе 10 данных, а преобразование осуществлять как часть процесса поиска перед осуществлением процедуры отождествления.
В вышеописанных конкретных вариантах осуществления преобразования применялись к значениям координаты y. Однако их можно применять к значениям координаты х.
Промышленная применимость
Система, соответствующая изобретению, может быть предусмотрена, например, в библиотеке изображений. В альтернативном варианте базы данных можно размещать вдали от блока управления с помощью временного канала связи, такого, как телефонная линия, или с помощью сети, такой как Интернет. Базы данных изображений и описателей могут быть предусмотрены, например, в постоянном запоминающем устройстве или на портативных носителях информации данных, таких как неперезаписываемые компакт-диски или цифровые видеодиски.
Составные части системы могут быть предусмотрены в виде программного обеспечения или аппаратного обеспечения. Хотя изобретение описано применительно к компьютерной системе, его можно реализовать и в других формах, например с использованием специализированной микросхемы (специализированного чипа).
В описании приведены конкретные примеры способов представления двухмерного профиля объекта с использованием МПК-представления, а также способов вычисления значений, представляющих подобия между двумя профилями, но можно использовать любые подходящие такие способы.
Изобретение также можно применять для отождествления изображений или объектов в целях верификации или для фильтрации.

Claims (17)

1. Способ представления объекта, появляющегося в изображении, путем обработки сигналов, соответствующих изображению, заключающийся в том, что на основе упомянутых сигналов получают множество значений координат для пиков контура объекта в масштабируемом пространстве кривизны и применяют масштабирующее или нелинейное преобразование к упомянутым значениям координат, чтобы получить представление контура.
2. Способ по п.1, в котором упомянутые числовые значения, по существу, инвариантны к масштабу контура.
3. Способ по п.1 или 2, в котором число упомянутых числовых значений зависит от профиля контура.
4. Способ по любому предыдущему пункту, в котором масштабирующее или нелинейное преобразование не зависит от профиля контура.
5. Способ по любому предыдущему пункту, в котором числовые значения отражают точки перегиба на контуре.
6. Способ по любому предыдущему пункту, заключающийся в том, что получают представление контура в масштабированном пространстве кривизны путем многоэтапного сглаживания контура с использованием параметра сглаживания, приводящего к множеству кривых контура, используют значения для особых точек на каждой кривой контура для получения кривых, характеристических для исходного контура, и выбирают координаты пиков упомянутых характеристических кривых, при этом упомянутое преобразование применяют к значениям координат пиков.
7. Способ по п.6, в котором особые точки связаны с кривизной каждой кривой контура.
8. Способ по п.7, в котором особые точки связаны с максимумами и минимумами кривизны кривых контура.
9. Способ по любому из пп.1-8, в котором преобразование осуществляют в виде z'=a*pow(z, b) + с, где a, b и с - константы, и pow(z, b) обозначает z в степени b.
10. Способ по п.9, в котором b больше нуля и меньше 1.
11. Способ по п.10, в котором b находится в диапазоне 0,25≤b≤0,75.
12. Способ по п.11, в котором b=0,5.
13. Способ по п.11, в котором b=0,6.
14. Способ по п.1, в котором преобразование применяют к значениям координат, соответствующим параметру длины дуги вдоль контура.
15. Способ поиска объекта в изображении путем обработки сигналов, соответствующих изображениям, заключающийся в том, что вводят запрос в виде двухмерного контура, получают представление упомянутого контура с использованием способа представления объекта, появляющегося в изображении, получают представление объекта в хранимых изображениях с использованием способа по любому из пп.1-14 представления объекта, появляющегося в изображении, и сравнивают упомянутое представление в виде запроса с каждым представлением для хранимого объекта, выбирают и отображают на дисплее по меньшей мере один результат, соответствующий изображению, содержащему объект, для которого сравнение указывает степень подобия между объектом в виде запроса и упомянутым объектом.
16. Компьютерная система, запрограммированная для работы в соответствии со способом по любому из пп.1-14 представления объекта и/или способом по п.15 поиска объекта в изображении.
17. Считываемый компьютером носитель информации, хранящий выполняемые компьютером этапы процесса осуществления способа по любому из пп.1-14 представления объекта и/или способом по п.15 поиска объекта в изображении.
RU2001109352/09A 1999-07-05 2000-07-03 Способ и устройство, компьютерная программа, компьютерная система и считываемая компьютером память для представления и поиска объекта в изображении RU2225034C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9915699A GB2352075B (en) 1999-07-05 1999-07-05 Method and Apparatur for Representing and Searching for an Object in an Image
GB9915699.4 1999-07-05

Publications (2)

Publication Number Publication Date
RU2001109352A RU2001109352A (ru) 2003-04-20
RU2225034C2 true RU2225034C2 (ru) 2004-02-27

Family

ID=10856661

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2001109352/09A RU2225034C2 (ru) 1999-07-05 2000-07-03 Способ и устройство, компьютерная программа, компьютерная система и считываемая компьютером память для представления и поиска объекта в изображении

Country Status (8)

Country Link
US (6) US6931154B1 (ru)
JP (2) JP4688382B2 (ru)
KR (6) KR100944584B1 (ru)
CN (6) CN1940933B (ru)
BR (1) BR0006896A (ru)
GB (6) GB2393839B (ru)
RU (1) RU2225034C2 (ru)
WO (1) WO2001003069A1 (ru)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006031152A1 (fr) * 2004-09-08 2006-03-23 Boris Viktorovich Moiseev Dispositif pour commander l'affichage des donnees
EA013540B1 (ru) * 2005-03-15 2010-06-30 Верениум Корпорейшн Целлюлазы, нуклеиновые кислоты, кодирующие их, и способы их получения и применения
EA013993B1 (ru) * 2004-06-16 2010-08-30 Верениум Корпорейшн Композиции для ферментативного обесцвечивания хлорофилла и способы
EA014117B1 (ru) * 2005-03-15 2010-10-29 Шеврон Ю.Эс.Эй. Инк. Способ и устройство для моделирования имитатора коллектора
RU2533441C2 (ru) * 2009-12-30 2014-11-20 Нокиа Корпорейшн Способ и устройство для обеспечения поиска изображения по содержимому

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100438818B1 (ko) * 1998-09-10 2004-07-16 삼성전자주식회사 2차원 물체 이미지의 표현자 생성방법 및 2차원 물체 이미지의인식방법
GB2351826B (en) * 1999-07-05 2004-05-19 Mitsubishi Electric Inf Tech Method of representing an object in an image
GB2352076B (en) * 1999-07-15 2003-12-17 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
CA2400161C (en) * 2000-02-22 2015-11-24 Metacarta, Inc. Spatially coding and displaying information
GB2364590B (en) * 2000-07-07 2004-06-02 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
KR100415074B1 (ko) * 2001-10-09 2004-01-14 채영도 물체의 닮음을 인식하는 방법 및 그 장치
GB2384095B (en) * 2001-12-10 2004-04-28 Cybula Ltd Image recognition
JP2005215985A (ja) * 2004-01-29 2005-08-11 Fujitsu Ltd 走行車線判定プログラムおよびその記録媒体、走行車線判定装置ならびに走行車線判定方法
US7623685B2 (en) * 2004-08-20 2009-11-24 The Regents Of The University Of Colorado Biometric signatures and identification through the use of projective invariants
EP1904938A2 (en) 2005-06-28 2008-04-02 Metacarta, Inc. User interface for geographic search
JP2009526327A (ja) 2006-02-10 2009-07-16 メタカータ・インコーポレーテッド メディアオブジェクトについての空間サムネイルおよびコンパニオンマップのためのシステムおよび方法
US20080010605A1 (en) * 2006-06-12 2008-01-10 Metacarta, Inc. Systems and methods for generating and correcting location references extracted from text
US9721157B2 (en) 2006-08-04 2017-08-01 Nokia Technologies Oy Systems and methods for obtaining and using information from map images
US20080140348A1 (en) * 2006-10-31 2008-06-12 Metacarta, Inc. Systems and methods for predictive models using geographic text search
WO2009075689A2 (en) * 2006-12-21 2009-06-18 Metacarta, Inc. Methods of systems of using geographic meta-metadata in information retrieval and document displays
KR101244934B1 (ko) * 2011-12-06 2013-03-19 경북대학교 산학협력단 코드북을 이용한 객체 인식 장치, 객체 인식 방법 및 기록 매체
US8687104B2 (en) * 2012-03-27 2014-04-01 Amazon Technologies, Inc. User-guided object identification
CN106462774B (zh) * 2014-02-14 2020-01-24 河谷控股Ip有限责任公司 通过规范形状的对象摄取、系统和方法
US10748290B2 (en) * 2018-10-31 2020-08-18 Fei Company Smart metrology on microscope images
CN109544542B (zh) * 2018-11-29 2020-10-30 蚌埠翰邦知识产权服务有限公司 清洗次数设定平台
US11941863B2 (en) * 2021-08-04 2024-03-26 Datalogic Ip Tech S.R.L. Imaging system and method using a multi-layer model approach to provide robust object detection

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1988002158A1 (en) * 1986-09-18 1988-03-24 Violet Frances Leavers Shape detection
GB2203877A (en) * 1986-09-18 1988-10-26 Violet Frances Leavers Shape parametrisation
US4802230A (en) * 1987-03-13 1989-01-31 Gtx Corporation Method and apparatus for generating size and orientation invariant shape features
US4989257A (en) * 1987-03-13 1991-01-29 Gtx Corporation Method and apparatus for generating size and orientation invariant shape features
US5081689A (en) * 1989-03-27 1992-01-14 Hughes Aircraft Company Apparatus and method for extracting edges and lines
JPH0820725B2 (ja) * 1990-02-06 1996-03-04 大日本スクリーン製造株式会社 画像輪郭データの作成方法
CA2130340C (en) * 1992-02-18 2000-06-06 Shih-Jong James Lee Method for identifying objects using data processing techniques
US6182069B1 (en) * 1992-11-09 2001-01-30 International Business Machines Corporation Video query system and method
JPH06309465A (ja) * 1993-04-21 1994-11-04 Nippon Telegr & Teleph Corp <Ntt> 線図形学習認識方法
US5487116A (en) * 1993-05-25 1996-01-23 Matsushita Electric Industrial Co., Ltd. Vehicle recognition apparatus
JP3162918B2 (ja) * 1994-10-14 2001-05-08 キヤノン株式会社 画像処理装置および方法
US6014461A (en) * 1994-11-30 2000-01-11 Texas Instruments Incorporated Apparatus and method for automatic knowlege-based object identification
JPH1055447A (ja) * 1996-05-21 1998-02-24 Monorisu:Kk オブジェクト認識方法およびその方法を用いた装置
KR100305591B1 (ko) * 1998-07-22 2001-11-30 오길록 관절점기반동작정보를사용한동영상검색방법
GB2351826B (en) 1999-07-05 2004-05-19 Mitsubishi Electric Inf Tech Method of representing an object in an image
US6457766B1 (en) 2001-11-10 2002-10-01 Lee J. Telnack Vehicle streamlining structure

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA013993B1 (ru) * 2004-06-16 2010-08-30 Верениум Корпорейшн Композиции для ферментативного обесцвечивания хлорофилла и способы
WO2006031152A1 (fr) * 2004-09-08 2006-03-23 Boris Viktorovich Moiseev Dispositif pour commander l'affichage des donnees
EA013540B1 (ru) * 2005-03-15 2010-06-30 Верениум Корпорейшн Целлюлазы, нуклеиновые кислоты, кодирующие их, и способы их получения и применения
EA014117B1 (ru) * 2005-03-15 2010-10-29 Шеврон Ю.Эс.Эй. Инк. Способ и устройство для моделирования имитатора коллектора
RU2533441C2 (ru) * 2009-12-30 2014-11-20 Нокиа Корпорейшн Способ и устройство для обеспечения поиска изображения по содержимому

Also Published As

Publication number Publication date
GB2393839B (en) 2004-06-16
GB9915699D0 (en) 1999-09-08
US6931154B1 (en) 2005-08-16
KR100892470B1 (ko) 2009-04-10
JP2011100468A (ja) 2011-05-19
GB2394350A (en) 2004-04-21
CN1940935B (zh) 2010-06-16
CN1940932A (zh) 2007-04-04
CN1940932B (zh) 2010-06-16
GB0329841D0 (en) 2004-01-28
GB2391374A (en) 2004-02-04
CN1940934B (zh) 2010-06-16
GB0401486D0 (en) 2004-02-25
JP4688382B2 (ja) 2011-05-25
WO2001003069A8 (fr) 2001-03-22
CN1292387C (zh) 2006-12-27
US20050238236A1 (en) 2005-10-27
GB2391099A (en) 2004-01-28
CN1940933B (zh) 2010-06-23
KR20070073925A (ko) 2007-07-10
CN1316082A (zh) 2001-10-03
CN1940933A (zh) 2007-04-04
KR20030078932A (ko) 2003-10-08
CN1684094A (zh) 2005-10-19
GB2394349B (en) 2004-06-16
KR100448610B1 (ko) 2004-09-13
GB2352075A (en) 2001-01-17
KR100944584B1 (ko) 2010-02-25
KR100809831B1 (ko) 2008-03-04
US7532775B2 (en) 2009-05-12
CN1940935A (zh) 2007-04-04
US7505628B2 (en) 2009-03-17
US7257277B2 (en) 2007-08-14
KR20060066140A (ko) 2006-06-15
CN100399331C (zh) 2008-07-02
US20080131003A1 (en) 2008-06-05
GB2352075B (en) 2004-06-16
GB0324370D0 (en) 2003-11-19
GB2394349A (en) 2004-04-21
GB2394350B (en) 2004-06-16
BR0006896A (pt) 2001-06-12
KR20080100393A (ko) 2008-11-17
GB2393839A (en) 2004-04-07
KR20040053208A (ko) 2004-06-23
KR100937273B1 (ko) 2010-01-18
JP5236719B2 (ja) 2013-07-17
KR100732109B1 (ko) 2007-06-27
GB0401488D0 (en) 2004-02-25
WO2001003069A1 (fr) 2001-01-11
GB2391099B (en) 2004-06-16
CN1940934A (zh) 2007-04-04
KR20010073125A (ko) 2001-07-31
US20080063310A1 (en) 2008-03-13
GB0324377D0 (en) 2003-11-19
GB2391374B (en) 2004-06-16
US20070258659A1 (en) 2007-11-08
US7430338B2 (en) 2008-09-30
US7505638B2 (en) 2009-03-17
US20080056583A1 (en) 2008-03-06

Similar Documents

Publication Publication Date Title
RU2225034C2 (ru) Способ и устройство, компьютерная программа, компьютерная система и считываемая компьютером память для представления и поиска объекта в изображении
US7542626B2 (en) Method, apparatus, computer program, computer system, and computer-readable storage medium for representing and searching for an object in an image
KR100804326B1 (ko) 화상 중의 오브젝트를 검색하는 방법, 시스템 및 기계판독가능한 매체
MXPA01002353A (en) Method and device for displaying or searching for object in image and computer-readable storage medium
MXPA01002841A (en) Method and device for displaying or searching for object in image and computer-readable storage medium

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner
PC41 Official registration of the transfer of exclusive right

Effective date: 20190715