RU2225034C2 - Способ и устройство, компьютерная программа, компьютерная система и считываемая компьютером память для представления и поиска объекта в изображении - Google Patents
Способ и устройство, компьютерная программа, компьютерная система и считываемая компьютером память для представления и поиска объекта в изображении Download PDFInfo
- Publication number
- RU2225034C2 RU2225034C2 RU2001109352/09A RU2001109352A RU2225034C2 RU 2225034 C2 RU2225034 C2 RU 2225034C2 RU 2001109352/09 A RU2001109352/09 A RU 2001109352/09A RU 2001109352 A RU2001109352 A RU 2001109352A RU 2225034 C2 RU2225034 C2 RU 2225034C2
- Authority
- RU
- Russia
- Prior art keywords
- contour
- image
- representation
- peaks
- curvature
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/752—Contour matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Processing (AREA)
- Processing Or Creating Images (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Television Systems (AREA)
- Picture Signal Circuits (AREA)
Abstract
Изобретение относится к представлению объекта, появляющегося в видеоизображении. Его использование для поиска объекта в изображении, хранящемся в мультимедийной базе данных, позволяет обеспечить технический результат в виде снижения сложности процедуры поиска и отождествления объекта. Этот технический результат достигается в способе представления объекта, появляющегося в изображении, путем обработки сигналов, соответствующих изображению, в котором на основе упомянутых сигналов получают множество значений координат для пиков контура объекта в масштабируемом пространстве кривизны и применяют масштабирующее или нелинейное преобразование к значениям координат, чтобы получить представление контура. При поиске вводят запрос в виде двумерного контура, получают представление этого контура, а затем и представление объекта в хранимых изображениях с использованием способа представления объекта, появляющегося в изображении, сравнивают это представление в виде запроса с каждым представлением для хранимого объекта, выбирают и отображают на дисплее по меньшей мере один результат, соответствующий изображению, содержащему объект, для которого сравнение указывает степень подобия между объектом в виде запроса и объектом. 4 с. и 13 з.п. ф-лы, 2 табл., 8 ил.
Description
Область техники, к которой относится изобретение
Изобретение относится к представлению объекта, появляющегося в неподвижном изображении или видеоизображении, таком как изображение, хранимое в мультимедийной базе данных, в частности, в целях поиска, и к способу и устройству для поиска объекта с использованием такого представления.
Изобретение относится к представлению объекта, появляющегося в неподвижном изображении или видеоизображении, таком как изображение, хранимое в мультимедийной базе данных, в частности, в целях поиска, и к способу и устройству для поиска объекта с использованием такого представления.
Уровень техники
В таких приложениях, как библиотеки изображений или видеотеки, желательно иметь эффективное представление и хранение контура или профиля объектов или частей объектов, появляющихся в неподвижных изображениях или видеоизображениях. В известном способе индексации и поиска на основе профиля используют представление в масштабированном пространстве кривизны (МПК-представление). Подробности МПК-представления можно найти в статьях "Робастное и эффективное индексирование профиля посредством масштабированного пространства кривизны" в сборнике "Труды Британской конференции по машинному зрению" ("Robust and Efficient Shape Indexing through Curvature Scale Space" Proc. British Machine Vision conference, c. 53-62, Эдинбург, Соединенное Королевство, 1966), и "Индексирование базы данных по составу профилей с использованием масштабированного пространства кривизны" в сборнике "Труды Коллоквиума Института инженеров-электриков по интеллектуальным базам данных" ("Indexing an Image Database by Shape Content using Curvature Scale Space" Proc. IEE Colloquium on Intelligent Databases, Лондон, 1966), причем авторами обеих статей являются Ф.Мохтарян, С.Аббаси и Дж.Киттлер (F. Mokhtarian, S.Abbasi and J.Kittler), а их библиографические данные упоминаются здесь в качестве ссылки.
В таких приложениях, как библиотеки изображений или видеотеки, желательно иметь эффективное представление и хранение контура или профиля объектов или частей объектов, появляющихся в неподвижных изображениях или видеоизображениях. В известном способе индексации и поиска на основе профиля используют представление в масштабированном пространстве кривизны (МПК-представление). Подробности МПК-представления можно найти в статьях "Робастное и эффективное индексирование профиля посредством масштабированного пространства кривизны" в сборнике "Труды Британской конференции по машинному зрению" ("Robust and Efficient Shape Indexing through Curvature Scale Space" Proc. British Machine Vision conference, c. 53-62, Эдинбург, Соединенное Королевство, 1966), и "Индексирование базы данных по составу профилей с использованием масштабированного пространства кривизны" в сборнике "Труды Коллоквиума Института инженеров-электриков по интеллектуальным базам данных" ("Indexing an Image Database by Shape Content using Curvature Scale Space" Proc. IEE Colloquium on Intelligent Databases, Лондон, 1966), причем авторами обеих статей являются Ф.Мохтарян, С.Аббаси и Дж.Киттлер (F. Mokhtarian, S.Abbasi and J.Kittler), а их библиографические данные упоминаются здесь в качестве ссылки.
В МПК-представлении используется функция кривизны для контура объекта, начиная с произвольной точки контура. Функцию кривизны исследуют по мере развертки профиля контура посредством ряда деформаций, которые сглаживают профиль. Более конкретно, вычисляют переходы через нуль производной функции кривизны, свернутой с семейством Гауссовских фильтров. Эти переходы через нуль отображают точками на графике, известном как масштабированное пространство кривизны, где ось x представляет нормализованную длину дуги кривой, а ось y - параметр развертки, в частности параметр применяемого фильтра. Точки на графике образуют петли, являющиеся характеристическими для контура. Каждая выпуклая или вогнутая часть контура объекта соответствует некоторой петле в изображении в МПК (МПК-изображении). Координаты пиков наиболее выпуклых петель в МПК-изображении используются в качестве представления контура.
Для поиска объектов в изображениях, хранимых в базе данных и отождествляемых с вводимым объектом, вычисляют МПК-представление вводимого профиля. Подобие между вводимым профилем и хранимыми профилями определяется путем сравнения положения и высоты пиков в соответствующих МПК-изображениях с использованием алгоритма отождествления.
При использовании известного МПК-представления проблема заключается в том, что пики для некоторого заданного контура основаны на функции кривизны, вычисление которой начинают с произвольной точки на контуре. Если начальная точка изменяется, то происходит циклический сдвиг вдоль оси x пиков в МПК-изображении. Так, при вычислении меры подобия нужно исследовать все возможные сдвиги или, по меньшей мере, наиболее вероятный сдвиг. Это приводит к повышенной сложности процедуры поиска и отождествления.
Поэтому в настоящем изобретении предложен способ представления объекта, появляющегося в неподвижном изображении или видеоизображении, путем обработки сигналов, соответствующих упомянутому изображению, заключающийся в том, что получают множество числовых значений, связанных с особенностями, появляющимися на контуре объекта, начиная со случайной точки на контуре, и применяют предварительно определенное упорядочение к упомянутым значениям, чтобы прийти к представлению контура. Упомянутые значения предпочтительно получают из МПК-представления упомянутого контура и они предпочтительно соответствуют значениям пиков в МПК (МПК-пиков).
Обнаружено, что путем применения преобразования, в частности, в значения в МПК (МПК-значения), как это сделано в настоящем изобретении, улучшается рабочая характеристика поиска объекта.
Сущность изобретения
Одним объектом изобретения является способ представления объекта, появляющегося в неподвижном изображении или видеоизображении, путем обработки сигналов, соответствующих изображению, заключающийся в том, что получают множество числовых значений, представляющих особенности, появляющиеся на контуре объекта, и применяют масштабирующее или нелинейное преобразование к упомянутым значениям, чтобы прийти к представлению контура.
Одним объектом изобретения является способ представления объекта, появляющегося в неподвижном изображении или видеоизображении, путем обработки сигналов, соответствующих изображению, заключающийся в том, что получают множество числовых значений, представляющих особенности, появляющиеся на контуре объекта, и применяют масштабирующее или нелинейное преобразование к упомянутым значениям, чтобы прийти к представлению контура.
В способе согласно одному объекту изобретения числовые значения отражают точки перегиба на контуре.
Заявленный способ заключается в том, что получают представление контура в масштабированном пространстве кривизны путем многоэтапного сглаживания контура с использованием параметра сглаживания, приводящего к множеству кривых контура, используют значения для особых точек на каждой кривой контура для получения кривых, характеристических для исходного контура, и выбирают координаты пиков упомянутых характеристических кривых, при этом упомянутое преобразование применяют к значениям координат пиков.
В заявленном способе особые точки могут быть связаны с кривизной каждой кривой контура.
Особые точки могут быть также связаны с максимумами и минимумами кривизны кривых контура.
Другим объектом изобретения является способ представления объекта, появляющегося в неподвижном или видеоизображении, путем обработки сигналов, соответствующих изображению, заключающийся в том, что получают представление контура объекта в масштабированном пространстве кривизны (МПК), выбирают координаты для пиков в этом масштабированном пространстве кривизны и применяют нетривиальное преобразование к значениям координат пиков, чтобы прийти к представлению контура объекта.
Согласно способу по второму объекту изобретения преобразование применяют к значениям координат, соответствующим параметру сглаживания в МПК-представлении.
Преобразование могут применять к значениям координат, соответствующим параметру длины дуги вдоль контура.
Преобразование может являться масштабирующим преобразованием.
Преобразование может также являться нелинейным преобразованием.
Преобразование могут осуществлять в виде z'=a•pow(z, b)+с, где a, b и с - константы и pow(z, b) обозначает z в степени b;
b может быть больше нуля и меньше 1;
b может находиться в диапазоне 0,25≤b≤0,75;
b может быть равен 0,5.
b может быть больше нуля и меньше 1;
b может находиться в диапазоне 0,25≤b≤0,75;
b может быть равен 0,5.
Еще одним объектом изобретения является способ поиска объекта в неподвижном изображении или видеоизображении путем обработки сигналов, соответствующих изображениям, заключающийся в том, что вводят запрос в виде двухмерного контура, получают описатель упомянутого контура с использованием упомянутых способов, получают описатель объектов в хранимых изображениях с использованием упомянутых способов, сравнивают упомянутый описатель в виде запроса с каждым описателем для хранимого объекта, выбирают и отображают на дисплее, по меньшей мере, один результат, соответствующий изображению, содержащему объект, для которого сравнение указывает некоторую степень подобия между объектом в виде запроса и упомянутым объектом.
Еще одним объектом изобретения является компьютерная система, которая запрограммирована для работы в соответствии с вышеупомянутыми способами.
Считываемый компьютером носитель информации хранит выполняемые компьютером этапы процесса осуществления вышеупомянутых способов.
Краткое описание чертежей
Фиг.1 изображает блок-схему базы видеоданных,
фиг.2 изображает чертеж контура объекта,
фиг.3 изображает МПК-представление контура, показанного на фиг.2,
фиг.4 изображает рисунок, иллюстрирующий представление профиля,
фиг.5 изображает чертеж профиля объекта,
фиг.6 изображает МПК-представление профиля, показанного на фиг.5,
фиг. 7 изображает преобразованное представление профиля, показанного на фиг.5,
фиг.8 изображает блок-схему, иллюстрирующую способ поиска.
Фиг.1 изображает блок-схему базы видеоданных,
фиг.2 изображает чертеж контура объекта,
фиг.3 изображает МПК-представление контура, показанного на фиг.2,
фиг.4 изображает рисунок, иллюстрирующий представление профиля,
фиг.5 изображает чертеж профиля объекта,
фиг.6 изображает МПК-представление профиля, показанного на фиг.5,
фиг. 7 изображает преобразованное представление профиля, показанного на фиг.5,
фиг.8 изображает блок-схему, иллюстрирующую способ поиска.
Наилучший способ осуществления изобретения
Первый конкретный вариант осуществления
Фиг. 1 изображает компьютеризованную систему базы видеоданных в соответствии с конкретным вариантом осуществления изобретения. Система включает в себя блок 2 управления в виде компьютера, дисплей 4 в виде монитора, указательное устройство 6 в виде мыши, базу 8 данных изображений, включающую в себя хранимые неподвижные изображения и видеоизображения, и базу 10 данных описателей, хранящую описатели объектов или частей объектов, появляющихся в изображениях, хранимых в базе 8 данных изображений.
Первый конкретный вариант осуществления
Фиг. 1 изображает компьютеризованную систему базы видеоданных в соответствии с конкретным вариантом осуществления изобретения. Система включает в себя блок 2 управления в виде компьютера, дисплей 4 в виде монитора, указательное устройство 6 в виде мыши, базу 8 данных изображений, включающую в себя хранимые неподвижные изображения и видеоизображения, и базу 10 данных описателей, хранящую описатели объектов или частей объектов, появляющихся в изображениях, хранимых в базе 8 данных изображений.
Описатель для профиля каждого интересующего объекта, появляющегося в изображении в базе данных изображений, создается блоком 2 управления и хранится в базе 10 данных описателей. Блок 2 управления получает описатели, работая под управлением подходящей программы, осуществляющей способ, описанный ниже.
Прежде всего, для заданного контура объекта получают МПК-представление. Это делают с использованием известного способа, описанного в одной из вышеупомянутых статей.
Более конкретно, контур выражают представлением Ψ=((х(u), y(u), u∈[0, 1] }, где u - параметр нормализованной длины дуги.
Контур сглаживают путем свертки Ψ с идентифицирующим Гауссовым ядром g(u, σ), а переходы через нуль кривизны развертывающей кривой проверяют при изменениях σ. Переходы через нуль идентифицируют, пользуясь следующим выражением для кривизны:
где
X(u, σ) = x(u, σ)*g(u, σ),
Y(u, σ) = y(u, σ)*g(u, σ),
и
Xu(u, σ) = x(u, σ)*gu(u, σ),
Xuu(u, σ) = x(u, σ)*guu(u, σ).
Здесь * обозначает свертку, а подстрочные индексы обозначают производные.
где
X(u, σ) = x(u, σ)*g(u, σ),
Y(u, σ) = y(u, σ)*g(u, σ),
и
Xu(u, σ) = x(u, σ)*gu(u, σ),
Xuu(u, σ) = x(u, σ)*guu(u, σ).
Здесь * обозначает свертку, а подстрочные индексы обозначают производные.
Число переходов через нуль кривизны изменяется с изменением σ, и если σ достаточно велико, то Ψ является выпуклой кривой без переходов через нуль.
Точки переходов через нуль отображают в виде точек на графике, известном как пространство изображений в МПК (МПК-изображений). Это приводит к множеству характеристических кривых. Пики характеристических кривых идентифицируют, а соответствующие координаты выделяют и сохраняют. Вообще говоря, это дает набор из n пар координат: [(х1, y1), (х2, y2),...,(хn, yn)], где n - число пиков, a xi - положение длины дуги i-го пика и yi - высота этого пика.
В этом конкретном варианте осуществления используют биномиальный фильтр с коэффициентами (1/4, 1/2, 1/4) в качестве приближения Гауссовского фильтра, достигая некоторого уменьшения сложности вычислений. Уменьшение сложности вычислений является результатом удобных коэффициентов фильтра, которые можно эффективно реализовать в процессоре цифровых сигналов или процессоре общего назначения.
Затем подвергают дополнительной обработке значения пиков или, иными словами, значения составляющей y для пиков. Более конкретно, значения y преобразуют, пользуясь таким преобразованием:
y'=a•pow(y,b)+c, (1)
где pow(y, b) обозначает y в степени b.
y'=a•pow(y,b)+c, (1)
где pow(y, b) обозначает y в степени b.
Это приводит к новому набору значений пиков: [(х'1, y'1), (х'2, y'2),... , (x'n, y'n)] , сохраняемых в базе данных описателей в качестве описателя контура.
В качестве конкретного примера отметим, что контур, показанный на фиг.2, приводит к МПК-изображению, показанному на фиг.3. Подробные значения координат пиков кривых в МПК-изображении приведены в табл. 1.
Затем применяют преобразование, заданное выше, при а=6, b=0,5 и с=0. Иными словами, извлекают корень квадратный из исходного значения у и умножают его на константу. Это приводит к значениям, приведенным в табл.2.
Здесь значения округлены до ближайшего целого числа, но можно использовать и другие округления.
Второй конкретный вариант осуществления
Другой пример изображен на фиг.4.
Другой пример изображен на фиг.4.
Фиг. 5 изображает еще один пример профиля объекта, в этом случае - черепахи. Фиг. 6 изображает МПК-пики для профиля, показанного на фиг.5. Фиг.7 изображает пики, показанные на фиг.6 и преобразованные с использованием преобразования, заданного в уравнении (1), приведенном выше, при а=6,5, b=0,5 и с=0.
В целях поиска используют сохраняемые описатели. Пользователь инициирует поиск, делая чертеж контура объекта на дисплее с использованием указательного устройства (этап 510). После этого блок 2 управления создает МПК-представление вводимого контура (этап 520), а затем применяет вышеописанное преобразование к значениям y (этап 530). После этого получаемый описатель вводимого контура сравнивают с каждым сохраненным описателем в базе данных описателей, именуемых ниже описателями модели, с использованием известной процедуры отождествления (этап 540).
Сравнение для отождествления осуществляют с использованием подходящего алгоритма, что приводит к получению меры подобия для каждого описателя в базе данных. Можно использовать известный алгоритм отождествления, такой как описанный в вышеупомянутых статьях. Такая процедура отождествления кратко описана ниже.
Задаваясь двумя профилями замкнутого контура: кривой Ψi изображения и кривой Ψm модели и соответствующими им наборами пиков: [(xi1, yi1), (xi2, yi2), ..., (xin, yin)] и [(xm1, ym1), (xm2, ym2),..., (xmn, ymn)], вычисляют меру подобия. Меру подобия определяют как суммарную стоимость отождествления пиков в модели с пиками в изображении. Отождествление, которое минимизирует общую стоимость, определяют с использованием динамического программирования. Алгоритм обеспечивает рекурсивное отождествление пиков из модели с пиками из изображения и вычисление стоимости каждого такого отождествления. Каждый пик модели может быть отождествлен только с одним пиком изображения, а каждый пик изображения может быть отождествлен только с одним пиком модели. Какой-либо пик модели и/или изображения может остаться неотождествленным, и для каждого неотождествленного пика имеется дополнительная штрафная стоимость. Два пика можно отождествить, если горизонтальное расстояние между ними меньше 0,2. Стоимость отождествления - это длина прямой линии между этими двумя отождествленными пиками. Стоимостью неотождествленного пика является его высота.
Если говорить подробнее, то алгоритм работает, создавая и расширяя некоторую древовидную структуру, в которой узлы соответствуют отождествленным пикам:
1. Создают начальный узел, состоящий из наибольшего максимума изображения (xik, yik) и наибольшего максимума модели (xir, yir).
1. Создают начальный узел, состоящий из наибольшего максимума изображения (xik, yik) и наибольшего максимума модели (xir, yir).
2. Для каждого остающегося пика модели, который находится в пределах 80 процентов от наибольшего максимума пиков изображения, создают дополнительный начальный узел.
3. Инициализируют стоимость каждого начального узла, созданного на этапах 1 и 2, полагая ее равной абсолютной разности координаты y пиков изображения и модели, связанных этим узлом.
4. Для каждого начального узла, о котором шла речь на этапе 3, вычисляют параметр альфа-сдвига в МПК (МПК-сдвига), определяемый как разность пиков модели и изображения, отождествленных в этом начальном узле. Параметр сдвига будет разным для каждого узла.
5. Для каждого начального узла создают список узлов модели и список узлов изображения. Список содержит информацию о том, какие пики еще нужно отождествить. Для каждого начального узла отмечают пики, отождествленные в этом узле как "отождествленные", а все остальные пики - как "неотождествленные".
6. Рекурсивно расширяют узел с самой низкой стоимостью (начиная от каждого узла, созданного на этапах 1-6, и следуют по порожденным им узлам) до тех пор, пока не будет удовлетворено условие, указанное на этапе 8. Для расширения узла используют следующую процедуру.
7. Расширение узла.
Если, по меньшей мере, один пик изображения и один пик модели остались неотождествленными, то поступают следующим образом.
Выбирают неотождествленный максимум (xip, yip) в МПК (МПК-максимум) кривой изображения в наибольшем масштабе. Применяют параметр сдвига начального узла (вычисленный на этапе 4) для преобразования выбранного максимума в изображение модели в МПК (МПК-изображение модели) и теперь выбранный пик имеет координаты (xip-альфа, yip). Устанавливают местонахождение (xms, yms) ближайшего пика кривой модели, который не отождествлен. Если горизонтальное расстояние между этими двумя пиками меньше 0,2 (т.е. |xip-альфа|<0,2), то отождествляют эти два пика и определяют стоимость отождествления как длину прямой линии между этими двумя пиками. Прибавляют стоимость согласования к суммарной стоимости такого узла. Удаляют отождествленные пики из соответствующих списков, отмечая их как "отождествленные". Если горизонтальное расстояние между этими двумя пиками больше 0,2, то пик (xip, yip) модели отождествить нельзя. В этом случае прибавляют его высоту yip к суммарной стоимости и удаляют только пик (xip, yip) из списка пиков изображения, отмечая его как "отождествленный".
В противном случае (если остались неотождествленными только пики изображения или только пики модели) поступают следующим образом.
Определяют стоимость отождествления как высоту наивысшего неотождествленного пика изображения или модели и удаляют этот пик из списка.
8. Если после расширения узла на этапе 7 не остается неотождествленных пиков в обоих списках - изображения и модели, то завершают процедуру отождествления. Стоимость того узла является мерой подобия между кривыми изображения и модели. В противном случае переходят к этапу 7 и расширяют узел с самой низкой стоимостью.
Вышеуказанную процедуру повторяют, подставляя пики кривой изображения и пики кривой модели. Окончательное значение отождествления меньше двух.
В качестве еще одного примера отметим, что для каждого положения при упорядочении вычисляют расстояние между вводимым значением x и соответствующим значением x модели и расстояние между вводимым значением y и соответствующим значением y модели. Вычисляют суммарное расстояние по всем положениям, и чем меньше суммарное расстояние, тем точнее отождествление. Если числа пиков для вводимого профиля и модели различны, высота пика для остатков включается в суммарное расстояние.
Вышеупомянутые этапы повторяют для каждой модели в базе данных (этап 480).
Меры подобия, получаемые в результате сравнений при отождествлении, упорядочивают (этап 490), а затем объекты, соответствующие описателям, имеющим меры подобия, указывающие самое точное отождествление (т.е. в данном случае - наименьшие меры подобия), отображают для пользователя на дисплее 4 (этап 500). Число объектов, подлежащих отображению, может быть предварительно установлено или выбрано пользователем.
Третий конкретный вариант осуществления
Теперь будет описан альтернативный конкретный вариант осуществления. Этот конкретный вариант осуществления является таким же, как предыдущий конкретный вариант осуществления, за исключением того, что используется другое преобразование. Более конкретно, значения y преобразуются с использованием преобразования y'=а0+a1y.
Теперь будет описан альтернативный конкретный вариант осуществления. Этот конкретный вариант осуществления является таким же, как предыдущий конкретный вариант осуществления, за исключением того, что используется другое преобразование. Более конкретно, значения y преобразуются с использованием преобразования y'=а0+a1y.
Иными словами, применяется линейное масштабирующее преобразование.
Здесь а0=41, a1=0,19.
В одной вариации а0=0, a1=0,27.
Можно использовать и другие значения а0 и а1, если они подходят.
Процедура поиска и отождествления является, по существу, такой же, как описанная в предыдущем конкретном варианте осуществления.
Обнаружено, что применение некоторого преобразования, в частности линейного преобразования, обусловливающего масштабирование, или нелинейного преобразования, описанного выше, приводит к описателю, который менее чувствителен, например, к изменениям контура профиля в пределах некоторого класса объектов, вследствие чего обеспечивается улучшенный поиск с выборкой объектов.
В вышеописанных конкретных вариантах осуществления преобразование применяется к значениям в МПК (МПК-значениям) перед сохранением их в базе 10 данных описателей. В альтернативном варианте МПК-значения можно хранить в базе 10 данных, а преобразование осуществлять как часть процесса поиска перед осуществлением процедуры отождествления.
В вышеописанных конкретных вариантах осуществления преобразования применялись к значениям координаты y. Однако их можно применять к значениям координаты х.
Промышленная применимость
Система, соответствующая изобретению, может быть предусмотрена, например, в библиотеке изображений. В альтернативном варианте базы данных можно размещать вдали от блока управления с помощью временного канала связи, такого, как телефонная линия, или с помощью сети, такой как Интернет. Базы данных изображений и описателей могут быть предусмотрены, например, в постоянном запоминающем устройстве или на портативных носителях информации данных, таких как неперезаписываемые компакт-диски или цифровые видеодиски.
Система, соответствующая изобретению, может быть предусмотрена, например, в библиотеке изображений. В альтернативном варианте базы данных можно размещать вдали от блока управления с помощью временного канала связи, такого, как телефонная линия, или с помощью сети, такой как Интернет. Базы данных изображений и описателей могут быть предусмотрены, например, в постоянном запоминающем устройстве или на портативных носителях информации данных, таких как неперезаписываемые компакт-диски или цифровые видеодиски.
Составные части системы могут быть предусмотрены в виде программного обеспечения или аппаратного обеспечения. Хотя изобретение описано применительно к компьютерной системе, его можно реализовать и в других формах, например с использованием специализированной микросхемы (специализированного чипа).
В описании приведены конкретные примеры способов представления двухмерного профиля объекта с использованием МПК-представления, а также способов вычисления значений, представляющих подобия между двумя профилями, но можно использовать любые подходящие такие способы.
Изобретение также можно применять для отождествления изображений или объектов в целях верификации или для фильтрации.
Claims (17)
1. Способ представления объекта, появляющегося в изображении, путем обработки сигналов, соответствующих изображению, заключающийся в том, что на основе упомянутых сигналов получают множество значений координат для пиков контура объекта в масштабируемом пространстве кривизны и применяют масштабирующее или нелинейное преобразование к упомянутым значениям координат, чтобы получить представление контура.
2. Способ по п.1, в котором упомянутые числовые значения, по существу, инвариантны к масштабу контура.
3. Способ по п.1 или 2, в котором число упомянутых числовых значений зависит от профиля контура.
4. Способ по любому предыдущему пункту, в котором масштабирующее или нелинейное преобразование не зависит от профиля контура.
5. Способ по любому предыдущему пункту, в котором числовые значения отражают точки перегиба на контуре.
6. Способ по любому предыдущему пункту, заключающийся в том, что получают представление контура в масштабированном пространстве кривизны путем многоэтапного сглаживания контура с использованием параметра сглаживания, приводящего к множеству кривых контура, используют значения для особых точек на каждой кривой контура для получения кривых, характеристических для исходного контура, и выбирают координаты пиков упомянутых характеристических кривых, при этом упомянутое преобразование применяют к значениям координат пиков.
7. Способ по п.6, в котором особые точки связаны с кривизной каждой кривой контура.
8. Способ по п.7, в котором особые точки связаны с максимумами и минимумами кривизны кривых контура.
9. Способ по любому из пп.1-8, в котором преобразование осуществляют в виде z'=a*pow(z, b) + с, где a, b и с - константы, и pow(z, b) обозначает z в степени b.
10. Способ по п.9, в котором b больше нуля и меньше 1.
11. Способ по п.10, в котором b находится в диапазоне 0,25≤b≤0,75.
12. Способ по п.11, в котором b=0,5.
13. Способ по п.11, в котором b=0,6.
14. Способ по п.1, в котором преобразование применяют к значениям координат, соответствующим параметру длины дуги вдоль контура.
15. Способ поиска объекта в изображении путем обработки сигналов, соответствующих изображениям, заключающийся в том, что вводят запрос в виде двухмерного контура, получают представление упомянутого контура с использованием способа представления объекта, появляющегося в изображении, получают представление объекта в хранимых изображениях с использованием способа по любому из пп.1-14 представления объекта, появляющегося в изображении, и сравнивают упомянутое представление в виде запроса с каждым представлением для хранимого объекта, выбирают и отображают на дисплее по меньшей мере один результат, соответствующий изображению, содержащему объект, для которого сравнение указывает степень подобия между объектом в виде запроса и упомянутым объектом.
16. Компьютерная система, запрограммированная для работы в соответствии со способом по любому из пп.1-14 представления объекта и/или способом по п.15 поиска объекта в изображении.
17. Считываемый компьютером носитель информации, хранящий выполняемые компьютером этапы процесса осуществления способа по любому из пп.1-14 представления объекта и/или способом по п.15 поиска объекта в изображении.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB9915699A GB2352075B (en) | 1999-07-05 | 1999-07-05 | Method and Apparatur for Representing and Searching for an Object in an Image |
GB9915699.4 | 1999-07-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2001109352A RU2001109352A (ru) | 2003-04-20 |
RU2225034C2 true RU2225034C2 (ru) | 2004-02-27 |
Family
ID=10856661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2001109352/09A RU2225034C2 (ru) | 1999-07-05 | 2000-07-03 | Способ и устройство, компьютерная программа, компьютерная система и считываемая компьютером память для представления и поиска объекта в изображении |
Country Status (8)
Country | Link |
---|---|
US (6) | US6931154B1 (ru) |
JP (2) | JP4688382B2 (ru) |
KR (6) | KR100944584B1 (ru) |
CN (6) | CN1940933B (ru) |
BR (1) | BR0006896A (ru) |
GB (6) | GB2393839B (ru) |
RU (1) | RU2225034C2 (ru) |
WO (1) | WO2001003069A1 (ru) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006031152A1 (fr) * | 2004-09-08 | 2006-03-23 | Boris Viktorovich Moiseev | Dispositif pour commander l'affichage des donnees |
EA013540B1 (ru) * | 2005-03-15 | 2010-06-30 | Верениум Корпорейшн | Целлюлазы, нуклеиновые кислоты, кодирующие их, и способы их получения и применения |
EA013993B1 (ru) * | 2004-06-16 | 2010-08-30 | Верениум Корпорейшн | Композиции для ферментативного обесцвечивания хлорофилла и способы |
EA014117B1 (ru) * | 2005-03-15 | 2010-10-29 | Шеврон Ю.Эс.Эй. Инк. | Способ и устройство для моделирования имитатора коллектора |
RU2533441C2 (ru) * | 2009-12-30 | 2014-11-20 | Нокиа Корпорейшн | Способ и устройство для обеспечения поиска изображения по содержимому |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100438818B1 (ko) * | 1998-09-10 | 2004-07-16 | 삼성전자주식회사 | 2차원 물체 이미지의 표현자 생성방법 및 2차원 물체 이미지의인식방법 |
GB2351826B (en) * | 1999-07-05 | 2004-05-19 | Mitsubishi Electric Inf Tech | Method of representing an object in an image |
GB2352076B (en) * | 1999-07-15 | 2003-12-17 | Mitsubishi Electric Inf Tech | Method and apparatus for representing and searching for an object in an image |
CA2400161C (en) * | 2000-02-22 | 2015-11-24 | Metacarta, Inc. | Spatially coding and displaying information |
GB2364590B (en) * | 2000-07-07 | 2004-06-02 | Mitsubishi Electric Inf Tech | Method and apparatus for representing and searching for an object in an image |
KR100415074B1 (ko) * | 2001-10-09 | 2004-01-14 | 채영도 | 물체의 닮음을 인식하는 방법 및 그 장치 |
GB2384095B (en) * | 2001-12-10 | 2004-04-28 | Cybula Ltd | Image recognition |
JP2005215985A (ja) * | 2004-01-29 | 2005-08-11 | Fujitsu Ltd | 走行車線判定プログラムおよびその記録媒体、走行車線判定装置ならびに走行車線判定方法 |
US7623685B2 (en) * | 2004-08-20 | 2009-11-24 | The Regents Of The University Of Colorado | Biometric signatures and identification through the use of projective invariants |
EP1904938A2 (en) | 2005-06-28 | 2008-04-02 | Metacarta, Inc. | User interface for geographic search |
JP2009526327A (ja) | 2006-02-10 | 2009-07-16 | メタカータ・インコーポレーテッド | メディアオブジェクトについての空間サムネイルおよびコンパニオンマップのためのシステムおよび方法 |
US20080010605A1 (en) * | 2006-06-12 | 2008-01-10 | Metacarta, Inc. | Systems and methods for generating and correcting location references extracted from text |
US9721157B2 (en) | 2006-08-04 | 2017-08-01 | Nokia Technologies Oy | Systems and methods for obtaining and using information from map images |
US20080140348A1 (en) * | 2006-10-31 | 2008-06-12 | Metacarta, Inc. | Systems and methods for predictive models using geographic text search |
WO2009075689A2 (en) * | 2006-12-21 | 2009-06-18 | Metacarta, Inc. | Methods of systems of using geographic meta-metadata in information retrieval and document displays |
KR101244934B1 (ko) * | 2011-12-06 | 2013-03-19 | 경북대학교 산학협력단 | 코드북을 이용한 객체 인식 장치, 객체 인식 방법 및 기록 매체 |
US8687104B2 (en) * | 2012-03-27 | 2014-04-01 | Amazon Technologies, Inc. | User-guided object identification |
CN106462774B (zh) * | 2014-02-14 | 2020-01-24 | 河谷控股Ip有限责任公司 | 通过规范形状的对象摄取、系统和方法 |
US10748290B2 (en) * | 2018-10-31 | 2020-08-18 | Fei Company | Smart metrology on microscope images |
CN109544542B (zh) * | 2018-11-29 | 2020-10-30 | 蚌埠翰邦知识产权服务有限公司 | 清洗次数设定平台 |
US11941863B2 (en) * | 2021-08-04 | 2024-03-26 | Datalogic Ip Tech S.R.L. | Imaging system and method using a multi-layer model approach to provide robust object detection |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1988002158A1 (en) * | 1986-09-18 | 1988-03-24 | Violet Frances Leavers | Shape detection |
GB2203877A (en) * | 1986-09-18 | 1988-10-26 | Violet Frances Leavers | Shape parametrisation |
US4802230A (en) * | 1987-03-13 | 1989-01-31 | Gtx Corporation | Method and apparatus for generating size and orientation invariant shape features |
US4989257A (en) * | 1987-03-13 | 1991-01-29 | Gtx Corporation | Method and apparatus for generating size and orientation invariant shape features |
US5081689A (en) * | 1989-03-27 | 1992-01-14 | Hughes Aircraft Company | Apparatus and method for extracting edges and lines |
JPH0820725B2 (ja) * | 1990-02-06 | 1996-03-04 | 大日本スクリーン製造株式会社 | 画像輪郭データの作成方法 |
CA2130340C (en) * | 1992-02-18 | 2000-06-06 | Shih-Jong James Lee | Method for identifying objects using data processing techniques |
US6182069B1 (en) * | 1992-11-09 | 2001-01-30 | International Business Machines Corporation | Video query system and method |
JPH06309465A (ja) * | 1993-04-21 | 1994-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 線図形学習認識方法 |
US5487116A (en) * | 1993-05-25 | 1996-01-23 | Matsushita Electric Industrial Co., Ltd. | Vehicle recognition apparatus |
JP3162918B2 (ja) * | 1994-10-14 | 2001-05-08 | キヤノン株式会社 | 画像処理装置および方法 |
US6014461A (en) * | 1994-11-30 | 2000-01-11 | Texas Instruments Incorporated | Apparatus and method for automatic knowlege-based object identification |
JPH1055447A (ja) * | 1996-05-21 | 1998-02-24 | Monorisu:Kk | オブジェクト認識方法およびその方法を用いた装置 |
KR100305591B1 (ko) * | 1998-07-22 | 2001-11-30 | 오길록 | 관절점기반동작정보를사용한동영상검색방법 |
GB2351826B (en) | 1999-07-05 | 2004-05-19 | Mitsubishi Electric Inf Tech | Method of representing an object in an image |
US6457766B1 (en) | 2001-11-10 | 2002-10-01 | Lee J. Telnack | Vehicle streamlining structure |
-
1999
- 1999-07-05 GB GB0329841A patent/GB2393839B/en not_active Expired - Lifetime
- 1999-07-05 GB GB0324370A patent/GB2391099B/en not_active Expired - Lifetime
- 1999-07-05 GB GB9915699A patent/GB2352075B/en not_active Expired - Lifetime
- 1999-07-05 GB GB0401488A patent/GB2394350B/en not_active Expired - Lifetime
- 1999-07-05 GB GB0401486A patent/GB2394349B/en not_active Expired - Lifetime
- 1999-07-05 GB GB0324377A patent/GB2391374B/en not_active Expired - Lifetime
-
2000
- 2000-07-03 KR KR1020087025751A patent/KR100944584B1/ko active IP Right Grant
- 2000-07-03 CN CN2006101433782A patent/CN1940933B/zh not_active Expired - Lifetime
- 2000-07-03 BR BR0006896-9A patent/BR0006896A/pt not_active Application Discontinuation
- 2000-07-03 JP JP2001508782A patent/JP4688382B2/ja not_active Expired - Lifetime
- 2000-07-03 CN CN200610143380XA patent/CN1940935B/zh not_active Expired - Lifetime
- 2000-07-03 CN CN2006101433778A patent/CN1940932B/zh not_active Expired - Lifetime
- 2000-07-03 KR KR1020077011761A patent/KR100937273B1/ko active IP Right Grant
- 2000-07-03 WO PCT/JP2000/004401 patent/WO2001003069A1/ja not_active Application Discontinuation
- 2000-07-03 CN CNB2005100701303A patent/CN100399331C/zh not_active Expired - Lifetime
- 2000-07-03 KR KR1020067010562A patent/KR100892470B1/ko active IP Right Grant
- 2000-07-03 KR KR1020047006237A patent/KR100809831B1/ko active IP Right Grant
- 2000-07-03 CN CN2006101433797A patent/CN1940934B/zh not_active Expired - Lifetime
- 2000-07-03 KR KR10-2001-7002861A patent/KR100448610B1/ko active IP Right Grant
- 2000-07-03 US US09/786,161 patent/US6931154B1/en not_active Expired - Lifetime
- 2000-07-03 RU RU2001109352/09A patent/RU2225034C2/ru active
- 2000-07-03 KR KR1020037011017A patent/KR100732109B1/ko active IP Right Grant
- 2000-07-03 CN CNB008012466A patent/CN1292387C/zh not_active Expired - Lifetime
-
2005
- 2005-06-21 US US11/156,715 patent/US7257277B2/en not_active Expired - Lifetime
-
2007
- 2007-07-10 US US11/822,833 patent/US7430338B2/en not_active Expired - Fee Related
- 2007-10-30 US US11/929,598 patent/US7532775B2/en not_active Expired - Fee Related
- 2007-10-30 US US11/929,538 patent/US7505638B2/en not_active Expired - Fee Related
- 2007-10-30 US US11/929,560 patent/US7505628B2/en not_active Expired - Lifetime
-
2010
- 2010-12-01 JP JP2010268522A patent/JP5236719B2/ja not_active Expired - Lifetime
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EA013993B1 (ru) * | 2004-06-16 | 2010-08-30 | Верениум Корпорейшн | Композиции для ферментативного обесцвечивания хлорофилла и способы |
WO2006031152A1 (fr) * | 2004-09-08 | 2006-03-23 | Boris Viktorovich Moiseev | Dispositif pour commander l'affichage des donnees |
EA013540B1 (ru) * | 2005-03-15 | 2010-06-30 | Верениум Корпорейшн | Целлюлазы, нуклеиновые кислоты, кодирующие их, и способы их получения и применения |
EA014117B1 (ru) * | 2005-03-15 | 2010-10-29 | Шеврон Ю.Эс.Эй. Инк. | Способ и устройство для моделирования имитатора коллектора |
RU2533441C2 (ru) * | 2009-12-30 | 2014-11-20 | Нокиа Корпорейшн | Способ и устройство для обеспечения поиска изображения по содержимому |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2225034C2 (ru) | Способ и устройство, компьютерная программа, компьютерная система и считываемая компьютером память для представления и поиска объекта в изображении | |
US7542626B2 (en) | Method, apparatus, computer program, computer system, and computer-readable storage medium for representing and searching for an object in an image | |
KR100804326B1 (ko) | 화상 중의 오브젝트를 검색하는 방법, 시스템 및 기계판독가능한 매체 | |
MXPA01002353A (en) | Method and device for displaying or searching for object in image and computer-readable storage medium | |
MXPA01002841A (en) | Method and device for displaying or searching for object in image and computer-readable storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PD4A | Correction of name of patent owner | ||
PC41 | Official registration of the transfer of exclusive right |
Effective date: 20190715 |