RU2009104869A - METHOD FOR RECOGNIZING THREE-DIMENSIONAL OBJECTS BY A SINGLE TWO-DIMENSIONAL IMAGE AND A DEVICE FOR ITS IMPLEMENTATION - Google Patents

METHOD FOR RECOGNIZING THREE-DIMENSIONAL OBJECTS BY A SINGLE TWO-DIMENSIONAL IMAGE AND A DEVICE FOR ITS IMPLEMENTATION Download PDF

Info

Publication number
RU2009104869A
RU2009104869A RU2009104869/08A RU2009104869A RU2009104869A RU 2009104869 A RU2009104869 A RU 2009104869A RU 2009104869/08 A RU2009104869/08 A RU 2009104869/08A RU 2009104869 A RU2009104869 A RU 2009104869A RU 2009104869 A RU2009104869 A RU 2009104869A
Authority
RU
Russia
Prior art keywords
image
parameters
input
dimensional
unit
Prior art date
Application number
RU2009104869/08A
Other languages
Russian (ru)
Inventor
Виталий Семенович Титов (RU)
Виталий Семенович Титов
Максим Игоревич Труфанов (RU)
Максим Игоревич Труфанов
Сергей Иванович Коростелев (RU)
Сергей Иванович Коростелев
Original Assignee
Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет (R
Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет (R, Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет filed Critical Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет (R
Priority to RU2009104869/08A priority Critical patent/RU2009104869A/en
Publication of RU2009104869A publication Critical patent/RU2009104869A/en

Links

Abstract

1. Способ распознавания трехмерных объектов по единственному двумерному изображению, программа которого предусматривает предварительное приведение изображения объекта, вводимого в компьютер, к нормальному, стандартному для данного способа виду - изменению масштаба, поворот в требуемое положение, центрирование, вписание в прямоугольник требуемого размера, преобразование изображения объекта в изображение, выполненное в градациях - различных степенях яркости одного цвета, на которое последовательно, поочередно накладываются изображения хранящихся в памяти компьютера шаблонов, отличающийся тем, что эталонное изображение хранят в виде векторной трехмерной модели, для каждой такой модели фиксируют набор параметров для аффинных преобразований: углы поворота по осям x у z масштаб; этот набор параметров определяют для каждой модели с учетом сложности ее формы с тем, чтобы наиболее точно произвести идентификацию; производят следующую последовательность действий: получают векторную трехмерную модель эталонного объекта путем геометрического построения, затем, изменяя ее положение в пространстве (поворот, отражение, масштабирование), получают ряд вышеуказанных параметров, которые сохраняют и используют в дальнейшем при распознавании для воссоздания соответствующего ракурса эталона объекта; плоское изображение представляют в виде двумерного массива, элементами которого являются значения от 0 до 255 - градации серого цвета; помимо указанных параметров в набор включают дополнительно соотношение сторон габаритного изображения контейнера объекта и кодированное представление объекта, которое позволяет опред� 1. A method for recognizing three-dimensional objects from a single two-dimensional image, the program of which provides a preliminary reduction of the image of an object entered into a computer to a normal, standard form for this method - zooming, rotation to the desired position, centering, fitting into a rectangle of the required size, image conversion object in an image made in gradations - different degrees of brightness of one color, on which the image is sequentially, alternately superimposed I stored in the memory of a computer template, wherein the reference image is stored in the form of vector three-dimensional model, for each such model is fixed set of parameters for affine transformations: rotations in the x y z scale; this set of parameters is determined for each model, taking into account the complexity of its shape in order to most accurately identify; the following sequence of actions is performed: a vector three-dimensional model of the reference object is obtained by geometric construction, then, changing its position in space (rotation, reflection, scaling), a series of the above parameters are obtained, which are saved and used in the future for recognition to recreate the corresponding angle of the object’s standard; a flat image is represented in the form of a two-dimensional array, the elements of which are values from 0 to 255 - gradations of gray color; in addition to these parameters, the set also includes the aspect ratio of the overall image of the container of the object and the encoded representation of the object, which allows

Claims (2)

1. Способ распознавания трехмерных объектов по единственному двумерному изображению, программа которого предусматривает предварительное приведение изображения объекта, вводимого в компьютер, к нормальному, стандартному для данного способа виду - изменению масштаба, поворот в требуемое положение, центрирование, вписание в прямоугольник требуемого размера, преобразование изображения объекта в изображение, выполненное в градациях - различных степенях яркости одного цвета, на которое последовательно, поочередно накладываются изображения хранящихся в памяти компьютера шаблонов, отличающийся тем, что эталонное изображение хранят в виде векторной трехмерной модели, для каждой такой модели фиксируют набор параметров для аффинных преобразований: углы поворота по осям x у z масштаб; этот набор параметров определяют для каждой модели с учетом сложности ее формы с тем, чтобы наиболее точно произвести идентификацию; производят следующую последовательность действий: получают векторную трехмерную модель эталонного объекта путем геометрического построения, затем, изменяя ее положение в пространстве (поворот, отражение, масштабирование), получают ряд вышеуказанных параметров, которые сохраняют и используют в дальнейшем при распознавании для воссоздания соответствующего ракурса эталона объекта; плоское изображение представляют в виде двумерного массива, элементами которого являются значения от 0 до 255 - градации серого цвета; помимо указанных параметров в набор включают дополнительно соотношение сторон габаритного изображения контейнера объекта и кодированное представление объекта, которое позволяет определить его положение внутри габаритного контейнера, кодирование производят разбиением габаритного контейнера на 121 одинаковых областей и определением наличия части объекта в каждой из них, таким образом получают 121-битный код данного ракурса объекта в двоичном виде: если часть изображения объекта находится в области, то ее помечают единицей; иначе нулем, код получают перебором значений меток в областях слева направо, сверху вниз, на вход распознавателя подают изображение, представленное массивом пикселей в градациях серого, то есть каждый элемент массива имеет значение от 0 до 255, размерность массива зависит от параметров дискретизации изображения, распознавание производят следующим образом: определяют габаритный контейнер входного изображения объекта, затем кодируют вышеуказанным способом, исходя из отношения сторон габаритного контейнера и полученного кода, выбирают набор параметров из базы эталонов, затем выполняют преобразование векторной модели эталонного объекта соответственно установленным ранее параметрам: поворот и масштабирование, после чего строят плоское изображение модели эталона, которое сравнивают с поданным на вход изображением посредством нейросети персептрон, сравнение производят путем анализа градаций серого для каждой дискретной области изображения, причем производят попиксельное сравнение, затем находят модуль разности для каждой пары пикселей изображения поданного на вход распознавателя и полученной проекции векторной модели эталонного объекта и сравнивают его с пороговым значением, полученные данные подают на вход нейросети персептрон, в зависимости от значения функции активации которой принимают решение о схожести проекции векторной модели эталонного объекта и входного изображения.1. A method for recognizing three-dimensional objects from a single two-dimensional image, the program of which provides a preliminary reduction of the image of an object entered into a computer to a normal, standard form for this method - zooming, rotation to the desired position, centering, fitting into a rectangle of the required size, image conversion object in an image made in gradations - different degrees of brightness of one color, on which the image is sequentially, alternately superimposed I stored in the memory of a computer template, wherein the reference image is stored in the form of vector three-dimensional model, for each such model is fixed set of parameters for affine transformations: rotations in the x y z scale; this set of parameters is determined for each model, taking into account the complexity of its shape in order to most accurately identify; the following sequence of actions is performed: a vector three-dimensional model of the reference object is obtained by geometric construction, then, changing its position in space (rotation, reflection, scaling), a series of the above parameters are obtained, which are saved and used in the future for recognition to recreate the corresponding angle of the object’s standard; a flat image is represented in the form of a two-dimensional array, the elements of which are values from 0 to 255 - gradations of gray color; in addition to these parameters, the set also includes the aspect ratio of the overall image of the container of the object and the encoded representation of the object, which allows you to determine its position inside the overall container, coding is done by dividing the overall container into 121 identical areas and determining the presence of a part of the object in each of them, thus 121 -bit code of this aspect of the object in binary form: if part of the image of the object is in the area, then it is marked with a unit; otherwise, zero, the code is obtained by enumerating the values of the labels in areas from left to right, from top to bottom, an image represented by an array of pixels in grayscale is fed to the input of the recognizer, that is, each element of the array has a value from 0 to 255, the dimension of the array depends on the image sampling parameters, recognition produced as follows: determine the overall container of the input image of the object, then encode the above method, based on the aspect ratio of the overall container and the resulting code, choose the parameters from the base of the standards, then the vector model of the reference object is converted according to the previously established parameters: rotation and scaling, after which a flat image of the model of the standard is constructed, which is compared with the input image via the perceptron neural network, the comparison is made by analyzing gray gradations for each discrete area of the image, and perform pixel-by-pixel comparison, then find the difference module for each pair of pixels of the image fed to the input p spoznavatelya obtained projection vector and the reference model of the object and compare it with a threshold value, the data is input perceptron neural network depending on values which activate decide projection similarity vector model of the reference object and the input image. 2. Устройство распознавания трехмерных объектов по единственному двумерному изображению содержит блок ввода и предварительной обработки изображения (БВПО), который выделяет габаритный контейнер, просчитывает необходимые коэффициенты, блок анализа изображения и последующего кодирования (БК), производящий вычисление параметров и кодирование входного изображения, блок, содержащий запоминающее устройство с параметрами эталонов и производящий сравнение (ЗУП), выполняет сравнения полученных ранее параметров исходного изображения с соответствующими параметрами эталонов, блок распознавания (БР), который выполняет сравнение проекции эталона и исходного изображения, блок содержит запоминающее устройство с эталонными изображениями в векторном формате, выполняет просчет трехмерного изображения с учетом имеющихся углов поворота и масштаба; генерирует веса на основе полученных данных и выполняет сравнение посредством нейросети типа персептрон за счет сравнения яркостных составляющих элементов изображения, блок сохранения параметров (БСП) идентифицированного объекта содержит стек для накопления изображений, которые были идентифицированы, блок, выбирающий трехмерный эталон по переданным параметрам и сохраняющий необходимые данные (БВЭ), обеспечивает сохранение результатов распознавания, устройство для коммуникации с ЭВМ (УКЭВМ), причем первый выход блока ввода и предварительной обработки изображения (БВПО) является входом, второй выход блока ввода и предварительной обработки изображения (БВПО) соединен с первым входом блока распознавания (БР), выход блока анализа изображения и последующего кодирования (БК) является первым входом блока, содержащего запоминающее устройство с параметрами эталонов и производящего сравнение (ЗУП), первый выход блока, содержащего запоминающее устройство с параметрами эталонов и производящего сравнение (ЗУП), соединен со вторым входом блока распознавания (БР), второй выход блока, содержащего запоминающее устройство с параметрами эталонов и производящего сравнение (ЗУП) является вторым входом блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), первый выход блока распознавания (БР) является входом блока сохранения параметров (БСП), второй выход блока распознавания (БР) соединен с третьим входом блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), выход блока сохранения параметров (БСП) является первым входом блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), первый выход блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), соединен со вторым входом запоминающего устройства с параметрами эталонов и производящего сравнение (ЗУП), второй выход блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), подключен к устройству для коммуникации с ЭВМ (УКЭВМ), третий выход блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), соединен с третьим входом блока распознавания (БР). 2. A device for recognizing three-dimensional objects from a single two-dimensional image contains an input and image preprocessing unit (BVPO) that selects the overall container, calculates the necessary coefficients, an image analysis and subsequent coding (BC) unit, which performs parameter calculation and encoding of the input image, block, containing a storage device with the parameters of the standards and performing a comparison (ZUP), compares the previously obtained parameters of the original image with the corresponding with the existing parameters of the standards, a recognition unit (BR) that compares the projection of the standard and the source image, the unit contains a storage device with the reference images in a vector format, performs a three-dimensional image calculation taking into account the available rotation angles and scale; generates weights based on the obtained data and performs a comparison using a perceptron-type neural network by comparing the brightness components of the image elements, the parameter storage unit (BSP) of the identified object contains a stack for accumulating images that have been identified, a block that selects a three-dimensional standard according to the transferred parameters and saves the necessary data (BWE), ensures the preservation of recognition results, a device for communicating with a computer (UKEVM), with the first output of the input unit and the lead image processing (BVPO) is the input, the second output of the input and preliminary image processing unit (BVPO) is connected to the first input of the recognition unit (BR), the output of the image analysis and subsequent coding (BC) block is the first input of the block containing a storage device with parameters standards and performing a comparison (ZUP), the first output of a block containing a storage device with parameters of standards and performing a comparison (ZUP) is connected to the second input of the recognition unit (BR), the second output is a ka containing a memory device with parameters of the standards and performing a comparison (ZUP) is the second input of the block, which selects a three-dimensional standard according to the transferred parameters and stores the necessary data (BWE), the first output of the recognition unit (BR) is the input of the parameter storage block (BSP), the second the output of the recognition unit (BR) is connected to the third input of the unit, which selects a three-dimensional standard according to the transferred parameters and stores the necessary data (BWE), the output of the parameter storage unit (BSP) is the first input of the unit a ka choosing a three-dimensional standard according to the transferred parameters and storing the necessary data (BWE), the first output of the block choosing a three-dimensional standard according to the transferred parameters and storing the necessary data (BWE) is connected to the second input of the storage device with the parameters of the standards and comparing (ZUP), the second output of the block that selects a three-dimensional standard according to the transferred parameters and stores the necessary data (BWE), is connected to a device for communication with a computer (UKEVM), the third output of the block that selects a three-dimensional standard on transmitted parameters and stores necessary data (BVE), connected to the third input of the recognition unit (BR).
RU2009104869/08A 2009-02-13 2009-02-13 METHOD FOR RECOGNIZING THREE-DIMENSIONAL OBJECTS BY A SINGLE TWO-DIMENSIONAL IMAGE AND A DEVICE FOR ITS IMPLEMENTATION RU2009104869A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2009104869/08A RU2009104869A (en) 2009-02-13 2009-02-13 METHOD FOR RECOGNIZING THREE-DIMENSIONAL OBJECTS BY A SINGLE TWO-DIMENSIONAL IMAGE AND A DEVICE FOR ITS IMPLEMENTATION

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2009104869/08A RU2009104869A (en) 2009-02-13 2009-02-13 METHOD FOR RECOGNIZING THREE-DIMENSIONAL OBJECTS BY A SINGLE TWO-DIMENSIONAL IMAGE AND A DEVICE FOR ITS IMPLEMENTATION

Publications (1)

Publication Number Publication Date
RU2009104869A true RU2009104869A (en) 2010-08-20

Family

ID=46305185

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009104869/08A RU2009104869A (en) 2009-02-13 2009-02-13 METHOD FOR RECOGNIZING THREE-DIMENSIONAL OBJECTS BY A SINGLE TWO-DIMENSIONAL IMAGE AND A DEVICE FOR ITS IMPLEMENTATION

Country Status (1)

Country Link
RU (1) RU2009104869A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2628217C2 (en) * 2012-11-19 2017-08-15 АйЭйчАй КОРПОРЕЙШН Device for recognition of three-dimensional object and method of recognition of three-dimensional object

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2628217C2 (en) * 2012-11-19 2017-08-15 АйЭйчАй КОРПОРЕЙШН Device for recognition of three-dimensional object and method of recognition of three-dimensional object

Similar Documents

Publication Publication Date Title
WO2020038205A1 (en) Target detection method and apparatus, computer-readable storage medium, and computer device
US11854283B2 (en) Method and apparatus for visual question answering, computer device and medium
CN110659647B (en) Seal image identification method and device, intelligent invoice identification equipment and storage medium
US10515269B2 (en) Machine vision with dimensional data reduction
CN111462120A (en) Defect detection method, device, medium and equipment based on semantic segmentation model
CN110599395A (en) Target image generation method, device, server and storage medium
Kittler et al. 3D morphable face models and their applications
CN110390254B (en) Character analysis method and device based on human face, computer equipment and storage medium
CN111340785B (en) Model training method, product surface defect detection method and storage medium
RU2007109075A (en) METHOD AND DEVICE FOR RECOGNITION OF IMAGES OF OBJECTS
CN110555424A (en) port container layout detection method, device, equipment and readable storage medium
CN116189265A (en) Sketch face recognition method, device and equipment based on lightweight semantic transducer model
CN116740261A (en) Image reconstruction method and device and training method and device of image reconstruction model
US20230196718A1 (en) Image augmentation device and method
RU2009104869A (en) METHOD FOR RECOGNIZING THREE-DIMENSIONAL OBJECTS BY A SINGLE TWO-DIMENSIONAL IMAGE AND A DEVICE FOR ITS IMPLEMENTATION
CN115810197A (en) Multi-mode electric power form recognition method and device
CN114782822A (en) Method and device for detecting state of power equipment, electronic equipment and storage medium
CN114782592A (en) Cartoon animation generation method, device and equipment based on image and storage medium
CN113822871A (en) Target detection method and device based on dynamic detection head, storage medium and equipment
CN114511877A (en) Behavior recognition method and device, storage medium and terminal
CN116152334A (en) Image processing method and related equipment
CN111951287A (en) Two-dimensional code detection and recognition method
CN114005169B (en) Face key point detection method and device, electronic equipment and storage medium
CN110796075B (en) Face diversity data acquisition method, device, equipment and readable storage medium
Long et al. An Acceleration Inference Implementation of BEVFusion with MQBench on Xavier

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20101011

FZ9A Application not withdrawn (correction of the notice of withdrawal)

Effective date: 20101216

FA94 Acknowledgement of application withdrawn (non-payment of fees)

Effective date: 20111129