Claims (2)
1. Способ распознавания трехмерных объектов по единственному двумерному изображению, программа которого предусматривает предварительное приведение изображения объекта, вводимого в компьютер, к нормальному, стандартному для данного способа виду - изменению масштаба, поворот в требуемое положение, центрирование, вписание в прямоугольник требуемого размера, преобразование изображения объекта в изображение, выполненное в градациях - различных степенях яркости одного цвета, на которое последовательно, поочередно накладываются изображения хранящихся в памяти компьютера шаблонов, отличающийся тем, что эталонное изображение хранят в виде векторной трехмерной модели, для каждой такой модели фиксируют набор параметров для аффинных преобразований: углы поворота по осям x у z масштаб; этот набор параметров определяют для каждой модели с учетом сложности ее формы с тем, чтобы наиболее точно произвести идентификацию; производят следующую последовательность действий: получают векторную трехмерную модель эталонного объекта путем геометрического построения, затем, изменяя ее положение в пространстве (поворот, отражение, масштабирование), получают ряд вышеуказанных параметров, которые сохраняют и используют в дальнейшем при распознавании для воссоздания соответствующего ракурса эталона объекта; плоское изображение представляют в виде двумерного массива, элементами которого являются значения от 0 до 255 - градации серого цвета; помимо указанных параметров в набор включают дополнительно соотношение сторон габаритного изображения контейнера объекта и кодированное представление объекта, которое позволяет определить его положение внутри габаритного контейнера, кодирование производят разбиением габаритного контейнера на 121 одинаковых областей и определением наличия части объекта в каждой из них, таким образом получают 121-битный код данного ракурса объекта в двоичном виде: если часть изображения объекта находится в области, то ее помечают единицей; иначе нулем, код получают перебором значений меток в областях слева направо, сверху вниз, на вход распознавателя подают изображение, представленное массивом пикселей в градациях серого, то есть каждый элемент массива имеет значение от 0 до 255, размерность массива зависит от параметров дискретизации изображения, распознавание производят следующим образом: определяют габаритный контейнер входного изображения объекта, затем кодируют вышеуказанным способом, исходя из отношения сторон габаритного контейнера и полученного кода, выбирают набор параметров из базы эталонов, затем выполняют преобразование векторной модели эталонного объекта соответственно установленным ранее параметрам: поворот и масштабирование, после чего строят плоское изображение модели эталона, которое сравнивают с поданным на вход изображением посредством нейросети персептрон, сравнение производят путем анализа градаций серого для каждой дискретной области изображения, причем производят попиксельное сравнение, затем находят модуль разности для каждой пары пикселей изображения поданного на вход распознавателя и полученной проекции векторной модели эталонного объекта и сравнивают его с пороговым значением, полученные данные подают на вход нейросети персептрон, в зависимости от значения функции активации которой принимают решение о схожести проекции векторной модели эталонного объекта и входного изображения.1. A method for recognizing three-dimensional objects from a single two-dimensional image, the program of which provides a preliminary reduction of the image of an object entered into a computer to a normal, standard form for this method - zooming, rotation to the desired position, centering, fitting into a rectangle of the required size, image conversion object in an image made in gradations - different degrees of brightness of one color, on which the image is sequentially, alternately superimposed I stored in the memory of a computer template, wherein the reference image is stored in the form of vector three-dimensional model, for each such model is fixed set of parameters for affine transformations: rotations in the x y z scale; this set of parameters is determined for each model, taking into account the complexity of its shape in order to most accurately identify; the following sequence of actions is performed: a vector three-dimensional model of the reference object is obtained by geometric construction, then, changing its position in space (rotation, reflection, scaling), a series of the above parameters are obtained, which are saved and used in the future for recognition to recreate the corresponding angle of the object’s standard; a flat image is represented in the form of a two-dimensional array, the elements of which are values from 0 to 255 - gradations of gray color; in addition to these parameters, the set also includes the aspect ratio of the overall image of the container of the object and the encoded representation of the object, which allows you to determine its position inside the overall container, coding is done by dividing the overall container into 121 identical areas and determining the presence of a part of the object in each of them, thus 121 -bit code of this aspect of the object in binary form: if part of the image of the object is in the area, then it is marked with a unit; otherwise, zero, the code is obtained by enumerating the values of the labels in areas from left to right, from top to bottom, an image represented by an array of pixels in grayscale is fed to the input of the recognizer, that is, each element of the array has a value from 0 to 255, the dimension of the array depends on the image sampling parameters, recognition produced as follows: determine the overall container of the input image of the object, then encode the above method, based on the aspect ratio of the overall container and the resulting code, choose the parameters from the base of the standards, then the vector model of the reference object is converted according to the previously established parameters: rotation and scaling, after which a flat image of the model of the standard is constructed, which is compared with the input image via the perceptron neural network, the comparison is made by analyzing gray gradations for each discrete area of the image, and perform pixel-by-pixel comparison, then find the difference module for each pair of pixels of the image fed to the input p spoznavatelya obtained projection vector and the reference model of the object and compare it with a threshold value, the data is input perceptron neural network depending on values which activate decide projection similarity vector model of the reference object and the input image.
2. Устройство распознавания трехмерных объектов по единственному двумерному изображению содержит блок ввода и предварительной обработки изображения (БВПО), который выделяет габаритный контейнер, просчитывает необходимые коэффициенты, блок анализа изображения и последующего кодирования (БК), производящий вычисление параметров и кодирование входного изображения, блок, содержащий запоминающее устройство с параметрами эталонов и производящий сравнение (ЗУП), выполняет сравнения полученных ранее параметров исходного изображения с соответствующими параметрами эталонов, блок распознавания (БР), который выполняет сравнение проекции эталона и исходного изображения, блок содержит запоминающее устройство с эталонными изображениями в векторном формате, выполняет просчет трехмерного изображения с учетом имеющихся углов поворота и масштаба; генерирует веса на основе полученных данных и выполняет сравнение посредством нейросети типа персептрон за счет сравнения яркостных составляющих элементов изображения, блок сохранения параметров (БСП) идентифицированного объекта содержит стек для накопления изображений, которые были идентифицированы, блок, выбирающий трехмерный эталон по переданным параметрам и сохраняющий необходимые данные (БВЭ), обеспечивает сохранение результатов распознавания, устройство для коммуникации с ЭВМ (УКЭВМ), причем первый выход блока ввода и предварительной обработки изображения (БВПО) является входом, второй выход блока ввода и предварительной обработки изображения (БВПО) соединен с первым входом блока распознавания (БР), выход блока анализа изображения и последующего кодирования (БК) является первым входом блока, содержащего запоминающее устройство с параметрами эталонов и производящего сравнение (ЗУП), первый выход блока, содержащего запоминающее устройство с параметрами эталонов и производящего сравнение (ЗУП), соединен со вторым входом блока распознавания (БР), второй выход блока, содержащего запоминающее устройство с параметрами эталонов и производящего сравнение (ЗУП) является вторым входом блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), первый выход блока распознавания (БР) является входом блока сохранения параметров (БСП), второй выход блока распознавания (БР) соединен с третьим входом блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), выход блока сохранения параметров (БСП) является первым входом блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), первый выход блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), соединен со вторым входом запоминающего устройства с параметрами эталонов и производящего сравнение (ЗУП), второй выход блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), подключен к устройству для коммуникации с ЭВМ (УКЭВМ), третий выход блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), соединен с третьим входом блока распознавания (БР).
2. A device for recognizing three-dimensional objects from a single two-dimensional image contains an input and image preprocessing unit (BVPO) that selects the overall container, calculates the necessary coefficients, an image analysis and subsequent coding (BC) unit, which performs parameter calculation and encoding of the input image, block, containing a storage device with the parameters of the standards and performing a comparison (ZUP), compares the previously obtained parameters of the original image with the corresponding with the existing parameters of the standards, a recognition unit (BR) that compares the projection of the standard and the source image, the unit contains a storage device with the reference images in a vector format, performs a three-dimensional image calculation taking into account the available rotation angles and scale; generates weights based on the obtained data and performs a comparison using a perceptron-type neural network by comparing the brightness components of the image elements, the parameter storage unit (BSP) of the identified object contains a stack for accumulating images that have been identified, a block that selects a three-dimensional standard according to the transferred parameters and saves the necessary data (BWE), ensures the preservation of recognition results, a device for communicating with a computer (UKEVM), with the first output of the input unit and the lead image processing (BVPO) is the input, the second output of the input and preliminary image processing unit (BVPO) is connected to the first input of the recognition unit (BR), the output of the image analysis and subsequent coding (BC) block is the first input of the block containing a storage device with parameters standards and performing a comparison (ZUP), the first output of a block containing a storage device with parameters of standards and performing a comparison (ZUP) is connected to the second input of the recognition unit (BR), the second output is a ka containing a memory device with parameters of the standards and performing a comparison (ZUP) is the second input of the block, which selects a three-dimensional standard according to the transferred parameters and stores the necessary data (BWE), the first output of the recognition unit (BR) is the input of the parameter storage block (BSP), the second the output of the recognition unit (BR) is connected to the third input of the unit, which selects a three-dimensional standard according to the transferred parameters and stores the necessary data (BWE), the output of the parameter storage unit (BSP) is the first input of the unit a ka choosing a three-dimensional standard according to the transferred parameters and storing the necessary data (BWE), the first output of the block choosing a three-dimensional standard according to the transferred parameters and storing the necessary data (BWE) is connected to the second input of the storage device with the parameters of the standards and comparing (ZUP), the second output of the block that selects a three-dimensional standard according to the transferred parameters and stores the necessary data (BWE), is connected to a device for communication with a computer (UKEVM), the third output of the block that selects a three-dimensional standard on transmitted parameters and stores necessary data (BVE), connected to the third input of the recognition unit (BR).