RU2802991C1 - Method for detecting extended linear objects in an image - Google Patents

Method for detecting extended linear objects in an image Download PDF

Info

Publication number
RU2802991C1
RU2802991C1 RU2022135361A RU2022135361A RU2802991C1 RU 2802991 C1 RU2802991 C1 RU 2802991C1 RU 2022135361 A RU2022135361 A RU 2022135361A RU 2022135361 A RU2022135361 A RU 2022135361A RU 2802991 C1 RU2802991 C1 RU 2802991C1
Authority
RU
Russia
Prior art keywords
image
road
road marking
segments
pixel
Prior art date
Application number
RU2022135361A
Other languages
Russian (ru)
Inventor
Екатерина Игоревна Панфилова
Антон Сергеевич Григорьев
Владислав Игоревич Кибалов
Михаил Олегович Чеканов
Олег Сергеевич Шипитько
Андрей Сергеевич Большаков
Original Assignee
Общество с ограниченной ответственностью "ЭвоКарго"
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "ЭвоКарго" filed Critical Общество с ограниченной ответственностью "ЭвоКарго"
Application granted granted Critical
Publication of RU2802991C1 publication Critical patent/RU2802991C1/en

Links

Abstract

FIELD: image processing.
SUBSTANCE: invention relates to methods for selecting extended linear objects in an image and can be widely used in detecting road marking lines to determine its position on a given vector road map by an unmanned vehicle. A method for detecting extended linear objects in an image, which consists in the fact that during the movement of a vehicle (V) from video cameras, images of the roadway are obtained, individual linear objects of road markings are detected on the image using a fast windowed Hough transform. Image filtering for the development of linear objects of road markings is performed by applying a morphological filter "closing" to the image with a radius of the order of the characteristic width of the road marking line. The detected segments are grouped into sets taking into account the constraint on the angle of the break, a group of broken line segments is approximated, the resulting road marking lines in pixel coordinates are recalculated into metric coordinates on the roadway plane relative to the vehicle.
EFFECT: accuracy of recognition of extended linear objects of complex shape in the image.
1 cl, 2 dwg

Description

Изобретение относится к области обработки изображений, а именно к способам выделения протяженных линейных объектов на изображении и может найти широкое применение при детектировании линий дорожной разметки для определения беспилотным транспортным средством своего положения на заданной векторной карте дорог, а также при построении карты дорог по космическим снимкам Земли, поиске дислокаций в кристаллах на отдельных проекциях рентгеновской топо-томографии. The invention relates to the field of image processing, namely to methods for isolating extended linear objects in an image and can be widely used in detecting road marking lines for an unmanned vehicle to determine its position on a given vector road map, as well as in constructing a road map from satellite images of the Earth , searching for dislocations in crystals on individual X-ray topo-tomography projections.

Из области техники известны следующие способы детекции протяженных линейных объектов на изображении.The following methods for detecting extended linear objects in an image are known from the technical field.

Способ обнаружения дорожной полосы, известный из патента RU 2746631, включает получение изображения участка дорожной полосы и его обработку. Полученное изображение одновременно обрабатывается с использованием сверточной нейронной сети и с использованием алгоритма обнаружения дорожной разметки, после этого для двух промежуточных изображений, полученных в результате обработки, параллельно генерируются маски, выполняется взвешенное сложение масок попиксельно и преобразование в вид сверху, формируя итоговую маску, далее выполняется преобразование координат пикселей итоговой маски из системы координат изображения в систему координат транспортного средства, после каждому пикселю итоговой маски присваивается весовой коэффициент, который определяется яркостью соответствующего пикселя, далее полученные пиксели итоговой маски аппроксимируются в полином, определяющий линию середины дорожной полосы, и вычисляется отклонение положения транспортного средства относительно середины дорожной полосы. The method for detecting a road lane, known from patent RU 2746631, includes obtaining an image of a section of a road lane and processing it. The resulting image is simultaneously processed using a convolutional neural network and using a road marking detection algorithm, after which masks are generated in parallel for two intermediate images obtained as a result of processing, a weighted addition of the masks is performed pixel by pixel and conversion to a top view, forming the final mask, then performed transforming the pixel coordinates of the final mask from the image coordinate system into the vehicle coordinate system, after which each pixel of the final mask is assigned a weight coefficient, which is determined by the brightness of the corresponding pixel, then the resulting pixels of the final mask are approximated into a polynomial that defines the line of the middle of the road lane, and the deviation of the position of the vehicle is calculated means relative to the middle of the road lane.

Для применения нейронных сетей с целью обнаружения дорожной разметки необходимо наличие уникальной обучающей выборки изображений, что требует больших затрат времени. Кроме того, при реализации указанного способа детектируется только основная полоса движения, тогда как в некоторых дорожных ситуациях, например, при повороте направо или налево необходимо иметь информацию о количестве полос в текущем направлении и в которой из них находится ТС.To use neural networks to detect road markings, it is necessary to have a unique training sample of images, which requires a lot of time. In addition, when implementing this method, only the main traffic lane is detected, whereas in some traffic situations, for example, when turning right or left, it is necessary to have information about the number of lanes in the current direction and in which of them the vehicle is located.

Известен способ выделения участка дороги из дорожного видеоизображения (CN107977608), который включает в себя определение всех возможных сегментов линии на изображении с помощью преобразования Хафа; группировку обнаруженных сегментов линии в различные типы; извлечение следующих нормализованных признаков всех сегментов линии; выбор оптимальной группы сегментов линии, в которой существует один или более возможных краев дороги; получение краев дороги из M кадров изображения в определенной сцене; вычисление гистограммы распределения краев M кадров изображения для получения основного участка и вспомогательного участка распределения дорог; затем извлечение значения гистограммы в качестве первого характерного значения двух участков распределения; вычисление длин всех линий в участках; использование самой длинной линии в качестве границы дороги непрерывного кадр изображения; и определение площади дорожного покрытия. There is a known method for extracting a road section from a road video image (CN107977608), which includes identifying all possible line segments in the image using the Hough transform; grouping detected line segments into different types; extracting the following normalized features of all line segments; selecting an optimal group of line segments in which one or more possible road edges exist; obtaining road edges from M image frames in a certain scene; calculating a histogram of the distribution of edges of the M image frames to obtain the main portion and the auxiliary portion of the road distribution; then extracting the histogram value as the first characteristic value of the two distribution sections; calculating the lengths of all lines in sections; using the longest line as the road boundary of a continuous image frame; and determination of the road surface area.

В описании указанного способа не раскрыта информация о том, каким образом в процессе выделения набора сегментов линий определяют координаты их начала и конца.The description of this method does not disclose information about how, in the process of selecting a set of line segments, the coordinates of their beginning and end are determined.

Известен способ обнаружения линий дорожного полотна (CN114037970), при котором с видеокамер получают изображения шахматной доски, выполняют внутреннюю эталонную калибровку камеры и получают внутреннюю эталонную матрицу камеры и коэффициент искажения; исправляют полученное изображение дороги в реальном времени, извлекают информацию о краевых признаках скорректированного изображения для получения бинарного изображения и определения интересующей области в соответствии с линией дорожного полотна; преобразуют бинарное изображение к виртуальному виду сверху при помощи виртуального поворота, используют морфологическую фильтрацию для удаления шума двоичного изображения и улучшения информации о линиях дорожного полотна; извлекают координаты точек пикселя левой и правой линий дорожного полотна с помощью метода скользящего окна, а затем применяют метод согласованности случайной выборки для подгонки линий дорожного полотна; извлекают линии дорожного полотна, осуществляют обратное проецирование линий дорожного полотна на скорректированное изображение с использованием преобразования обратной перспективы для визуализации. There is a known method for detecting road lines (CN114037970), in which images of a chessboard are obtained from video cameras, an internal reference calibration of the camera is performed, and the internal reference matrix of the camera and the distortion coefficient are obtained; correct the resulting road image in real time, extract information about the edge features of the corrected image to obtain a binary image and determine the area of interest in accordance with the line of the roadway; transform the binary image to a virtual top view using virtual rotation, use morphological filtering to remove noise from the binary image and improve information about the lines of the roadway; extracting the pixel point coordinates of the left and right road lines using the sliding window method, and then applying the random sampling consistency method to fit the road lines; extracting road lines, back-projecting the road lines onto the corrected image using reverse perspective transformation for rendering.

Недостаток указанного способа заключается в возможности детектирования только основной дорожной полосы, тогда как при планировании движения ТС важно понимать сколько полос на дороге, например, для совершения поворота налево надо перестраиваться в крайний левый ряд.The disadvantage of this method is that it is possible to detect only the main road lane, whereas when planning the movement of a vehicle, it is important to understand how many lanes there are on the road, for example, to make a left turn you need to change lanes to the far left.

Способ, раскрытый в источнике CN114037970, по технической сущности является наиболее близким к заявляемому изобретению и может выступать в качестве прототипа.The method disclosed in source CN114037970, in technical essence, is closest to the claimed invention and can act as a prototype.

Задачей, на решение которой направлено заявленное изобретение, является создание способа детекции протяженных линейных объектов на изображении в виде ломанных с ограничением на угол излома и протяженность искомых границ, обеспечивающий возможность точного выделения линейных объектов разнообразной формы - прямолинейных, дугообразных, окружностей, множественных параллельных прямых, априорно не задавая сведений о предполагаемом месте прохождения границ на изображении и их количестве.The problem to be solved by the claimed invention is the creation of a method for detecting extended linear objects in an image in the form of broken lines with restrictions on the angle of break and the extent of the desired boundaries, providing the ability to accurately identify linear objects of various shapes - rectilinear, arc-shaped, circles, multiple parallel straight lines, a priori without specifying information about the expected location of the boundaries in the image and their number.

Технический результат заявленного изобретения заключается в повышении точности распознавания протяженных линейных объектов сложной формы на изображении.The technical result of the claimed invention is to increase the accuracy of recognition of extended linear objects of complex shape in the image.

Технический результат достигается за счет осуществления способа детекции протяженных линейных объектов на изображении, при котором в процессе движения транспортного средства (ТС) с видеокамер получают изображения дорожного полотна, полученное изображение приводят к виртуальному виду сверху при помощи виртуального поворота, осуществляют фильтрацию изображения для проявления линейных объектов дорожной разметки при помощи морфологического фильтра, на изображении выполняют детектирование отдельных линейных объектов дорожной разметки с использованием быстрого оконного преобразования Хафа.The technical result is achieved by implementing a method for detecting extended linear objects in an image, in which, while a vehicle is moving, images of the roadway are obtained from video cameras, the resulting image is converted to a virtual top view using virtual rotation, and the image is filtered to reveal linear objects road markings using a morphological filter; individual linear road marking objects are detected in the image using the fast windowed Hough transform.

Особенность предлагаемого способа заключается в том, что фильтрацию изображения для проявления линейных объектов дорожной разметки выполняют посредством того, что к изображению применяют морфологический фильтр «замыкание» с радиусом порядка характерной ширины линии дорожной разметки, применяют морфологический фильтр «размыкание» с радиусом больше характерной ширины линий дорожной разметки, получают изображение дорожной разметки путем осуществления операции попиксельного вычитания изображений, полученных с применением морфологических фильтров «замыкание» и «размыкание», осуществляют редукцию каналов изображения дорожной разметки путем выполнения операции попиксельного максимума между каналами для получения одноканального изображения дорожной разметки, с целью детекции отдельных линий дорожной разметки к полученному одноканальному изображению применяют оконное быстрое преобразование Хафа, детектированные отрезки группируют в множества с учетом ограничения на угол излома, аппроксимируют группу отрезков ломаной, полученные линии дорожной разметки в пиксельных координатах пересчитывают в метрические координаты на плоскости дорожного полотна относительно ТС с использованием параметров калибровки видеокамеры.The peculiarity of the proposed method is that image filtering for the manifestation of linear road marking objects is performed by applying a “closure” morphological filter with a radius of the order of the characteristic width of the road marking line to the image, and applying a “opening” morphological filter with a radius greater than the characteristic width of the lines road markings, obtain an image of road markings by performing a pixel-by-pixel subtraction of images obtained using morphological filters “closure” and “opening”, reduce the channels of the road markings image by performing a pixel-by-pixel maximum operation between channels to obtain a single-channel image of road markings, for the purpose of detection of individual road marking lines, a windowed fast Hough transform is applied to the resulting single-channel image, the detected segments are grouped into sets taking into account the constraint on the bend angle, a group of segments of a polyline is approximated, the resulting road marking lines in pixel coordinates are converted into metric coordinates on the plane of the roadway relative to the vehicle using camera calibration parameters.

На фиг.1 представлены примеры изображений, получаемых при пошаговой реализации заявленного способа детекции протяженных линейных объектов, где а - изображение дорожной разметки с нечетко выраженными границами в результате применения операции попиксельного вычитания изображений, полученных с применением морфологических фильтров «замыкание» и «размыкание», б - изображение, получаемое в результате применения быстрого оконного преобразования Хафа, в - изображение, получаемое в результате группировки детектированных отрезков, г - изображение, получаемое в результате аппроксимации групп отрезков ломанными. Figure 1 shows examples of images obtained by step-by-step implementation of the claimed method for detecting extended linear objects, where a is an image of road markings with vaguely defined boundaries as a result of applying the operation of pixel-by-pixel subtraction of images obtained using morphological filters “closure” and “opening”, b - image obtained as a result of applying the fast windowed Hough transform, c - image obtained as a result of grouping detected segments, d - image obtained as a result of approximating groups of segments with broken lines.

На фиг.2 представлена схема определения переходного угла φ между отрезками u, v, k.Figure 2 shows a diagram for determining the transition angle φ between the segments u , v , k .

Способ детекции протяженных линейных объектов, включающий захват видеоизображения и его обработку вычислительным блоком, осуществляется с помощью установки в транспортное средство, по крайней мере, одной видеокамеры, соединенной с указанным вычислительным блоком, снабженным модулем высокой производительности, например, промышленный компьютер марки Nuvo-5000 на базе архитектуры amd64. A method for detecting extended linear objects, including capturing a video image and processing it by a computing unit, is carried out by installing at least one video camera in a vehicle connected to the specified computing unit equipped with a high-performance module, for example, an industrial computer of the Nuvo-5000 brand on based on amd64 architecture.

Заявленный способ детекции протяженных линейных объектов, в предпочтительном варианте, реализуется следующим образом (фиг. 1, а - г).The claimed method for detecting extended linear objects, in the preferred embodiment, is implemented as follows (Fig. 1, a - d ).

Видеокамеру устанавливают и фиксируют на ТС, выполняют калибровочную процедуру, в результате чего получают внутренние параметры (фокусное расстояние, размер пикселя, коэффициенты дисторсии) и внешние параметры (трехмерное смещение и поворот видеокамеры относительно ТС), при этом поддерживают динамическую калибровку, при которой внешние параметры (в частности, трехмерный поворот видеокамеры относительно ТС) меняются во времени и оцениваются каким-либо способом, известным из уровня техники (например, основанным на инерциальных датчиках, камерах, лидарах или любом сочетании данных сенсоров).The video camera is installed and fixed on the vehicle, a calibration procedure is performed, as a result of which internal parameters (focal length, pixel size, distortion coefficients) and external parameters (three-dimensional displacement and rotation of the video camera relative to the vehicle) are obtained, while dynamic calibration is supported, in which the external parameters (in particular, the three-dimensional rotation of the video camera relative to the vehicle) change over time and are estimated in some way known from the prior art (for example, based on inertial sensors, cameras, lidars, or any combination of these sensors).

В процессе движения транспортного средства (ТС) с видеокамер получают изображения дорожного полотна, полученное изображение приводят к виртуальному виду сверху при помощи виртуального поворота, исправляют дисторсию RGB-изображения.While the vehicle is moving, images of the road surface are obtained from video cameras, the resulting image is converted to a virtual top view using virtual rotation, and the distortion of the RGB image is corrected.

В блоке управления осуществляют фильтрацию изображения для проявления линейных объектов дорожной разметки при помощи морфологических фильтров «замыкание» и «размыкание», которые определяют через базовые морфологические фильтры.In the control unit, the image is filtered to display linear objects of road markings using morphological filters “closure” and “opening”, which are determined through basic morphological filters.

Пусть RGB изображение определяют как I, при этом - разбиение изображения I на каналы R, G и B соответственно. Let the RGB image be defined as I, while - splitting image I into channels R, G and B, respectively.

Введем обозначение - регион изображения I размера , левый верхний угол которого имеет координаты (x, y).Let us introduce the notation - image region size I , the upper left corner of which has coordinates (x, y).

Тогда, базовые морфологические фильтры, через которые определяют морфологические фильтры «замыкание» и «размыкание» имеют вид:Then, the basic morphological filters through which the “closure” and “opening” morphological filters are determined have the form:

- морфологический фильтр «Наращивание»- morphological filter “Building”

Обозначим - результат применения морфологического фильтра «наращивание» c регионом наращивания размера w на h. Let's denote - the result of applying the morphological filter “increasing” with an increasing region of size w by h.

Тогда для Then for

- морфологический фильтр «Сужение»- morphological filter “Narrowing”

Обозначим - результат применения морфологического фильтра «сужение» c регионом сужения размера w на h.Let's denote - the result of applying the morphological filter “narrowing” with a narrowing region of size w by h.

Тогда для Then for

. .

Тогда, морфологические фильтры «замыкание» и «размыкание» изображения выражают через базовые морфологические фильтры следующим образом:Then, the morphological filters “closure” and “opening” of the image are expressed through basic morphological filters as follows:

- морфологическое «замыкание» изображения; - morphological “closure” of the image;

- морфологическое «размыкание» изображения. - morphological “unlocking” of the image.

Затем, получают изображение дорожной разметки путем осуществления операции попиксельного вычитания изображений, полученных с применением морфологических фильтров «замыкание» и «размыкание» (фиг.1, а):Then, an image of road markings is obtained by performing the operation of pixel-by-pixel subtraction of images obtained using the morphological filters “closure” and “opening” (Fig. 1, a ):

, ,

где r1 - характерная ширина дорожной разметки в пикселях, r2 - значение большее характерной ширины дорожной разметки в пикселях.where r 1 is the characteristic width of the road markings in pixels, r 2 is a value greater than the characteristic width of the road markings in pixels.

Затем, осуществляют редукцию каналов изображения дорожной разметки путем выполнения операции попиксельного максимума между каналами для получения одноканального изображения дорожной разметки.Then, the reduction of the road marking image channels is carried out by performing a pixel-by-pixel maximum operation between the channels to obtain a single-channel road marking image.

Пусть - трехканальное изображение. Обозначим - значения пикселя на изображении . Обозначим результат редукции каналов путем попиксельного максимума, как . - одноканальное изображение, такое что .Let - three-channel image. Let's denote - pixel values in the image . Let us denote the result of channel reduction by pixel-by-pixel maximum as . - single-channel image, such that .

С целью детекции отдельных линий дорожной разметки к полученному одноканальному изображению применяют оконное быстрое преобразование Хафа, при котором изображение разбивают на квадратные фрагменты с одинаковой площадью перекрытия, к каждому выделенному фрагменту изображения применяют быстрое преобразование Хафа (БПХ), осуществляют поиск отрезков на изображении.In order to detect individual road marking lines, a windowed fast Hough transform is applied to the resulting single-channel image, in which the image is divided into square fragments with the same overlap area, a fast Hough transform (FHT) is applied to each selected image fragment, and segments in the image are searched.

Затем, полученные отрезки группируют в неупорядоченные множества с учетом ограничения ломаных на угол излома; в каждой из групп определяется порядок обхода, группа аппроксимируется ломаной и проходит проверку на протяженность.Then, the resulting segments are grouped into unordered sets, taking into account the restriction of broken lines on the break angle; in each of the groups the order of traversal is determined, the group is approximated by a broken line and is checked for length.

На этапе поиска отрезков на изображении (фиг.1, б) выделенный фрагмент исходного изображения будет считаться входным изображением для БПХ. Результат быстрого преобразования Хафа - одноканальное изображение, называемое Хаф-образом.At the stage of searching for segments in the image (Fig. 1, b ), the selected fragment of the original image will be considered the input image for the FPC. The result of the fast Hough transform is a single-channel image called the Hough image.

Каждый пиксель полученного Хаф-образа, параметризованный как (s, t), содержит сумму вдоль линии входного изображения, заданной точками пересечения с противоположными краями изображения (s,0) и (s+ t, n), где s – целочисленный сдвиг паттерна, а t – целочисленный наклон.Each pixel of the resulting Hough image, parameterized as (s, t), contains the sum along the line of the input image defined by the intersection points with the opposite edges of the image (s,0) and (s+ t, n), where s is the integer shift of the pattern, and t – integer slope.

Таким образом, в каждой строке t полученного Хаф-образа содержатся суммы вдоль всех отрезков с наклоном величины t. Для поиска контрастного отрезка, соответствующего линии дорожной разметки, необходимо выделить такую строку Хаф-образа, дисперсия которой была бы наибольшей, то есть выбирают наклон, для которого разброс сумм яркости вдоль отрезков наибольший, и при этом дисперсия должна превышать некоторое заданное пороговое значение. Тогда, точка из этой строки с максимальным значением интегральной яркости и будет соответствовать наиболее контрастному отрезку относительно фона в заданном окне.Thus, each row t of the resulting Hough image contains sums along all segments with a slope of t. To search for a contrast segment corresponding to a road marking line, it is necessary to select a line of the Hough image whose dispersion would be the greatest, that is, select the slope for which the dispersion of the sums of brightness along the segments is greatest, and at the same time the dispersion must exceed a certain specified threshold value. Then, the point from this line with the maximum integral brightness value will correspond to the most contrasting segment relative to the background in a given window.

На этапе группировки отрезков (фиг.1, в) осуществляют попарный перебор отрезков, при котором пару отрезков считают принадлежащими одной границе, если выполняются следующие условия:At the stage of grouping segments (Fig. 1, c ), a pairwise search of segments is carried out, in which a pair of segments is considered to belong to the same boundary if the following conditions are met:

1. Расстояние между отрезками меньше ;1. The distance between the segments is smaller ;

2. Угол между отрезками лежит в диапазоне .2. The angle between the segments lies in the range .

Необходимо отметить, что расстояние между отрезками определяется как расстояние между ближайшими на отрезках точками, а угол между отрезками – как угол между двумя лучами, выходящими из точки пересечения отрезков к их наиболее удаленным концам. Для непересекающихся отрезков такой угол доопределяется параллельным переносом отрезков до совпадения двух ближайших концов в одной вершине. It should be noted that the distance between segments is defined as the distance between the nearest points on the segments, and the angle between the segments is defined as the angle between two rays emanating from the intersection point of the segments to their most distant ends. For non-intersecting segments, this angle is further determined by parallel translation of the segments until the two closest ends coincide at one vertex.

Таким образом, формируют множество отрезков, найденных в результате быстрого оконного преобразования Хафа, для которых выполняются вышеприведенные условия 1 и 2 (по расстоянию между отрезками и углу между ними).Thus, a set of segments are formed, found as a result of the fast windowed Hough transform, for which the above conditions 1 and 2 are met (in terms of the distance between the segments and the angle between them).

Группировка отрезков, которые по сути являются вершинами графа G= (V, E), где V - множество отрезков по результатам быстрого оконного преобразования Хафа, осуществляется с помощью известного из уровня техники алгоритма поиска компонент связности в графе.The grouping of segments, which are essentially the vertices of the graph G= (V, E), where V is the set of segments according to the results of the fast windowed Hough transform, is carried out using a well-known prior art algorithm for searching for connected components in the graph.

В процессе выполнения аппроксимации групп отрезков ломанными (фиг.1, г) все границы на изображении разделяют на разомкнутые прямолинейные и криволинейные границы и окружности. Последнее характерно для изображений дорожной разметки на круговом движении. Аппроксимация группы отрезков делится соответственно на аппроксимацию одиночным прямолинейным сегментом (ломаной с одним звеном) и аппроксимацию ломаной с более чем одним звеном (окружности тоже аппроксимируются ломаной, начало и конец которой совпадают). Для каждого результата аппроксимации вычисляется протяженность ломаной или сегмента как сумма расстояний между вершинами. Если вычисленная протяженность превосходит заданную, то результат подается на выход алгоритма. Для случая приближения группы отрезков одиночным прямолинейным сегментом ищется пара наиболее удаленных точек среди всех концов отрезков в группе. Эта пара точек задает координаты концов сегмента. Далее для всех остальных концов отрезков в группе проверяется их близость до образованного сегмента через расстояние от конкретной точки до построенного сегмента. Если доля близких точек велика, то линия разметки считается прямолинейной, а полученный сегмент – ее аппроксимацией.In the process of approximating groups of segments with broken lines (Fig. 1, d ), all boundaries in the image are divided into open rectilinear and curvilinear boundaries and circles. The latter is typical for images of road markings on a roundabout. The approximation of a group of segments is divided, respectively, into approximation by a single straight line segment (a broken line with one link) and approximation by a broken line with more than one link (circles are also approximated by a broken line, the beginning and end of which coincide). For each approximation result, the length of the polyline or segment is calculated as the sum of the distances between the vertices. If the calculated length exceeds the specified one, then the result is sent to the output of the algorithm. For the case of approximating a group of segments with a single straight line segment, a pair of the most distant points is sought among all ends of the segments in the group. This pair of points specifies the coordinates of the ends of the segment. Next, for all other ends of the segments in the group, their proximity to the formed segment is checked through the distance from a specific point to the constructed segment. If the proportion of close points is large, then the marking line is considered rectilinear, and the resulting segment is its approximation.

Если приблизить одиночным прямолинейным сегментом не удалось, то осуществляется аппроксимация группы отрезков ломанной. If it was not possible to approximate with a single straight segment, then a group of segments of a broken line is approximated.

Напомним, что группа отрезков также является компонентой связности графа G. Обозначим ее граф .Recall that the group of segments is also a connected component of the graph G. Let us denote its graph .

Назовем переходным углом между тремя вершинами-отрезками и – угол образованный лучами, выходящими из середины одного из отрезков и проходящими через середины двух других (фиг.2).Let's call the transition angle between three vertices-segments And – the angle formed by rays coming out from the middle of one of the segments and passing through the middles of the other two (Fig. 2).

Осуществляют поиск в компоненте связности такой путь, что все переходные углы между тремя последовательными вершинами в пути удовлетворяют вышеприведенному условию 2 по углу между отрезками, а также этот путь был бы максимальной протяженности. Perform a search in the connectivity component such a path that all transition angles between three consecutive vertices in the path satisfy the above condition 2 on the angle between the segments, and this path would also be of maximum length.

Для этого проверяют, что у каждой тройки вершин , имеется такой обход тройки по существующим ребрам , что переходный угол при обходе удовлетворяет вышеприведенному условию 2. To do this, check that each trio of vertices , there is such a traversal of the triple along existing edges , that the transition angle when going around satisfies the above condition 2.

Если же такой обход не удовлетворяет условию 2 и , то добавим ребро в , если и при этом новый обход или удовлетворяет ограничению на переходный угол, то есть условию 2.If such a bypass does not satisfy condition 2 and , then add an edge V , If and at the same time a new detour or satisfies the transition angle constraint, that is, condition 2.

Для поиска порядка обхода всех отрезков будем использовать алгоритм Флойда. Для этого присвоим вес каждому ребру (u, v), равный расстоянию между самыми удаленными концами отрезков u, v. Выходом алгоритма будет матрица кратчайших путей D между всеми парами вершин и матрица P, хранящая информацию о номерах фаз, на которых было получено кратчайшее расстояние между парами вершин. Далее из всех кратчайших путей выбирается путь, значение которого максимально. Если выбор максимального пути не однозначен (максимальные значения близки в пределах заданной погрешности), то выбирается максимальный путь с минимальным количеством пройденных вершин. Далее, с использованием информации о фазах P восстанавливается обход вершин-отрезков.To find the order of traversal of all segments, we will use Floyd's algorithm. To do this, we assign a weight to each edge ( u , v ) equal to the distance between the most distant ends of the segments u, v. The output of the algorithm will be a matrix of shortest paths D between all pairs of vertices and a matrix P storing information about the numbers of phases at which the shortest distance between pairs of vertices was obtained. Next, from all the shortest paths, the path whose value is maximum is selected. If the choice of the maximum path is not unambiguous (the maximum values are close within a given error), then the maximum path with the minimum number of traversed vertices is selected. Next, using information about the phases P, the traversal of the vertices-segments is restored.

Ввиду особенностей вычислений, описанный выше алгоритм ищет только разомкнутые прямолинейные и криволинейные границы. Результатом аппроксимации группы отрезков, покрывающих окружность, будет ломаная, соответствующая только половине окружности. Это связано с тем, что полный обход окружности будет иметь в полученной матрице D минимальное значение (так как кратчайшее расстояние между началом и концом будет равно нулю), а обход половины – максимальное. Поэтому из концов выбранного пути ищется альтернативный путь, используя предварительно подсчитанную матрицу Флойда. Если такой путь существует, и он не имеет общих вершин с предварительно найденным путем (за исключением начала и конца), то эти пути объединяются в один. Далее, когда порядок обхода отрезков найден, строится ломаная, вершины которой – точки пересечения или ближайшие концы соседних в пути отрезков, если отрезки не пересекаются. Due to the peculiarities of calculations, the algorithm described above searches only for open straight and curved boundaries. The result of approximating a group of segments covering a circle will be a broken line corresponding to only half of the circle. This is due to the fact that a complete traversal of the circle will have a minimum value in the resulting matrix D (since the shortest distance between the beginning and the end will be zero), and a half traversal will have a maximum value. Therefore, an alternative path is searched from the ends of the selected path using the pre-calculated Floyd matrix. If such a path exists and it does not have common vertices with the previously found path (except for the beginning and end), then these paths are combined into one. Next, when the order of traversing the segments is found, a broken line is constructed, the vertices of which are the points of intersection or the nearest ends of segments adjacent in the path, if the segments do not intersect.

По результатам выполнения аппроксимации групп отрезков ломанными полученные линии дорожной разметки в пиксельных координатах в каждый момент времени пересчитывают в метрические двумерные координаты (x, y) в плоскости дорожного полотна относительно ТС с использованием параметров калибровки видеокамеры.Based on the results of approximating groups of segments with broken lines, the resulting road marking lines in pixel coordinates at each moment in time are recalculated into metric two-dimensional coordinates (x, y) in the plane of the road surface relative to the vehicle using the calibration parameters of the video camera.

Claims (1)

Способ детекции протяженных линейных объектов на изображении, при котором в процессе движения транспортного средства (ТС) с видеокамер получают изображения дорожного полотна, полученное изображение приводят к виртуальному виду сверху, в блоке управления осуществляют фильтрацию изображения для проявления линейных объектов дорожной разметки, на изображении выполняют детектирование отдельных линейных объектов дорожной разметки с использованием быстрого оконного преобразования Хафа, отличающийся тем, что фильтрацию изображения для проявления линейных объектов дорожной разметки выполняют посредством того, что к изображению применяют морфологический фильтр «замыкание» с радиусом порядка характерной ширины линии дорожной разметки, применяют морфологический фильтр «размыкание» с радиусом больше характерной ширины линий дорожной разметки, получают изображение дорожной разметки путем осуществления операции попиксельного вычитания изображений, полученных с применением морфологических фильтров «замыкание» и «размыкание», осуществляют редукцию каналов изображения дорожной разметки путем выполнения операции попиксельного максимума между каналами для получения одноканального изображения дорожной разметки, с целью детекции отдельных линий дорожной разметки к полученному одноканальному изображению применяют оконное быстрое преобразование Хафа, детектированные отрезки группируют во множества с учетом ограничения на угол излома, аппроксимируют группу отрезков ломаной, полученные линии дорожной разметки в пиксельных координатах пересчитывают в метрические координаты на плоскости дорожного полотна относительно ТС.A method for detecting extended linear objects in an image, in which, while a vehicle is moving, images of the road surface are obtained from video cameras, the resulting image is converted to a virtual top view, the image is filtered in the control unit to reveal linear objects of road markings, detection is performed on the image individual linear road marking objects using the fast windowed Hough transform, characterized in that the image filtering for the manifestation of linear road marking objects is performed by applying a morphological filter “closure” with a radius of the order of the characteristic width of the road marking line to the image; opening" with a radius greater than the characteristic width of the road marking lines, obtain a road marking image by performing the operation of pixel-by-pixel subtraction of images obtained using the morphological filters "closure" and "opening", reduce the channels of the road marking image by performing a pixel-by-pixel maximum operation between the channels to obtain single-channel image of road markings, in order to detect individual road marking lines, a windowed fast Hough transform is applied to the resulting single-channel image, the detected segments are grouped into sets taking into account the constraint on the break angle, the group of segments is approximated by a polyline, the resulting road marking lines in pixel coordinates are converted into metric coordinates on the plane of the roadway relative to the vehicle.
RU2022135361A 2022-12-30 Method for detecting extended linear objects in an image RU2802991C1 (en)

Publications (1)

Publication Number Publication Date
RU2802991C1 true RU2802991C1 (en) 2023-09-05

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2470376C2 (en) * 2011-03-04 2012-12-20 Общество С Ограниченной Ответственностью "Технологии Распознавания" Method to detect distance from speed metre video camera to vehicle (versions)
US20140169675A1 (en) * 2004-12-03 2014-06-19 Google Inc. Method and system for character recognition
RU2693267C1 (en) * 2018-10-23 2019-07-01 Акционерное общество Научно-производственное предприятие "Авиационная и Морская Электроника" Method of recognizing objects on an image
AU2020102039A4 (en) * 2020-08-28 2020-10-08 Peng, Yue Miss A high-precision multi-targets visual detection method in automatic driving scene
CN114037970A (en) * 2021-11-19 2022-02-11 中国重汽集团济南动力有限公司 Sliding window-based lane line detection method, system, terminal and readable storage medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140169675A1 (en) * 2004-12-03 2014-06-19 Google Inc. Method and system for character recognition
RU2470376C2 (en) * 2011-03-04 2012-12-20 Общество С Ограниченной Ответственностью "Технологии Распознавания" Method to detect distance from speed metre video camera to vehicle (versions)
RU2693267C1 (en) * 2018-10-23 2019-07-01 Акционерное общество Научно-производственное предприятие "Авиационная и Морская Электроника" Method of recognizing objects on an image
AU2020102039A4 (en) * 2020-08-28 2020-10-08 Peng, Yue Miss A high-precision multi-targets visual detection method in automatic driving scene
CN114037970A (en) * 2021-11-19 2022-02-11 中国重汽集团济南动力有限公司 Sliding window-based lane line detection method, system, terminal and readable storage medium

Similar Documents

Publication Publication Date Title
CN107679520B (en) Lane line visual detection method suitable for complex conditions
CN110569704B (en) Multi-strategy self-adaptive lane line detection method based on stereoscopic vision
US10477178B2 (en) High-speed and tunable scene reconstruction systems and methods using stereo imagery
CN105426861B (en) Lane line determines method and device
CN110599537A (en) Mask R-CNN-based unmanned aerial vehicle image building area calculation method and system
CN111079556A (en) Multi-temporal unmanned aerial vehicle video image change area detection and classification method
CN108596975B (en) Stereo matching algorithm for weak texture region
US7127104B2 (en) Vectorized image segmentation via trixel agglomeration
JP6111745B2 (en) Vehicle detection method and apparatus
CN104754182B (en) High-resolution based on adaptive motion filtering is taken photo by plane the steady phase method of video
CN112084869A (en) Compact quadrilateral representation-based building target detection method
CN112906583B (en) Lane line detection method and device
CN106096497B (en) A kind of house vectorization method for polynary remotely-sensed data
KR20050002612A (en) Depth measuring method and depth measuring apparatus
CN112164117A (en) V-SLAM pose estimation method based on Kinect camera
CN104851089A (en) Static scene foreground segmentation method and device based on three-dimensional light field
CN104978738A (en) Method of detection of points of interest in digital image
EP4066162A1 (en) System and method for correspondence map determination
CN113673444B (en) Intersection multi-view target detection method and system based on angular point pooling
RU2802991C1 (en) Method for detecting extended linear objects in an image
CN114241436A (en) Lane line detection method and system for improving color space and search window
CN109801281B (en) Method for detecting edges of normalized straight-line segments of non-textured metal part images
Kaske et al. Chi-square fitting of deformable templates for lane boundary detection
CN111062384A (en) Vehicle window accurate positioning method based on deep learning
CN116385477A (en) Tower image registration method based on image segmentation