RU2777493C2 - Method for determination of total cloud score by color digital wide-angle images of visible sky hemisphere based on statistical data processing methods - Google Patents

Method for determination of total cloud score by color digital wide-angle images of visible sky hemisphere based on statistical data processing methods Download PDF

Info

Publication number
RU2777493C2
RU2777493C2 RU2020142879A RU2020142879A RU2777493C2 RU 2777493 C2 RU2777493 C2 RU 2777493C2 RU 2020142879 A RU2020142879 A RU 2020142879A RU 2020142879 A RU2020142879 A RU 2020142879A RU 2777493 C2 RU2777493 C2 RU 2777493C2
Authority
RU
Russia
Prior art keywords
sky
score
statistical
visible
images
Prior art date
Application number
RU2020142879A
Other languages
Russian (ru)
Other versions
RU2020142879A (en
Inventor
Михаил Алексеевич Криницкий
Сергей Константинович Гулёв
Original Assignee
Федеральное государственное бюджетное учреждение науки Институт океанологии им. П.П. Ширшова РАН
Filing date
Publication date
Application filed by Федеральное государственное бюджетное учреждение науки Институт океанологии им. П.П. Ширшова РАН filed Critical Федеральное государственное бюджетное учреждение науки Институт океанологии им. П.П. Ширшова РАН
Publication of RU2020142879A publication Critical patent/RU2020142879A/en
Application granted granted Critical
Publication of RU2777493C2 publication Critical patent/RU2777493C2/en

Links

Images

Abstract

FIELD: meteorology.
SUBSTANCE: invention relates to the field of meteorology; it can be used for the determination of the total cloud score. A digital photo of the visible sky hemisphere is converted into a vector of values, called a feature description, containing statistical characteristics of color channels, brightness, color tone, and intensity of the color tome of image points. A statistical model of a machine learning class is applied to the resulting vector to obtain a value of the total cloud score.
EFFECT: increase in the accuracy of determination of the total cloud score.
4 cl, 1 tbl, 3 dwg

Description

Изобретение относится к области метеорологии и касается способа определения метеорологических характеристик, а именно определения балла общей облачности. Указанные характеристики определяют по данным цифровой широкоугольной оптической полутоновой фотографии видимой полусферы небосвода. Фотография преобразуется в вектор значений - признаковое описание, содержащий статистические характеристики цветовых каналов, яркости, цветового тона и насыщенности цветового тона точек изображения, называемых признаковым описанием снимка. Для определения балла общей облачности применяются статистические методы обработки данных, представленных в виде признакового описания. Метод включает в себя три этапа. На первом этапе проводится сбор снимков с известными значениями балла общей облачности; вычисление признакового описания для полученных снимков; а также фильтрация выбросов с применением кластерного анализа и оценки плотности распределения значений признаков признакового описания фотографий. На втором этапе формулируется статистическая модель из класса моделей машинного обучения, предназначенная для решения задачи классификации снимков по классам балла общей облачности. Сформулированную модель настраивают по данным собранной на первом этапе выборки. На третьем этапе для вновь получаемых фотографий видимой полусферы неба вычисляют признаковое описание. К полученному признаковому описанию применяют статистическую модель, настроенную на определение балла общей облачности. Изобретение позволяет повысить точность определения балла общей облачности.The invention relates to the field of meteorology and relates to a method for determining meteorological characteristics, namely, determining the total cloudiness score. These characteristics are determined according to digital wide-angle optical grayscale photography of the visible hemisphere of the sky. The photo is converted into a vector of values - an indicative description containing the statistical characteristics of color channels, brightness, hue and saturation of the hue of the image points, called the indicative description of the image. To determine the overall cloudiness score, statistical methods are used to process data presented in the form of a feature description. The method includes three stages. At the first stage, images with known values of the total cloudiness score are collected; calculation of an indicative description for the obtained images; as well as filtering outliers using cluster analysis and estimating the distribution density of the values of features of the feature description of photographs. At the second stage, a statistical model is formulated from the class of machine learning models, designed to solve the problem of classifying images by classes of total cloudiness. The formulated model is adjusted according to the data collected at the first stage of the sample. At the third stage, a feature description is calculated for the newly obtained photographs of the visible hemisphere of the sky. A statistical model is applied to the obtained indicative description, tuned to determine the total cloudiness score. EFFECT: invention improves the accuracy of determining the total cloudiness score.

Облачность является основной характеристикой состояния атмосферы, ограничивающей потоки коротковолновой и длинноволновой солнечной радиации на поверхность океана и суши. Одна из ключевых характеристик облачности в метеорологических наблюдениях - балл общей облачности. Наблюдение характеристик облачного покрова является важнейшей задачей океанологии и метеорологии.Cloudiness is the main characteristic of the state of the atmosphere, which limits the fluxes of short-wave and long-wave solar radiation to the surface of the ocean and land. One of the key characteristics of cloudiness in meteorological observations is the total cloudiness score. Observation of cloud cover characteristics is the most important task of oceanology and meteorology.

При этом наблюдения облачности - один из самых сложных и субъективных процессов в метеорологии. Это связано с большим разнообразием типов облачности, с изменчивостью облачного покрытия во времени, а также с сильной неоднородностью оптических характеристик облаков. В процессе трансформации во времени облака одного типа могут переходить в другие, оптическая плотность может меняться, могут возникать новые облачные структуры и исчезать существующие. Эти обстоятельства сильно затрудняют и замедляют идентификацию облаков.At the same time, cloud observations are one of the most complex and subjective processes in meteorology. This is due to the large variety of cloud types, the variability of cloud cover over time, and the strong inhomogeneity of the optical characteristics of clouds. In the process of transformation in time, clouds of one type can pass into others, the optical density can change, new cloud structures can appear and existing ones disappear. These circumstances greatly complicate and slow down the identification of clouds.

Настоящий метод относится к области метеорологии и касается способа определения балла общей облачности по данным цветных широкоугольных снимков видимой полусферы небосвода, с применением современных статистических методов обработки данных.This method relates to the field of meteorology and concerns a method for determining the total cloudiness score from color wide-angle images of the visible hemisphere of the sky, using modern statistical data processing methods.

В настоящий момент известно несколько методов определения балла общей облачности (далее БОО) по цветным цифровым широкоугольным снимкам видимой полусферы небосвода [1-10]. В частности, известны три способа, описываемые в патентах №№2331853 «Устройство распознавания форм облачности», 2525625 «Способ определения балла облачности» и 2589463 «Устройство для определения общего балла облачности на основе прямых цифровых широкоугольных снимков видимой полусферы неба». Все упомянутые методы заключаются в преобразовании исходного оптического цифрового широкоугольного снимка видимого небосвода в бинарное изображение, в каждой точке которого формируется признак отнесения этой точки к классу «ОБЛАКО» или «ЯСНОЕ НЕБО». В каждом описанном способе преобразование производится по-разному, однако ни один из перечисленных методов не позволяет определять БОО с достаточной точностью. Проведенная в рамках исследования [11] оценка качества существующих методов показывает, что стандартное отклонение оценок БОО в перечисленных методах не ниже 2 баллов [11] по 8-бальной шкале (где 0 баллов соответствует ясному небу, 8 баллов соответствует небу, полностью закрытому облачностью). При этом доля снимков, классифицированных с ошибкой не более чем 1 балл, не превышает 62%, а доля верно классифицированных снимков не превышает 30%.Currently, there are several methods for determining the total cloudiness score (hereinafter referred to as TCC) from color digital wide-angle images of the visible hemisphere of the sky [1-10]. In particular, three methods are known, described in patents No. 2331853 "Device for recognizing cloud forms", 2525625 "Method for determining the cloudiness score" and 2589463 "Device for determining the total cloudiness score based on direct digital wide-angle images of the visible hemisphere of the sky". All of the above methods consist in converting the original optical digital wide-angle image of the visible sky into a binary image, at each point of which a sign is formed that this point belongs to the CLOUD or CLEAR SKY class. In each method described, the transformation is performed differently, however, none of the listed methods allows one to determine the BOO with sufficient accuracy. The assessment of the quality of existing methods carried out in the framework of the study [11] shows that the standard deviation of BOO estimates in the listed methods is not lower than 2 points [11] on an 8-point scale (where 0 points corresponds to a clear sky, 8 points corresponds to a sky completely covered by clouds) . At the same time, the proportion of images classified with an error of no more than 1 point does not exceed 62%, and the proportion of correctly classified images does not exceed 30%.

Предлагаемый метод определения балла общей облачности отличается от существующих применением современных статистических многопараметрических и непараметрических методов для обработки снимков видимой полусферы небосвода. Техническим результатом изобретения является существенное увеличение точности определения балла общей облачности. В частности, доля снимков, классифицированных с ошибкой не более чем 1 балл, составляет 39%, в то время как доля верно классифицированных снимков составляет 74,5%.The proposed method for determining the total cloudiness score differs from the existing ones by using modern statistical multi-parametric and non-parametric methods for processing images of the visible hemisphere of the sky. The technical result of the invention is a significant increase in the accuracy of determining the score of total cloudiness. In particular, the proportion of images classified with an error of no more than 1 point is 39%, while the proportion of correctly classified images is 74.5%.

В данном описании используются следующие термины:In this description, the following terms are used:

Снимок - цифровой цветной широкоугольный снимок видимой полусферы небосвода, получаемый специальной оптической камерой, например, описываемой в [4], [5], [7] или [11]. Предполагается, что снимки производятся в светлое время суток, когда изображение отражает визуальную сцену с наблюдаемыми на ней облаками. Примеры снимков приведены на Фиг. 1.Image - a digital color wide-angle image of the visible hemisphere of the sky, obtained by a special optical camera, for example, described in [4], [5], [7] or [11]. It is assumed that the images are taken during daylight hours, when the image reflects a visual scene with clouds observed on it. Examples of pictures are shown in Fig. one.

Облачная камера - специальная оптическая камера, например, подобная описываемым в [4], [5], [7] или [11], предоставляющая возможность проводить оптическую цифровую съемку видимой полусферы небосвода; Балл общей облачности (БОО) - характеристика наблюдаемой облачной ситуации, оцениваемая согласно рекомендациям Всемирной Метеорологической Организации [12] как доля небосвода, занятая облаками, в баллах от 0 до 8, где 0 баллов соответствует ясному небу, 8 баллов - небу, полностью закрытому облаками;Cloud camera - a special optical camera, for example, similar to those described in [4], [5], [7] or [11], which makes it possible to conduct optical digital survey of the visible hemisphere of the sky; Total cloudiness score (CLO) - a characteristic of the observed cloudy situation, estimated according to the recommendations of the World Meteorological Organization [12] as the proportion of the sky occupied by clouds, in points from 0 to 8, where 0 points corresponds to a clear sky, 8 points - a sky completely covered by clouds ;

Пиксель – трехкомпонентный элемент матрицы, численно описывающей снимок, размером w × h × d, где D=3 - количество цветовых каналов изображения, w - ширина изображения в пикселях, h - высота изображения в пикселях; каждый пиксель в этой матрице находится по адресу, характеризуемому строкой и столбцом [14];A pixel is a three-component element of a matrix that numerically describes an image, w × h × d in size, where D=3 is the number of image color channels, w is the image width in pixels, h is the image height in pixels; each pixel in this matrix is located at an address characterized by a row and a column [14];

Цветовые каналы - компоненты числового описания цвета пикселя: три цветовых компоненты характеризуют яркость красного (R), синего (В) и зеленого (G) цветов в цветовой модели RGB [14]; альтернативно цветовым каналом снимка называют совокупность значений соответствующего цветового канала для всех пикселей снимка, представляющих таким образом матрицу размером w × h; Яркость, цветовой тон, насыщенность цветового тона - компоненты числового описания цвета пикселя в цветовой модели HSV [14]. Компонента яркости характеризует визуальное ощущение яркости точки изображения; яркость далее обозначается символом Y; альтернативно яркостью называют совокупность значений яркости всех пикселей снимка, представляющих таким образом матрицу размером W × Н. Компонента цветового тона (Н) характеризует радиально закодированный цветовой тон в пространстве цветовой модели HSV; компонента насыщенности цветового тона (5) характеризует насыщенность цветового тона, меняющуюся от минимальной (отсутствие цветового тона, серый цвет) до максимальной (максимальная насыщенность, хорошо различимый цветовой тон).Color channels are components of a pixel color numerical description: three color components characterize the brightness of red (R), blue (B), and green (G) colors in the RGB color model [14]; alternatively, the color channel of the image is the set of values of the corresponding color channel for all pixels of the image, thus representing a matrix of size w × h; Brightness, hue, hue saturation are the components of the numerical description of the color of a pixel in the HSV color model [14]. The luminance component characterizes the visual sensation of the brightness of an image point; brightness is further denoted by the symbol Y; alternatively, luminance is the sum of the luminance values of all pixels in an image, thus representing a W × H matrix. The hue component (H) characterizes the radially encoded hue in the HSV color model space; the hue saturation component (5) characterizes the saturation of the hue, varying from the minimum (no color tone, gray color) to the maximum (maximum saturation, well-defined color tone).

Признаковое описание снимка - набор статистик снимка, вычисляемых по матрицам цветовых каналов R (red, красный канал), G (green, зеленый канал), В (blue, синий канал) снимка, матрицы яркости снимка Y, матриц значений цветового тона H и насыщенности цветового тона S снимка. В качестве статистик вычисляются следующие величины для каждой из матриц (записано для любой из перечисленных матриц, условно обозначенной X, элементы которой условно обозначены как xi; N - общее количество элементов матрицы X):An indicative description of an image is a set of image statistics calculated by matrices of color channels R (red, red channel), G (green, green channel), B (blue, blue channel) of an image, image brightness matrix Y, hue value matrix H, and saturation color tone S of the picture. As statistics, the following values are calculated for each of the matrices (written for any of the listed matrices, conventionally denoted X, the elements of which are conventionally denoted as x i ; N is the total number of elements of the matrix X):

• минимальное значение• minimum value

• максимальное значение• maximum value

• среднее арифметическое, вычисляемое по формуле:• arithmetic mean, calculated by the formula:

Figure 00000001
Figure 00000001

• дисперсия, вычисляемая по формуле:• dispersion calculated by the formula:

Figure 00000002
Figure 00000002

• среднеквадратическое отклонение, вычисляемое по формуле:• standard deviation calculated by the formula:

Figure 00000003
Figure 00000003

• коэффициент асимметрии распределения значений X, вычисляемый по формуле:• coefficient of asymmetry of the distribution of X values, calculated by the formula:

Figure 00000004
Figure 00000004

• коэффициент эксцесса распределения значений X, вычисляемый по формуле:• coefficient of kurtosis of the distribution of X values, calculated by the formula:

Figure 00000005
Figure 00000005

• перцентили распределения значений X уровня от 4 до 99 включительно, оцениваемые эмпирически и обозначаемые как рα(Х), где α - уровень перцентиля;• percentiles of the distribution of X level values from 4 to 99 inclusive, estimated empirically and denoted as p α (X), where α is the percentile level;

• среднее квадратическое значений X, вычисляемое по формуле:• root mean square of X values, calculated by the formula:

Figure 00000006
Figure 00000006

Для вышеупомянутых матриц R, G, B, Y, H, S вычисляются описанные статистические признаки, в результате признаковое описание составлено из 624 действительных чисел, что соответствует вектору в пространстве R624. Приведенный список статистических признаков матриц не является завершенным и приводится в качестве примера. Существуют варианты настоящего изобретения, в которых представленный набор статистических признаков сокращен или дополнен другими статистиками; в этом случае размерность пространства признакового описания отличается от 624. Некоторые признаки при этом могут не быть действительными: они могут быть целыми, комплексными, бинарными, категориальными, текстовыми и другими.For the above matrices R, G, B, Y, H, S, the described statistical features are calculated, as a result, the feature description is composed of 624 real numbers, which corresponds to a vector in the space R 624 . The above list of statistical features of the matrices is not complete and is given as an example. There are variants of the present invention in which the presented set of statistical features is reduced or supplemented with other statistics; in this case, the dimension of the feature description space differs from 624. In this case, some features may not be valid: they can be integer, complex, binary, categorical, textual, and others.

Классификация - математическая задача, в которой определенному объекту (снимку) следует присвоить метку одного из заранее известных классов. С точки зрения этого определения настоящим методом решается задача классификации снимков видимой полусферы небосвода по классам балла общей облачности (БОО).Classification is a mathematical problem in which a certain object (image) should be assigned a label of one of the previously known classes. From the point of view of this definition, this method solves the problem of classifying images of the visible hemisphere of the sky according to the classes of the total cloudiness score (CCL).

Машинное обучение - множество статистических методик, позволяющий оценивать неизвестные величины, делать выводы или проводить классификацию объектов, описываемых с помощью признакового описания. Описанные в литературе и упомянутые ниже методы машинного обучения обладают свойством обобщения закономерностей, согласно которым следует проводить классификацию вновь поступающих объектов (снимков), в противовес экспертным системам и базам данных, которые предназначены для однозначного и детерминированного сопоставления признакового описания объекта его классу. Такие системы и базы данных бесполезны в задаче определения БОО, поскольку признаковое описание представляет собой точку в пространстве R624, которое невозможно отобразить на конечное множество классов БОО с помощью конечного набора правил сопоставления, которыми являются базы данных и экспертные системы.Machine learning is a set of statistical techniques that allows you to evaluate unknown quantities, draw conclusions or classify objects described using a feature description. The machine learning methods described in the literature and mentioned below have the property of generalizing patterns, according to which it is necessary to classify newly incoming objects (images), as opposed to expert systems and databases, which are designed for unambiguous and deterministic comparison of the indicative description of an object to its class. Such systems and databases are useless in the task of determining the BOO, since the feature description is a point in the R 624 space that cannot be mapped to a finite set of BOO classes using a finite set of matching rules, which are databases and expert systems.

Обучающая выборка - набор данных, представляющий собой признаковое описание объектов (снимков) и соответствующие им известные значения меток классов (БОО), на которых настраиваются параметры или правила классификации используемого метода машинного обучения;Training sample - a data set, which is a feature description of objects (images) and their corresponding known values of class labels (CLS), on which the parameters or classification rules of the machine learning method used are configured;

Применение метода машинного обучения - вычисление значения метки класса (БОО) для объектов (снимков), для которых эти метки классов заранее неизвестны. Кластерный анализ - статистическая процедура, класс методов машинного обучения, выполняющий обобщение данных выборки объектов, например, обучающей выборки, и затем группирующий эти объекты по принципу схожести согласно выбранной мере близости. Может применяться для фильтрации статистических выбросов в обучающей выборке.The application of the machine learning method is the calculation of the class label value (BOO) for objects (images) for which these class labels are not known in advance. Cluster analysis is a statistical procedure, a class of machine learning methods that generalizes the data of a sample of objects, for example, a training sample, and then groups these objects according to the principle of similarity according to the selected proximity measure. Can be used to filter statistical outliers in the training set.

Пользуясь свойством статистических методов машинного обучения обобщать закономерности сопоставления признакового описания меткам классов БОО, настоящее изобретение имеет целью предложить способ определения БОО без классификации каждого пикселя снимка на классы «ОБЛАКО» и «ЧИСТОЕ НЕБО». Это позволяет существенно повысить точность определения БОО по цифровому оптическому цветному снимку видимой полусферы небосвода, что и является решаемой технической задачей.Using the property of statistical machine learning methods to generalize the patterns of matching feature descriptions to labels of BOO classes, the present invention aims to propose a method for determining BOO without classifying each image pixel into the CLOUD and CLEAR SKY classes. This allows you to significantly improve the accuracy of determining the BOO from a digital optical color image of the visible hemisphere of the sky, which is the technical problem to be solved.

В настоящем изобретении могут применяться любые методы машинного обучения, предназначенные для выполнения задачи классификации на множество классов. В частности, но не ограничиваясь, могут быть применены следующие методы:The present invention can apply any machine learning techniques for performing the task of classifying into multiple classes. In particular, but not limited to, the following methods can be applied:

• многослойный перцептрон [18]• multilayer perceptron [18]

• случайные леса [17]• random forests [17]

• градиентный бустинг над решающими деревьями [16]• gradient boosting over decision trees [16]

• линейный дискриминантный анализ [15]• linear discriminant analysis [15]

• метод опорных векторов и его нелинейные вариации [19].• support vector machine and its non-linear variations [19].

Метод определения балла общей облачности для облачной ситуации, зарегистрированной на снимке, состоит из нескольких этапов.The method for determining the total cloudiness score for a cloudy situation recorded on an image consists of several stages.

Этап 1. Сбор и обработка статистических данных об известных случаях наблюдаемых облачных ситуаций.Stage 1. Collection and processing of statistical data on known cases of observed cloud situations.

На этом этапе в процессе полевых экспедиционных исследований проводится унифицированная съемка видимой полусферы небосвода облачной камерой при различных состояниях атмосферы. Съемка производится в автоматическом режиме с высокой частотой, вплоть до 1 снимка в секунду, для каждого снимка регистрируются дата и время съемки. Параллельно с этим наблюдатель-эксперт регистрирует наблюдаемые характеристики - значения БОО, согласно расписанию экспедиционных наблюдений. Также наблюдатель регистрирует дату и время наблюдения.At this stage, in the process of field expeditionary research, a unified survey of the visible hemisphere of the sky is carried out with a cloud camera under various atmospheric conditions. Shooting is performed in automatic mode at a high frequency, up to 1 shot per second, the date and time of shooting are recorded for each shot. In parallel with this, the observer-expert registers the observed characteristics - BOO values, according to the schedule of expeditionary observations. The observer also registers the date and time of the observation.

Для БОО показания наблюдателя считаются соответствующими сфотографированной облачной ситуации в пределах 5 минут от его временной метки. В соответствии с этим правилом каждый снимок, полученный в процессе полевых экспедиционных исследований, представляет собой объект выборки, для которого вычисляется признаковое описание и присваивается класс БОО. На этом же этапе получаемая выборка фильтруется с применением кластерного анализа для выявления объектов, являющихся статистическими выбросами. В результате первого этапа формируется обучающая выборка.For BOO, the observer's readings are considered to correspond to the photographed cloud situation within 5 minutes of his timestamp. In accordance with this rule, each image obtained in the course of field expeditionary research is a sample object for which a feature description is calculated and a BOO class is assigned. At the same stage, the resulting sample is filtered using cluster analysis to identify objects that are statistical outliers. As a result of the first stage, a training sample is formed.

Этап 2. Настройка моделей машинного обучения.Stage 2. Setting up machine learning models.

Выбирается вид метода машинного обучения. Формулируется модель машинного обучения для каждой из задач: определение БОО. При этом целевой переменной является метка класса БОО. В обоих случаях сформулированная модель настраивается согласно описанию соответствующего метода. При этом основой для настройки и извлечения статистических закономерностей, связывающих признаковое описание объектов (снимков), является обучающая выборка, сформированная на Этапе 1.The type of machine learning method is selected. A machine learning model is formulated for each of the tasks: the definition of BOO. In this case, the target variable is the label of the BOO class. In both cases, the formulated model is adjusted according to the description of the corresponding method. At the same time, the basis for setting up and extracting statistical patterns that link the indicative description of objects (images) is the training sample formed at Stage 1.

Этап 3.Stage 3.

Для определения БОО производится съемка видимой полусферы небосвода облачной камерой. При этом присутствие эксперта необязательно. Снимок обрабатывается с применением формул, приведенных в определении «Признаковое описание снимка», для получения признакового описания. Для вновь поступающих снимков видимой полусферы небосвода с помощью настроенной на Этапе 2 модели машинного обучения оценивается вероятность отнесения этого снимка ко всем классам БОО. Решение технической задачи определения БОО получают, выбирая класс, вероятность отнесения к которому для снимка максимальна.To determine BOO, the visible hemisphere of the sky is surveyed with a cloud camera. The presence of an expert is not required. The snapshot is processed using the formulas given in the definition of "Snapshot Indicative Description" to obtain an indicative description. For newly arriving images of the visible hemisphere of the sky, using the machine learning model tuned at Stage 2, the probability of assigning this image to all classes of the BOO is estimated. The solution to the technical problem of determining the BOO is obtained by choosing a class, the probability of referring to which for the image is maximum.

Промышленная применимость.Industrial applicability.

Предлагаемый способ определения БОО на основе статистических методов обработки данных снимков видимой полусферы небосвода может быть осуществлен на практике метеорологом или другим исследователем или специалистом и при осуществлении обеспечивает реализацию заявленного назначения. На базе исследовательской лаборатории авторов изобретения предлагаемый способ многократно осуществлен в различных морских экспедиционных исследованиях, что позволяет сделать вывод о соответствии критерию «промышленная применимость» для изобретения. Описанный способ определения БОО на основе статистических методов обработки данных снимков видимой полусферы небосвода реализуется на базе существующих подходов и технологий, и возможность его осуществления не связана с какими-либо дополнительными техническими проблемами.The proposed method for determining BOO based on statistical methods for processing data from images of the visible hemisphere of the sky can be put into practice by a meteorologist or other researcher or specialist and, when implemented, ensures the implementation of the stated purpose. On the basis of the research laboratory of the authors of the invention, the proposed method has been repeatedly implemented in various marine expeditionary studies, which allows us to conclude that the invention meets the criterion of "industrial applicability". The described method for determining the BOO based on statistical methods for processing data from images of the visible hemisphere of the sky is implemented on the basis of existing approaches and technologies, and the possibility of its implementation is not associated with any additional technical problems.

В соответствии с предложенным изобретением авторами было реализовано применение метода определения БОО на практике.In accordance with the proposed invention, the authors implemented the application of the method for determining BOO in practice.

Ниже приведены результаты соответствующих этапов метода.Below are the results of the respective steps of the method.

Этап 1. Сбор и обработка статистических данных об известных случаях наблюдаемых облачных ситуаций. Фильтрация выбросов.Stage 1. Collection and processing of statistical data on known cases of observed cloud situations. Outlier filtering.

В результате полевых экспедиционных исследований была собрана обучающая выборка, состоящая более чем из 100'000 снимков и соответствующих им регистраций эксперта-наблюдателя относительно классов БОО. К этой выборке был применен метод кластерного анализа на основе оценки плотности распределений значений признакового описания. По результату оценки плотности были отсеяны объекты, считающиеся статистическими выбросами. На Фиг. 2 приведены такие снимки.As a result of field expeditionary research, a training sample was collected, consisting of more than 100,000 images and the corresponding registrations of an expert-observer regarding the BOO classes. The method of cluster analysis was applied to this sample based on the estimation of the density of distributions of the values of the feature description. According to the result of the density estimation, objects considered as statistical outliers were eliminated. On FIG. 2 shows such pictures.

Объемы отфильтрованных таким образом обучающих выборок для определения БОО приведены в таблице 1.The volumes of the training samples filtered in this way to determine the BOO are shown in Table 1.

Figure 00000007
Figure 00000007

Для каждого снимка из полученной выборки были рассчитано признаковое описание согласно приведенным формулам.For each image from the resulting sample, a feature description was calculated according to the above formulas.

Этап 2. Выбор и настройка моделей машинного обучения для определения БОО. В описываемой реализации изобретения в качестве статистической модели, обобщающей данные обучающей выборки, был использован многослойный перцептрон. Настройка моделей многослойного перцептрона производилась с применением стохастического градиентного спуска, при котором градиент вычислялся согласно методике обратного распространения ошибки. Это стандартный метод настройки искусственной нейронной сети, частным случаем которой является многослойный перцептрон.Stage 2. Selection and tuning of machine learning models for determining BOO. In the described implementation of the invention, a multilayer perceptron was used as a statistical model summarizing the training sample data. The tuning of the multilayer perceptron models was carried out using stochastic gradient descent, in which the gradient was calculated according to the backpropagation technique. This is a standard method for setting up an artificial neural network, of which a multilayer perceptron is a special case.

Для каждого снимка из массива обучающих данных было вычислено признаковое описание согласно приведенным формулам. С применением полученного признакового описания была настроена модель многослойного перцептрона для определения БОО.For each image from the array of training data, a feature description was calculated according to the above formulas. Using the obtained indicative description, a multilayer perceptron model was tuned to determine the BOO.

Этап 3. Определение БОО.Stage 3. Definition of BOO.

На этом этапе настроенная модель применялись к вновь получаемым снимкам. Для каждого снимка вычислялось признаковое описание согласно приведенным формулам. Далее из этих снимков исключались статистические выбросы, которые определялись на основании проведенного на Этапе 1 кластерного анализа. К полученному признаковому описанию снимков была применена модель, настроенная на Этапе 2 на определение классов БОО. Промежуточным результатом Этапа 3 являются вероятности отнесения снимков к каждому из классов БОО. Техническим результатом Этапа 3 и изобретения является метка класса БОО для каждого снимка, определенная как метка класса, для которой вероятность, определяемая моделью БОО, максимальна.At this stage, the adjusted model was applied to the newly obtained images. For each image, a feature description was calculated according to the above formulas. Further, statistical outliers were excluded from these images, which were determined on the basis of the cluster analysis carried out at Stage 1. The model was applied to the obtained indicative description of the images, which was tuned at Stage 2 to determine the BOO classes. The intermediate result of Stage 3 is the probabilities of assigning images to each of the BOO classes. The technical result of Stage 3 and the invention is the BOO class label for each image, defined as the class label for which the probability determined by the BOO model is maximum.

Таким образом показана применимость изобретения.The applicability of the invention is thus shown.

На Фиг. 3 приведена матрица ошибок при определении БОО на вновь получаемых снимках. Всего в проверочной выборке в задаче определения БОО было представлено 85200 снимков.On FIG. Figure 3 shows the matrix of errors in determining the BRO on newly obtained images. In total, 85200 images were presented in the test sample in the problem of determining the BOO.

Доля верно определенных классов БОО предложенным в изобретении способом определения БОО составляет 39%. При этом стандартное отклонение определенного БОО составляет 0,83 балла, а доля снимков, для которых БОО определен с ошибкой не более чем на 1 балл, составляет 74,5%. Такие показатели существенно превышают показатели всех существующих методов определения БОО, основанных на бинаризации снимка в каждом отдельном пикселе [1-10].The proportion of correctly defined BOO classes by the method proposed in the invention for determining BOO is 39%. At the same time, the standard deviation of a certain BRO is 0.83 points, and the proportion of images for which the BRO is determined with an error of no more than 1 point is 74.5%. Such indicators significantly exceed the indicators of all existing methods for determining the BRO, based on the binarization of the image in each individual pixel [1-10].

Заключение.Conclusion.

Пример реализации предложенного изобретения демонстрирует показывает преимущество описанного метода перед существующими методами. Это преимущество достигается за счет:An example of the implementation of the proposed invention demonstrates the advantage of the described method over existing methods. This advantage is achieved through:

• использования полного набора статистик цветовых каналов, яркости, цветового тона и насыщенности цветового тона точек снимка снимка в противовес вычислению одного индекса;• use of the full set of statistics of color channels, brightness, hue and saturation of the hue of image pixels in contrast to the calculation of a single index;

• применения статистических методов обработки данных, позволяющих извлекать закономерности из обучающей выборки, и применять эти закономерности на вновь поступающих снимках;• application of statistical data processing methods that allow extracting patterns from the training sample and applying these patterns to newly received images;

• автоматизации сбора данных в полевых экспедиционных исследованиях, позволяющих собрать большой объем статистической информации (обучающую выборку)• automation of data collection in field expeditionary research, allowing to collect a large amount of statistical information (training sample)

За счет указанных характеристик обеспечивается достигаемый технический результат, а именно: повышение точности определения балла общей облачности по широкоугольным цифровым оптическим снимкам видимой полусферы неба.Due to these characteristics, the achieved technical result is provided, namely: an increase in the accuracy of determining the total cloudiness score from wide-angle digital optical images of the visible hemisphere of the sky.

Краткое описание чертежей, диаграмм и фигур.Brief description of drawings, diagrams and figures.

Фиг. 1 - Примеры цифровых цветных оптических широкоугольных снимков видимой полусферы небосвода.Fig. 1 - Examples of digital color optical wide-angle images of the visible hemisphere of the sky.

Фиг. 2 - Примеры снимков, исключаемых из обучающей выборки в соответствии с результатами оценки плотности распределений значений признакового описания. См. описание Этапа 1 (сбор и обработка статистических данных об известных случаях наблюдаемых облачных ситуаций. Фильтрация выбросов).Fig. 2 - Examples of images excluded from the training sample in accordance with the results of estimating the density of distributions of the attribute description values. See the description of Stage 1 (collection and processing of statistical data on known cases of observed cloud situations. Outlier filtering).

Фиг. 3 - Матрица ошибок метода на Этапе 3 (определение БОО).Fig. 3 - Matrix of errors of the method at Stage 3 (definition of BOO).

Использованные источникиUsed sources

1. Артюхов А.В., Третьяков Н.Д., Якименко И.В. "Определение балла и формы облачности на основе векторов признаков" // Математическая морфология. Электронный математический и медико-биологический журнал. Т.9. - Вып. 2, 2010.1. Artyukhov A.V., Tretyakov N.D., Yakimenko I.V. "Determination of the amount and form of cloudiness based on feature vectors" // Mathematical morphology. Electronic mathematical and medical-biological journal. T.9. - Issue. 2, 2010.

2. Устройство распознавания форм облачности: Патент на изобретение №2331853, Россия, G01J 3/06.2. Device for recognition of cloud forms: Patent for invention No. 2331853, Russia, G01J 3/06.

3. Способ определения балла облачности: Патент на изобретение №2525625, Россия, G01W 1/04.3. Method for determining the cloudiness score: Patent for invention No. 2525625, Russia, G01W 1/04.

4. Устройство для определения общего балла облачности на основе прямых цифровых широкоугольных снимков видимой полусферы неба: Патент на изобретение №2589463, Россия, G01W 1/00.4. Device for determining the total amount of cloudiness based on direct digital wide-angle images of the visible hemisphere of the sky: Patent for invention No. 2589463, Russia, G01W 1/00.

5. Long C.N. et al. Retrieving Cloud Characteristics from Ground-Based Daytime Color All-Sky Images // Journal of Atmospheric and Oceanic Technology - 2006. - T. 23 - №5 - C. 633-652.5 Long C.N. et al. Retrieving Cloud Characteristics from Ground-Based Daytime Color All-Sky Images // Journal of Atmospheric and Oceanic Technology - 2006. - V. 23 - No. 5 - C. 633-652.

6. Kalisch J., Macke A. Estimation of the total cloud cover with high temporal resolution and parametrization of short-term fluctuations of sea surface insolation // Meteorologische Zeitschrift - 2008. - T. 17 - №5 - C. 603-611.6. Kalisch J., Macke A. Estimation of the total cloud cover with high temporal resolution and parametrization of short-term fluctuations of sea surface insolation // Meteorologische Zeitschrift - 2008. - V. 17 - No. 5 - C. 603-611 .

7. Yamashita M., Yoshimura M., Nakashizuka T. Cloud cover estimation using multitemporal hemisphere imageries // International Archives of Photogrammetry Remote Sensing and Spatial Information Sciences - 2004. - T. 35 - №7 - C. 826-829.7. Yamashita M., Yoshimura M., Nakashizuka T. Cloud cover estimation using multitemporal hemisphere imageries // International Archives of Photogrammetry Remote Sensing and Spatial Information Sciences - 2004. - V. 35 - No. 7 - C. 826-829.

8. Yamashita M. and Yoshimura M. Ground-based cloud observation for satellite-based cloud discrimination and its validation // International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences - 2012. - T. 39 - №8 - C. 137-140.8. Yamashita M. and Yoshimura M. Ground-based cloud observation for satellite-based cloud discrimination and its validation // International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences - 2012. - V. 39 - No. 8 - C. 137-140.

9. Heinle A. et al. Automatic cloud classification of whole sky images // Atmospheric Measurement Techniques - 2010. - T. 3 - №3 - C. 557-567.9. Heinle A. et al. Automatic cloud classification of whole sky images // Atmospheric Measurement Techniques - 2010. - V. 3 - No. 3 - C. 557-567.

10. Kazantzidis A. et al. Cloud detection and classification with the use of whole-sky ground-based images // Atmospheric Research - 2012. - T. 113 - C. 80-88.10 Kazantzidis A. et al. Cloud detection and classification with the use of whole-sky ground-based images // Atmospheric Research - 2012. - V. 113 - C. 80-88.

11. Криницкий M.A. Аппаратный комплекс и алгоритмы, основанные на методах машинного обучения, для измерения характеристик облачности над океаном. Автореферат дис. кандидата технических наук: 25.00.28 / [Место защиты: Ин-т океанологии им. П.П. Ширшова РАН].11. Krinitsky M.A. Hardware complex and algorithms based on machine learning methods for measuring the characteristics of cloudiness over the ocean. Abstract dis. Candidate of Technical Sciences: 25.00.28 / [Place of defense: Inst. of Oceanology. P.P. Shirshov RAS].

12. Guide to meteorological instruments and methods of observation, Chapter 15 "Observations on clouds", 15.2 "Estimation and observation of cloud amount, height and type" / Chairperson - Geneva: Publications Board, 2008. – 716 c.12. Guide to meteorological instruments and methods of observation, Chapter 15 "Observations on clouds", 15.2 "Estimation and observation of cloud amount, height and type" / Chairperson - Geneva: Publications Board, 2008. - 716 pp.

13. РД 52.04.562-96. Наставление гидрометеорологическим станциям и постам. Выпуск 5 «Актинометрические наблюдения на станциях», часть I «Метеорологические параметры и оптические характеристики атмосферы, определяемые при выполнении актинометрических наблюдений» // Москва: Росгидромет, 1996. С. 15-17.13. RD 52.04.562-96. Instructions for hydrometeorological stations and posts. Issue 5 "Actinometric observations at stations", part I "Meteorological parameters and optical characteristics of the atmosphere, determined when performing actinometric observations" // Moscow: Roshydromet, 1996. P. 15-17.

14. Гонсалес Р. и Вудс Р. Цифровая обработка изображений - Москва: Техносфера, 2012. - 1105 с.14. Gonzalez R. and Woods R. Digital image processing - Moscow: Technosphere, 2012. - 1105 p.

15. Fisher R.A. The use of multiple measurements in taxonomic problems / Fisher R.A. // Annals of human genetics -1936. - T. 7 - №2 - C. 179-188.15. Fisher R.A. The use of multiple measurements in taxonomic problems / Fisher R.A. // Annals of human genetics -1936. - T. 7 - No. 2 - C. 179-188.

16. Breiman L Bagging predictors / Breiman L // Machine learning - 1996. - T. 24 - №2 - C. 123-140.16. Breiman L Bagging predictors / Breiman L // Machine learning - 1996. - V. 24 - No. 2 - C. 123-140.

17. Breiman L. Random forests / Breiman L. // Machine learning - 2001. - T. 45 - №1 - C. 5-32.17. Breiman L. Random forests / Breiman L. // Machine learning - 2001. - V. 45 - No. 1 - C. 5-32.

18. Минский M. Персептроны, Глава 13/Минский M., Пейперт-Москва: Мир, 1971. - С. 226-231.18. Minsky M. Perceptrons, Chapter 13 / Minsky M., Papert-Moscow: Mir, 1971. - S. 226-231.

19. Boser В.Е., Guyon I.М., Vapnik V.N. A training algorithm for optimal margin classifiers //Proceedings of the fifth annual workshop on Computational learning theory. - ACM, 1992. - C. 144-152.19. Boser V.E., Guyon I.M., Vapnik V.N. A training algorithm for optimal margin classifiers //Proceedings of the fifth annual workshop on Computational learning theory. - ACM, 1992. - C. 144-152.

Claims (4)

1. Способ определения балла общей облачности по цветным оптическим цифровым широкоугольным снимкам видимой полусферы неба на основе статистических методов обработки данных, заключающийся в применении статистических методов обработки данных к данным фотоснимка видимой полусферы неба, отличающийся тем, что цифровой фотоснимок видимой полусферы неба преобразовывают в вектор значений, называемый признаковым описанием, содержащий статистические характеристики цветовых каналов, яркости, цветового тона и насыщенности цветового тона точек изображения, к которому применяют статистическую модель класса машинного обучения для получения значения балла общей облачности.1. A method for determining the total cloudiness score from color optical digital wide-angle images of the visible sky hemisphere based on statistical data processing methods, which consists in applying statistical data processing methods to the data of a photograph of the visible sky hemisphere, characterized in that the digital photograph of the visible sky hemisphere is converted into a vector of values , called a feature description, containing statistical characteristics of color channels, brightness, hue and hue saturation of image points, to which a statistical model of the machine learning class is applied to obtain the value of the total cloudiness score. 2. Способ по п. 1, отличающийся тем, что статистическая модель класса машинного обучения предназначена для решения общей задачи классификации.2. The method according to claim 1, characterized in that the statistical model of the machine learning class is designed to solve the general classification problem. 3. Способ по п. 1, отличающийся тем, что статистическая модель класса машинного обучения по п. 2 настраивается на основе предварительно собранного набора цифровых широкоугольных оптических снимков видимой полусферы неба с соответствующими показаниями эксперта относительно наблюдаемого балла общей облачности.3. The method according to claim 1, characterized in that the statistical model of the machine learning class according to claim 2 is adjusted based on a pre-assembled set of digital wide-angle optical images of the visible hemisphere of the sky with the corresponding expert testimony regarding the observed total cloudiness. 4. Способ по п. 1, отличающийся тем, что определение балла общей облачности производится применением настроенной статистической модели класса машинного обучения к признаковому описанию фотоснимка видимой полусферы неба, результатом чего является метка класса балла общей облачности, являющаяся величиной балла общей облачности.4. The method according to claim 1, characterized in that the determination of the total cloudiness score is performed by applying the tuned statistical model of the machine learning class to the feature description of the photograph of the visible hemisphere of the sky, resulting in a class mark of the total cloudiness score, which is the value of the total cloudiness score.
RU2020142879A 2020-12-24 Method for determination of total cloud score by color digital wide-angle images of visible sky hemisphere based on statistical data processing methods RU2777493C2 (en)

Publications (2)

Publication Number Publication Date
RU2020142879A RU2020142879A (en) 2022-06-24
RU2777493C2 true RU2777493C2 (en) 2022-08-04

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2589463C1 (en) * 2015-05-14 2016-07-10 Федеральное государственное бюджетное учреждение науки институт океанологии им. П.П. Ширшова Российской академии наук Device for determining total amount of clouds on basis of direct digital wide-angle images of visible hemisphere of sky
CN105974495A (en) * 2016-04-29 2016-09-28 中国科学院遥感与数字地球研究所 Method for pre-judging future average cloud amount of target area by using classification fitting method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2589463C1 (en) * 2015-05-14 2016-07-10 Федеральное государственное бюджетное учреждение науки институт океанологии им. П.П. Ширшова Российской академии наук Device for determining total amount of clouds on basis of direct digital wide-angle images of visible hemisphere of sky
CN105974495A (en) * 2016-04-29 2016-09-28 中国科学院遥感与数字地球研究所 Method for pre-judging future average cloud amount of target area by using classification fitting method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
М.А. Криницкий. Аппаратный комплекс и алгоритмы, основанные на методах машинного обучения, для измерения характеристик облачности над океаном. Автореф. диссертации на соискание уч. степ. кандидата технических наук, Москва, 2018. М.А. Криницкий, А.В. Синицын. Адаптивный алгоритм оценки общего балла облачности над морем по широкоугольным снимкам неба / Океанология, 2016, т. 56, N3, 341-345. *

Similar Documents

Publication Publication Date Title
Praz et al. Solid hydrometeor classification and riming degree estimation from pictures collected with a Multi-Angle Snowflake Camera
CN113705478B (en) Mangrove single wood target detection method based on improved YOLOv5
Davis et al. Real-time observation of taxa-specific plankton distributions: an optical sampling method
CN113392775B (en) Sugarcane seedling automatic identification and counting method based on deep neural network
CN110929607A (en) Remote sensing identification method and system for urban building construction progress
CN112052755A (en) Semantic convolution hyperspectral image classification method based on multi-path attention mechanism
CN106778734A (en) A kind of insulator based on rarefaction representation falls to go here and there defect inspection method
CN107025445B (en) Multisource remote sensing image combination selection method based on class information entropy
CN109242826B (en) Mobile equipment end stick-shaped object root counting method and system based on target detection
CN113378785A (en) Forest type identification method and device
CN113435254A (en) Sentinel second image-based farmland deep learning extraction method
CN114037907A (en) Detection method and device for power transmission line, computer equipment and storage medium
CN113936214B (en) Karst wetland vegetation community classification method based on fusion of aerospace remote sensing images
Varjo et al. Image based visibility estimation during day and night
CN108154199B (en) High-precision rapid single-class target detection method based on deep learning
RU2777493C2 (en) Method for determination of total cloud score by color digital wide-angle images of visible sky hemisphere based on statistical data processing methods
CN116863341A (en) Crop classification and identification method and system based on time sequence satellite remote sensing image
CN107886049B (en) Visibility recognition early warning method based on camera probe
CN115546640A (en) Cloud detection method and device for remote sensing image, electronic equipment and storage medium
CN114937266A (en) Hard shell clam biological sign identification method based on YOLOX-S
Stanski et al. Flower detection using object analysis: new ways to quantify plant phenology in a warming tundra biome
Chatterjee et al. Understanding Cloud Systems’ Structure and Organization Using a Machine’s Self-Learning Approach
Power et al. Toward Data-Driven Glare Classification and Prediction for Marine Megafauna Survey
CN109726724B (en) Water gauge image feature weighted learning identification method under shielding condition
CN117274788B (en) Sonar image target positioning method, system, electronic equipment and storage medium