RU155719U1 - Устройство проверки однородности однотипных выборок - Google Patents

Устройство проверки однородности однотипных выборок Download PDF

Info

Publication number
RU155719U1
RU155719U1 RU2014152429/08U RU2014152429U RU155719U1 RU 155719 U1 RU155719 U1 RU 155719U1 RU 2014152429/08 U RU2014152429/08 U RU 2014152429/08U RU 2014152429 U RU2014152429 U RU 2014152429U RU 155719 U1 RU155719 U1 RU 155719U1
Authority
RU
Russia
Prior art keywords
unit
block
series
input
samples
Prior art date
Application number
RU2014152429/08U
Other languages
English (en)
Inventor
Руслан Сергеевич Литвиненко
Павел Павлович Павлов
Игорь Владимирович Ившин
Авер Эрикович Аухадеев
Валерий Михайлович Бутаков
Original Assignee
Руслан Сергеевич Литвиненко
Павел Павлович Павлов
Игорь Владимирович Ившин
Авер Эрикович Аухадеев
Валерий Михайлович Бутаков
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Руслан Сергеевич Литвиненко, Павел Павлович Павлов, Игорь Владимирович Ившин, Авер Эрикович Аухадеев, Валерий Михайлович Бутаков filed Critical Руслан Сергеевич Литвиненко
Priority to RU2014152429/08U priority Critical patent/RU155719U1/ru
Application granted granted Critical
Publication of RU155719U1 publication Critical patent/RU155719U1/ru

Links

Images

Landscapes

  • Complex Calculations (AREA)

Abstract

Устройство проверки однородности однотипных выборок, содержащее блок ввода исходной информации, один выход которого соединен со входом блока формирования критической статистики, второй и третий выходы соединены со входами первого блока суммирования, второго блока умножения и второго блока деления, третий выход также соединен со входом третьего блока деления, а четвертый и пятый выходы соединены со входами блоков формирования вариационного ряда и формирования частот; в свою очередь последовательно соединены первый блок суммирования, блок логарифмирования, блок умножения на константу, блок сложения с единицей и блок округления, один выход которого соединен со входом первого блока деления, а второй со входом блока формирования критической статистики, который последовательно соединен с блоками сравнения и вывода информации; аналогичным образом блок формирования вариационного ряда соединен блоками определения максимального и минимального значений, выходы которых являются входами для первого блока вычитания последовательно соединенного с первым блоком деления, блоком формирования интервалов, блоком формирования частот, причём первый и второй выходы которого соединены со входами второго и третьего блоков деления, которые последовательно соединены со вторым блоком вычитания и блоком возведения в квадрат, а третий выход со входом второго блока суммирования, который соединен последовательно с блоком возведения в степень, первым блоком умножения, третьим блоком суммирования и вторым блоком умножения, и отличающееся тем, что за счёт введения блока ввода информации, блока логарифмирования, блока умноже�

Description

Полезная модель относится к обработке цифровых данных с помощью компьютерных систем, использующих модели, основанные на знаниях, и может быть использовано при решении задач исследования экспериментальных данных различных технических средств и комплексов. Работа выполнена в рамках соглашения с Минобрнауки РФ от 20 октября 2014 г. №14.577.21.0121 (уникальный идентификатор прикладных научных исследований (проекта) RFMEFI57714X0121).
Наиболее близким по технической сущности к заявленной полезной модели (прототипом) следует считать устройство сбалансированного оценивания показателей надежности технической системы на основе объединения двух выборок (патент RU №63949 U1, МПК G06F 7/00, опубликовано 10.06.2007 бюл. №16).
Недостатком данного устройства является то, что представленные экспериментальные данные не проходят процедуру проверки их однородности, поэтому при объединении не учитывается фактор возможной неоднородности, т.к. общая выборка считается неоднородной приводимой к однородной. Такое слияние однотипных, но неоднородных выборок, приводит к снижению качества оценок, а в ряде случаев и к их полной непригодности.
Технической задачей предполагаемой полезной модели является предварительная проверка однородности представленных выборок (определение принадлежности этих выборок одной генеральной совокупности) с использованием критерия Смирнова, по результатам которой можно сделать вывод о возможности последующего объединения этих данных.
Техническим результатом решения поставленной выше задачи является повышение качества статистических оценок экспериментальных данных за счет предварительной проверки их однородности с использованием критерия Смирнова и, в случае положительного решения, последующего увеличения объема представленных выборок путем их объединения в одну генеральную совокупность.
По результатам эксплуатации может накапливаться целый ряд выборок по однотипным техническим средствам и комплексам. Однотипность не означает равноценности объектов по их показателям. Выборки, характеризующие различные однотипные объекты или один и тот же объект в различные периоды эксплуатации, вообще говоря, могут быть неоднородными. Неоднородность означает, что выборки принадлежат различным законам распределения, которые различаются или только параметрами при одном и том же виде, или видом и параметрами распределения.
Задачи обработки однотипных выборок подразделяются на две группы. К первой группе относятся задачи объединения выборок. Объединение выборок позволяет повысить точность оценок за счет увеличения объема обрабатываемых экспериментальных данных. Простое слияние однотипных, но неоднородных выборок для последующей оценки показателей по объединенной выборке, приводит к снижению качества оценок или даже к их полной непригодности. Необходимо применение специальных приемов объединения разнородных сведений в интересах использования всей содержащейся в выборках информации. Таким образом, при объединении выборок необходимо сначала проверить их однородность. Однородные выборки сливаются в одну общую выборку, которая обрабатывается с помощью обычных методов. Неоднородные выборки обрабатываются раздельно или объединяются с помощью специальных приемов.
Вторая группа задач связана с сопоставлением параметров распределения выборок, т.е. с определением существенных различий в
значениях параметров однотипных выборок. Наиболее широкое распространение получил один из видов подобного рода задач, так называемый дисперсионный анализ. В дисперсионном анализе исследуются методы проверки гипотезы о равенстве математических ожиданий случайных величин, представленных выборками ограниченного объема. Непосредственное сравнение оценок математических ожиданий совокупности выборок оказывается менее эффективным, чем сопоставление оценок дисперсий, это обстоятельство и дало наименование методу. Подобные задачи возникают при исследовании влияния каких-либо параметров на показатели качества объекта.
Итак, пусть имеются выборки по одному устройству, но полученные на различных интервалах времени наблюдений, или имеются выборки по однотипным устройствам, сформированные за один и тот же или различные периоды наблюдений. Количество таких поступивших на обработку выборок m - не менее двух, каждая выборка имеет свой объем ni, i=1, 2, …, m. Априорных сведений об однородности или неоднородности различных выборок нет.
Следовательно, объектом обработки выступает совокупность независимых выборок результатов наблюдений по одному и тому же показателю однотипных объектов
Figure 00000002
Эта совокупность состоит из m слоев (строк). Каждая i-я строка (i=1, 2, …, m) представляет собой однородную случайную выборку результатов наблюдений за значениями случайной величины X, Y, …, W соответственно. Слой характеризуется своим, в общем случае векторным, параметром Ti распределения и может иметь свои статистики, т.е. свои функции от выборочных значений.
По возможности объединения информации из совокупности однотипных выборок можно выделить три типовые ситуации:
различные слои представляют собой однородные выборки. Это является следствием однотипности объектов, близости режимов использования и одинаковости внешних воздействий на исследуемые средства. В такой идеализированной ситуации выборки можно объединить и определять искомые параметры, используя традиционный аппарат математической статистики. Данная ситуация предоставляет наибольшие возможности использования информации, содержащейся в экспериментальных данных, именно в таком случае удается достичь максимальной эффективности оценок показателей, т.е. объединение обеспечивает потенциальную возможность полного использования сведений, содержащихся в выборках;
совокупность слоев частично неоднородна. Тогда однородные слои, если таковые обнаружатся, целесообразно объединить, а оставшиеся неоднородные группы выборок обрабатывать раздельно. В этой ситуации всю содержащуюся в выборках информацию полностью извлечь не удается. Однако существуют простые приемы получения некоторых оценок параметров распределения по совокупности неоднородных выборок;
слои полностью или частично неоднородны. Но, в дополнение к результатам наблюдений, имеется априорная информация о взаимосвязи параметров Ti различных выборок. Такие взаимосвязи устанавливаются на основе изучения сущности процессов, протекающих в объектах, и могут задаваться различными способами - в виде аналитических соотношений, ограничений на значения параметров и т.п. Чем выше уровень априорной информированности о взаимосвязях параметров, тем потенциально более высокой эффективности оценок показателей можно достичь.
Следовательно, объединение слоев всегда следует начинать с проверки однородности выборок.
Принцип действия предложенного устройства основан на использовании критерия проверки однородности Смирнова для последующего вывода о принадлежности этих выборок одной генеральной совокупности и возможности их объединения. Этот критерий предназначен для проверки гипотезы совпадения законов распределения в двух генеральных совокупностях по группированным выборкам, извлеченным из этих совокупностей. Пусть имеется l выборок объемов соответственно n1, n2, …, n1 и пусть данные каждой из этих выборок сгруппированы, причем разбиение диапазонов исследуемых случайных величин на интервалы группирования во всех выборках произведено одинаковым способом (при этом выбор общего диапазона варьирования анализируемого признака во всех выборках определяется наименьшим, по всем выборкам, из минимальных выборочных значений и наибольшим из максимальных выборочных значений). В предлагаемом устройстве количество интервалов определяется по формуле Стерджесса
Figure 00000003
Таким образом, имеется s одних и тех же для всех выборок интервалов группирования и пусть υij - количество элементов i-й выборки, попавших в j-й интервал (i=1, 2, …, l; j=1, 2, …, s). В качестве критической статистики критерия используется величина
Figure 00000004
где
Figure 00000005
- общее число элементов i-й выборки,
Figure 00000006
- общее (по всем выборкам) число выборочных данных, попавших в j-й интервал группирования и
Figure 00000007
- суммарный (по всем выборкам) объем выборочных данных.
Н.В. Смирновым было доказано, что при неограниченном росте объемов всех выборок и в условиях справедливости проверяемой гипотезы закон распределения статистики стремится к закону χ2 с числом степеней
свободы, равным (l-1)(s-1). Поэтому, в соответствии с общей логикой статистического критерия гипотеза об однородности исследуемых выборок отвергается, если
Figure 00000008
или
Figure 00000009
, и принимается при всех остальных значениях критической статистики γ(n) (здесь
Figure 00000010
- табличное значение 100q%-ной точки «хи-квадрат» распределения с m степенями свободы).
В частном случае двух выборок (при l=2) статистика (2) может быть записана в виде
Figure 00000011
и при условии справедливости гипотезы однородности она будет приблизительно распределена (при больших объемах n1 и n2) по закону χ2 с s-1 степенью свободы.
Предложенный Н.В.Смирновым способ проверки однородности однотипных выборок может быть реализован при помощи следующего устройства (фиг. 1), где обозначено:
1 - блок ввода исходной информации об анализируемых выборках (выборки X1 и Х2, объемы выборок n1 и n2, уровень значимости p);
2 - первый блок суммирования;
3 - блок логарифмирования;
4 - блок умножения на константу;
5 - блок сложения с единицей;
6 - блок округления до ближайшего целого числа, определение;
7 - блок формирования вариационного ряда;
8 - блок определения максимального значения Xmax;
9 - блок определения минимального значения Xmin;
10 - первый блок вычитания;
11 - первый блок деления
12 - блок формирования S интервалов вариационного ряда;
13 - блок формирования частот попадания (υ1j и υ2j) значений в заданные интервалы
Figure 00000012
;
14 - второй блок суммирования;
15 - второй блок деления;
16 - третий блок деления;
17 - блок возведения в обратную степень;
18 - второй блок вычитания;
19 - блок возведения в квадрат;
20 - первый блок умножения;
21 - третий блок суммирования;
22 - второй блок умножения;
23 - блок сравнения;
24 - блок формирования критической статистики
Figure 00000013
.
25 - блок вывода информации.
Определение однородности анализируемых выборок производится по описанной схеме следующим образом.
В блок 1 вводится исходная информация об анализируемых выборках, включающая в себя: выборки X1 и Х2, их объемы n1 и n2, уровень доверительной информации р, с которой будет принята гипотеза о однородности представленных данных. Из блока 1 информация об объемах выборок n1 и n2 поступает в первый блок суммирования 2, где определяется суммарный объем обеих выборок N. Далее в блоке логарифмирования 3 определяется десятичный логарифм от N, ив блоке умножения на константу 4 полученное число увеличивается в 3,322 раз. В блоке сложения 5 производится увеличение произведения на единицу, с последующим округление полученного числа до ближайшего целого в блоке округления 6. Таким образом, в блоке округления 6 формируется информация о числе интервалов S, на которые в последующем будет разбита объединенная выборка.
На вход блока формирования вариационного ряда 7 подается информация об анализируемых выборках Х1 и Х2. В блоках 8 и 9 определяются минимальное Xmin и максимальное Xmax значения из полученного вариационного ряда. Первый блок вычитания 10 позволяет определить величину размаха вариационного ряда (Xmax-Xmin). Информация об величине интервалов, полученная в результате деления величины (Xmax-Xmin) в первом блоке деления 11 на количество этих интервалов S из блока округления 6, поступает на вход блока формирования 12, в котором производится разбиение вариационного ряда (объединенной выборки) на
Figure 00000014
интервалов. В блоке 13 происходит формирование частот попадания значений (υ1j и υ2j) анализируемых выборок в интервалы, полученные из блока 12, и последующее их сложение во втором блоке суммированиям. Также информация от частотах (υ1j и υ2j) подается на входы блоков деления 15, 16, и далее на вход блока вычитания 18. Блок 19 осуществляет возведение в квадрат полученной в блоке вычитания 18 разности. В первом блоке умножения 20 производится перемножение величин из блоков 17 и 19, и их последующее сложение по всем
Figure 00000015
интервалам в третьем блоке суммирования 21. Второй блок умножения 22 перемножает данные поступившие из блока 21 и данные об объемах выборок n1 и n2 из блока ввода информации 1. Таким образом, на выходе блока 22 получена статистика χ2, характеризующая объединенную выборку. В блоке 24 на основании информации о уровне значимости р и количестве степеней свободы, соответствующем величине S, формируется критическое значение статистики
Figure 00000016
. Блок сравнения 23 определяет, превышает или нет статистика χ2 значения критического параметра
Figure 00000017
. Результат сравнения, по которому можно сделать вывод об однородности выборок X1 и Х2 и последующей возможности их объединения в одну, поступает в блок 25 вывода, где регистрируются и отображаются любым известным способом (печать, индикация, запись и т.п.).
Таким образом, устройство проверки однородности однотипных выборок, содержащее блок ввода исходной информации, один выход которого соединен со входом блока формирования критической статистики, второй и третий выходы соединены со входами первого блока суммирования, второго блока умножения и второго блока деления, третий выход также соединен со входом третьего блока деления, а четвертый и пятый выходы соединены со входами блоков формирования вариационного ряда и формирования частот; в свою очередь последовательно соединены первый блок суммирования, блок логарифмирования, блок умножения на константу, блок сложения с единицей и блок округления, один выход которого соединен со входом первого блока деления, а второй со входом блока формирования критической статистики, который последовательно соединен с блоками сравнения и вывода информации; аналогичным образом блок формирования вариационного ряда соединен блоками определения максимального и минимального значений, выходы которых являются входами для первого блока вычитания последовательно соединенного с первым блоком деления, блоком формирования интервалов, блоком формирования частот, причем первый и второй выходы которого соединены со входами второго и третьего блоков деления, которые последовательно соединены со вторым блоком вычитания и блоком возведения в квадрат, а третий выход со входом второго блока суммирования, который соединен последовательно с блоком возведения в степень, первым блоком умножения, третьим блоком суммирования и вторым блоком умножения, и отличающееся тем, что за счет введения блока ввода информации, блока логарифмирования, блока умножения на константу, блока округления, блока формирования критической статистики, блока формирования вариационного ряда, блока определения максимального значения, блока формирования минимального значения, блока формирования интервалов вариационного ряда, блока формирования частот, блока возведения в обратную степень, блока сравнения и блока вывода информации позволяет решить техническую
задачу проверки однородности однотипных выборок на основе критерия Смирнова, и принять решение о принадлежности двух однотипных выборок одной генеральной совокупности для их дальнейшего объединения.

Claims (1)

  1. Устройство проверки однородности однотипных выборок, содержащее блок ввода исходной информации, один выход которого соединен со входом блока формирования критической статистики, второй и третий выходы соединены со входами первого блока суммирования, второго блока умножения и второго блока деления, третий выход также соединен со входом третьего блока деления, а четвертый и пятый выходы соединены со входами блоков формирования вариационного ряда и формирования частот; в свою очередь последовательно соединены первый блок суммирования, блок логарифмирования, блок умножения на константу, блок сложения с единицей и блок округления, один выход которого соединен со входом первого блока деления, а второй со входом блока формирования критической статистики, который последовательно соединен с блоками сравнения и вывода информации; аналогичным образом блок формирования вариационного ряда соединен блоками определения максимального и минимального значений, выходы которых являются входами для первого блока вычитания последовательно соединенного с первым блоком деления, блоком формирования интервалов, блоком формирования частот, причём первый и второй выходы которого соединены со входами второго и третьего блоков деления, которые последовательно соединены со вторым блоком вычитания и блоком возведения в квадрат, а третий выход со входом второго блока суммирования, который соединен последовательно с блоком возведения в степень, первым блоком умножения, третьим блоком суммирования и вторым блоком умножения, и отличающееся тем, что за счёт введения блока ввода информации, блока логарифмирования, блока умножения на константу, блока округления, блока формирования критической статистики, блока формирования вариационного ряда, блока определения максимального значения, блока формирования минимального значения, блока формирования интервалов вариационного ряда, блока формирования частот, блока возведения в обратную степень, блока сравнения и блока вывода информации позволяет решить техническую задачу проверки однородности однотипных выборок на основе критерия Смирнова, и принять решение о принадлежности двух однотипных выборок одной генеральной совокупности для их дальнейшего объединения.
    Figure 00000001
RU2014152429/08U 2014-12-23 2014-12-23 Устройство проверки однородности однотипных выборок RU155719U1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2014152429/08U RU155719U1 (ru) 2014-12-23 2014-12-23 Устройство проверки однородности однотипных выборок

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014152429/08U RU155719U1 (ru) 2014-12-23 2014-12-23 Устройство проверки однородности однотипных выборок

Publications (1)

Publication Number Publication Date
RU155719U1 true RU155719U1 (ru) 2015-10-20

Family

ID=54327783

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014152429/08U RU155719U1 (ru) 2014-12-23 2014-12-23 Устройство проверки однородности однотипных выборок

Country Status (1)

Country Link
RU (1) RU155719U1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU182446U1 (ru) * 2018-03-13 2018-08-17 Федеральное государственное бюджетное образовательное учреждение высшего образования "Казанский государственный энергетический университет" Усовершенствованное устройство проверки однородности нескольких однотипных выборок

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU182446U1 (ru) * 2018-03-13 2018-08-17 Федеральное государственное бюджетное образовательное учреждение высшего образования "Казанский государственный энергетический университет" Усовершенствованное устройство проверки однородности нескольких однотипных выборок

Similar Documents

Publication Publication Date Title
US9348887B2 (en) Decision tree insight discovery
CN113435602A (zh) 确定机器学习样本的特征重要性的方法及系统
Zöller et al. The maximum possible and the maximum expected earthquake magnitude for production‐induced earthquakes at the gas field in Groningen, The Netherlands
WO2021180009A1 (zh) 一种数据检测方法及装置
CN113947336A (zh) 评估投标企业风险的方法、装置、存储介质及计算机设备
RU155719U1 (ru) Устройство проверки однородности однотипных выборок
US7805329B2 (en) Development of actual risk costs based on estimated risk costs as well as probabilistic restriction of the actual risk costs
Acharya et al. Adaptive estimation in weighted group testing
US20150287050A1 (en) Split testing framework
Abdi et al. Coefficients of correlation, alienation and determination
RU182446U1 (ru) Усовершенствованное устройство проверки однородности нескольких однотипных выборок
Wu et al. Validation of nonparametric two-sample bootstrap in ROC analysis on large datasets
WO2020124977A1 (zh) 生产数据处理方法、装置、计算机设备和存储介质
US20230325757A1 (en) Computer-implemented method and system for testing a model
US20230237076A1 (en) Automatically drawing infographics for statistical data based on a data model
CN115344495A (zh) 批量任务测试的数据分析方法、装置、计算机设备及介质
WO2023009275A1 (en) Method and system for evaluating peer groups for comparative anomaly
CN109885504B (zh) 推荐系统的测试方法、装置、介质及电子设备
Perkins et al. Some deficiencies of χ2 and classical exact tests of significance
Perkins et al. χ2 and classical exact tests often wildly misreport significance; the remedy lies in computers
McDonald et al. Extending computations for disparity testing when data sources are uncertain
Städler et al. Two-sample testing in high-dimensional models
CN110837525A (zh) 数据处理方法及其装置、电子设备以及计算机可读介质
CN111125185A (zh) 数据处理方法、装置、介质及电子设备
Lopes et al. Mallows distance in VARFIMA (0, d, 0) processes

Legal Events

Date Code Title Description
MM1K Utility model has become invalid (non-payment of fees)

Effective date: 20151224