RU155719U1 - Устройство проверки однородности однотипных выборок - Google Patents
Устройство проверки однородности однотипных выборок Download PDFInfo
- Publication number
- RU155719U1 RU155719U1 RU2014152429/08U RU2014152429U RU155719U1 RU 155719 U1 RU155719 U1 RU 155719U1 RU 2014152429/08 U RU2014152429/08 U RU 2014152429/08U RU 2014152429 U RU2014152429 U RU 2014152429U RU 155719 U1 RU155719 U1 RU 155719U1
- Authority
- RU
- Russia
- Prior art keywords
- unit
- block
- series
- input
- samples
- Prior art date
Links
Images
Landscapes
- Complex Calculations (AREA)
Abstract
Устройство проверки однородности однотипных выборок, содержащее блок ввода исходной информации, один выход которого соединен со входом блока формирования критической статистики, второй и третий выходы соединены со входами первого блока суммирования, второго блока умножения и второго блока деления, третий выход также соединен со входом третьего блока деления, а четвертый и пятый выходы соединены со входами блоков формирования вариационного ряда и формирования частот; в свою очередь последовательно соединены первый блок суммирования, блок логарифмирования, блок умножения на константу, блок сложения с единицей и блок округления, один выход которого соединен со входом первого блока деления, а второй со входом блока формирования критической статистики, который последовательно соединен с блоками сравнения и вывода информации; аналогичным образом блок формирования вариационного ряда соединен блоками определения максимального и минимального значений, выходы которых являются входами для первого блока вычитания последовательно соединенного с первым блоком деления, блоком формирования интервалов, блоком формирования частот, причём первый и второй выходы которого соединены со входами второго и третьего блоков деления, которые последовательно соединены со вторым блоком вычитания и блоком возведения в квадрат, а третий выход со входом второго блока суммирования, который соединен последовательно с блоком возведения в степень, первым блоком умножения, третьим блоком суммирования и вторым блоком умножения, и отличающееся тем, что за счёт введения блока ввода информации, блока логарифмирования, блока умноже�
Description
Полезная модель относится к обработке цифровых данных с помощью компьютерных систем, использующих модели, основанные на знаниях, и может быть использовано при решении задач исследования экспериментальных данных различных технических средств и комплексов. Работа выполнена в рамках соглашения с Минобрнауки РФ от 20 октября 2014 г. №14.577.21.0121 (уникальный идентификатор прикладных научных исследований (проекта) RFMEFI57714X0121).
Наиболее близким по технической сущности к заявленной полезной модели (прототипом) следует считать устройство сбалансированного оценивания показателей надежности технической системы на основе объединения двух выборок (патент RU №63949 U1, МПК G06F 7/00, опубликовано 10.06.2007 бюл. №16).
Недостатком данного устройства является то, что представленные экспериментальные данные не проходят процедуру проверки их однородности, поэтому при объединении не учитывается фактор возможной неоднородности, т.к. общая выборка считается неоднородной приводимой к однородной. Такое слияние однотипных, но неоднородных выборок, приводит к снижению качества оценок, а в ряде случаев и к их полной непригодности.
Технической задачей предполагаемой полезной модели является предварительная проверка однородности представленных выборок (определение принадлежности этих выборок одной генеральной совокупности) с использованием критерия Смирнова, по результатам которой можно сделать вывод о возможности последующего объединения этих данных.
Техническим результатом решения поставленной выше задачи является повышение качества статистических оценок экспериментальных данных за счет предварительной проверки их однородности с использованием критерия Смирнова и, в случае положительного решения, последующего увеличения объема представленных выборок путем их объединения в одну генеральную совокупность.
По результатам эксплуатации может накапливаться целый ряд выборок по однотипным техническим средствам и комплексам. Однотипность не означает равноценности объектов по их показателям. Выборки, характеризующие различные однотипные объекты или один и тот же объект в различные периоды эксплуатации, вообще говоря, могут быть неоднородными. Неоднородность означает, что выборки принадлежат различным законам распределения, которые различаются или только параметрами при одном и том же виде, или видом и параметрами распределения.
Задачи обработки однотипных выборок подразделяются на две группы. К первой группе относятся задачи объединения выборок. Объединение выборок позволяет повысить точность оценок за счет увеличения объема обрабатываемых экспериментальных данных. Простое слияние однотипных, но неоднородных выборок для последующей оценки показателей по объединенной выборке, приводит к снижению качества оценок или даже к их полной непригодности. Необходимо применение специальных приемов объединения разнородных сведений в интересах использования всей содержащейся в выборках информации. Таким образом, при объединении выборок необходимо сначала проверить их однородность. Однородные выборки сливаются в одну общую выборку, которая обрабатывается с помощью обычных методов. Неоднородные выборки обрабатываются раздельно или объединяются с помощью специальных приемов.
Вторая группа задач связана с сопоставлением параметров распределения выборок, т.е. с определением существенных различий в
значениях параметров однотипных выборок. Наиболее широкое распространение получил один из видов подобного рода задач, так называемый дисперсионный анализ. В дисперсионном анализе исследуются методы проверки гипотезы о равенстве математических ожиданий случайных величин, представленных выборками ограниченного объема. Непосредственное сравнение оценок математических ожиданий совокупности выборок оказывается менее эффективным, чем сопоставление оценок дисперсий, это обстоятельство и дало наименование методу. Подобные задачи возникают при исследовании влияния каких-либо параметров на показатели качества объекта.
Итак, пусть имеются выборки по одному устройству, но полученные на различных интервалах времени наблюдений, или имеются выборки по однотипным устройствам, сформированные за один и тот же или различные периоды наблюдений. Количество таких поступивших на обработку выборок m - не менее двух, каждая выборка имеет свой объем ni, i=1, 2, …, m. Априорных сведений об однородности или неоднородности различных выборок нет.
Следовательно, объектом обработки выступает совокупность независимых выборок результатов наблюдений по одному и тому же показателю однотипных объектов
Эта совокупность состоит из m слоев (строк). Каждая i-я строка (i=1, 2, …, m) представляет собой однородную случайную выборку результатов наблюдений за значениями случайной величины X, Y, …, W соответственно. Слой характеризуется своим, в общем случае векторным, параметром Ti распределения и может иметь свои статистики, т.е. свои функции от выборочных значений.
По возможности объединения информации из совокупности однотипных выборок можно выделить три типовые ситуации:
различные слои представляют собой однородные выборки. Это является следствием однотипности объектов, близости режимов использования и одинаковости внешних воздействий на исследуемые средства. В такой идеализированной ситуации выборки можно объединить и определять искомые параметры, используя традиционный аппарат математической статистики. Данная ситуация предоставляет наибольшие возможности использования информации, содержащейся в экспериментальных данных, именно в таком случае удается достичь максимальной эффективности оценок показателей, т.е. объединение обеспечивает потенциальную возможность полного использования сведений, содержащихся в выборках;
совокупность слоев частично неоднородна. Тогда однородные слои, если таковые обнаружатся, целесообразно объединить, а оставшиеся неоднородные группы выборок обрабатывать раздельно. В этой ситуации всю содержащуюся в выборках информацию полностью извлечь не удается. Однако существуют простые приемы получения некоторых оценок параметров распределения по совокупности неоднородных выборок;
слои полностью или частично неоднородны. Но, в дополнение к результатам наблюдений, имеется априорная информация о взаимосвязи параметров Ti различных выборок. Такие взаимосвязи устанавливаются на основе изучения сущности процессов, протекающих в объектах, и могут задаваться различными способами - в виде аналитических соотношений, ограничений на значения параметров и т.п. Чем выше уровень априорной информированности о взаимосвязях параметров, тем потенциально более высокой эффективности оценок показателей можно достичь.
Следовательно, объединение слоев всегда следует начинать с проверки однородности выборок.
Принцип действия предложенного устройства основан на использовании критерия проверки однородности Смирнова для последующего вывода о принадлежности этих выборок одной генеральной совокупности и возможности их объединения. Этот критерий предназначен для проверки гипотезы совпадения законов распределения в двух генеральных совокупностях по группированным выборкам, извлеченным из этих совокупностей. Пусть имеется l выборок объемов соответственно n1, n2, …, n1 и пусть данные каждой из этих выборок сгруппированы, причем разбиение диапазонов исследуемых случайных величин на интервалы группирования во всех выборках произведено одинаковым способом (при этом выбор общего диапазона варьирования анализируемого признака во всех выборках определяется наименьшим, по всем выборкам, из минимальных выборочных значений и наибольшим из максимальных выборочных значений). В предлагаемом устройстве количество интервалов определяется по формуле Стерджесса
Таким образом, имеется s одних и тех же для всех выборок интервалов группирования и пусть υij - количество элементов i-й выборки, попавших в j-й интервал (i=1, 2, …, l; j=1, 2, …, s). В качестве критической статистики критерия используется величина
где - общее число элементов i-й выборки, - общее (по всем выборкам) число выборочных данных, попавших в j-й интервал группирования и - суммарный (по всем выборкам) объем выборочных данных.
Н.В. Смирновым было доказано, что при неограниченном росте объемов всех выборок и в условиях справедливости проверяемой гипотезы закон распределения статистики стремится к закону χ2 с числом степеней
свободы, равным (l-1)(s-1). Поэтому, в соответствии с общей логикой статистического критерия гипотеза об однородности исследуемых выборок отвергается, если или , и принимается при всех остальных значениях критической статистики γ(n) (здесь - табличное значение 100q%-ной точки «хи-квадрат» распределения с m степенями свободы).
В частном случае двух выборок (при l=2) статистика (2) может быть записана в виде
и при условии справедливости гипотезы однородности она будет приблизительно распределена (при больших объемах n1 и n2) по закону χ2 с s-1 степенью свободы.
Предложенный Н.В.Смирновым способ проверки однородности однотипных выборок может быть реализован при помощи следующего устройства (фиг. 1), где обозначено:
1 - блок ввода исходной информации об анализируемых выборках (выборки X1 и Х2, объемы выборок n1 и n2, уровень значимости p);
2 - первый блок суммирования;
3 - блок логарифмирования;
4 - блок умножения на константу;
5 - блок сложения с единицей;
6 - блок округления до ближайшего целого числа, определение;
7 - блок формирования вариационного ряда;
8 - блок определения максимального значения Xmax;
9 - блок определения минимального значения Xmin;
10 - первый блок вычитания;
11 - первый блок деления
12 - блок формирования S интервалов вариационного ряда;
14 - второй блок суммирования;
15 - второй блок деления;
16 - третий блок деления;
17 - блок возведения в обратную степень;
18 - второй блок вычитания;
19 - блок возведения в квадрат;
20 - первый блок умножения;
21 - третий блок суммирования;
22 - второй блок умножения;
23 - блок сравнения;
25 - блок вывода информации.
Определение однородности анализируемых выборок производится по описанной схеме следующим образом.
В блок 1 вводится исходная информация об анализируемых выборках, включающая в себя: выборки X1 и Х2, их объемы n1 и n2, уровень доверительной информации р, с которой будет принята гипотеза о однородности представленных данных. Из блока 1 информация об объемах выборок n1 и n2 поступает в первый блок суммирования 2, где определяется суммарный объем обеих выборок N. Далее в блоке логарифмирования 3 определяется десятичный логарифм от N, ив блоке умножения на константу 4 полученное число увеличивается в 3,322 раз. В блоке сложения 5 производится увеличение произведения на единицу, с последующим округление полученного числа до ближайшего целого в блоке округления 6. Таким образом, в блоке округления 6 формируется информация о числе интервалов S, на которые в последующем будет разбита объединенная выборка.
На вход блока формирования вариационного ряда 7 подается информация об анализируемых выборках Х1 и Х2. В блоках 8 и 9 определяются минимальное Xmin и максимальное Xmax значения из полученного вариационного ряда. Первый блок вычитания 10 позволяет определить величину размаха вариационного ряда (Xmax-Xmin). Информация об величине интервалов, полученная в результате деления величины (Xmax-Xmin) в первом блоке деления 11 на количество этих интервалов S из блока округления 6, поступает на вход блока формирования 12, в котором производится разбиение вариационного ряда (объединенной выборки) на интервалов. В блоке 13 происходит формирование частот попадания значений (υ1j и υ2j) анализируемых выборок в интервалы, полученные из блока 12, и последующее их сложение во втором блоке суммированиям. Также информация от частотах (υ1j и υ2j) подается на входы блоков деления 15, 16, и далее на вход блока вычитания 18. Блок 19 осуществляет возведение в квадрат полученной в блоке вычитания 18 разности. В первом блоке умножения 20 производится перемножение величин из блоков 17 и 19, и их последующее сложение по всем интервалам в третьем блоке суммирования 21. Второй блок умножения 22 перемножает данные поступившие из блока 21 и данные об объемах выборок n1 и n2 из блока ввода информации 1. Таким образом, на выходе блока 22 получена статистика χ2, характеризующая объединенную выборку. В блоке 24 на основании информации о уровне значимости р и количестве степеней свободы, соответствующем величине S, формируется критическое значение статистики . Блок сравнения 23 определяет, превышает или нет статистика χ2 значения критического параметра . Результат сравнения, по которому можно сделать вывод об однородности выборок X1 и Х2 и последующей возможности их объединения в одну, поступает в блок 25 вывода, где регистрируются и отображаются любым известным способом (печать, индикация, запись и т.п.).
Таким образом, устройство проверки однородности однотипных выборок, содержащее блок ввода исходной информации, один выход которого соединен со входом блока формирования критической статистики, второй и третий выходы соединены со входами первого блока суммирования, второго блока умножения и второго блока деления, третий выход также соединен со входом третьего блока деления, а четвертый и пятый выходы соединены со входами блоков формирования вариационного ряда и формирования частот; в свою очередь последовательно соединены первый блок суммирования, блок логарифмирования, блок умножения на константу, блок сложения с единицей и блок округления, один выход которого соединен со входом первого блока деления, а второй со входом блока формирования критической статистики, который последовательно соединен с блоками сравнения и вывода информации; аналогичным образом блок формирования вариационного ряда соединен блоками определения максимального и минимального значений, выходы которых являются входами для первого блока вычитания последовательно соединенного с первым блоком деления, блоком формирования интервалов, блоком формирования частот, причем первый и второй выходы которого соединены со входами второго и третьего блоков деления, которые последовательно соединены со вторым блоком вычитания и блоком возведения в квадрат, а третий выход со входом второго блока суммирования, который соединен последовательно с блоком возведения в степень, первым блоком умножения, третьим блоком суммирования и вторым блоком умножения, и отличающееся тем, что за счет введения блока ввода информации, блока логарифмирования, блока умножения на константу, блока округления, блока формирования критической статистики, блока формирования вариационного ряда, блока определения максимального значения, блока формирования минимального значения, блока формирования интервалов вариационного ряда, блока формирования частот, блока возведения в обратную степень, блока сравнения и блока вывода информации позволяет решить техническую
задачу проверки однородности однотипных выборок на основе критерия Смирнова, и принять решение о принадлежности двух однотипных выборок одной генеральной совокупности для их дальнейшего объединения.
Claims (1)
- Устройство проверки однородности однотипных выборок, содержащее блок ввода исходной информации, один выход которого соединен со входом блока формирования критической статистики, второй и третий выходы соединены со входами первого блока суммирования, второго блока умножения и второго блока деления, третий выход также соединен со входом третьего блока деления, а четвертый и пятый выходы соединены со входами блоков формирования вариационного ряда и формирования частот; в свою очередь последовательно соединены первый блок суммирования, блок логарифмирования, блок умножения на константу, блок сложения с единицей и блок округления, один выход которого соединен со входом первого блока деления, а второй со входом блока формирования критической статистики, который последовательно соединен с блоками сравнения и вывода информации; аналогичным образом блок формирования вариационного ряда соединен блоками определения максимального и минимального значений, выходы которых являются входами для первого блока вычитания последовательно соединенного с первым блоком деления, блоком формирования интервалов, блоком формирования частот, причём первый и второй выходы которого соединены со входами второго и третьего блоков деления, которые последовательно соединены со вторым блоком вычитания и блоком возведения в квадрат, а третий выход со входом второго блока суммирования, который соединен последовательно с блоком возведения в степень, первым блоком умножения, третьим блоком суммирования и вторым блоком умножения, и отличающееся тем, что за счёт введения блока ввода информации, блока логарифмирования, блока умножения на константу, блока округления, блока формирования критической статистики, блока формирования вариационного ряда, блока определения максимального значения, блока формирования минимального значения, блока формирования интервалов вариационного ряда, блока формирования частот, блока возведения в обратную степень, блока сравнения и блока вывода информации позволяет решить техническую задачу проверки однородности однотипных выборок на основе критерия Смирнова, и принять решение о принадлежности двух однотипных выборок одной генеральной совокупности для их дальнейшего объединения.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014152429/08U RU155719U1 (ru) | 2014-12-23 | 2014-12-23 | Устройство проверки однородности однотипных выборок |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014152429/08U RU155719U1 (ru) | 2014-12-23 | 2014-12-23 | Устройство проверки однородности однотипных выборок |
Publications (1)
Publication Number | Publication Date |
---|---|
RU155719U1 true RU155719U1 (ru) | 2015-10-20 |
Family
ID=54327783
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2014152429/08U RU155719U1 (ru) | 2014-12-23 | 2014-12-23 | Устройство проверки однородности однотипных выборок |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU155719U1 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU182446U1 (ru) * | 2018-03-13 | 2018-08-17 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Казанский государственный энергетический университет" | Усовершенствованное устройство проверки однородности нескольких однотипных выборок |
-
2014
- 2014-12-23 RU RU2014152429/08U patent/RU155719U1/ru not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU182446U1 (ru) * | 2018-03-13 | 2018-08-17 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Казанский государственный энергетический университет" | Усовершенствованное устройство проверки однородности нескольких однотипных выборок |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9348887B2 (en) | Decision tree insight discovery | |
CN113435602A (zh) | 确定机器学习样本的特征重要性的方法及系统 | |
Zöller et al. | The maximum possible and the maximum expected earthquake magnitude for production‐induced earthquakes at the gas field in Groningen, The Netherlands | |
WO2021180009A1 (zh) | 一种数据检测方法及装置 | |
CN113947336A (zh) | 评估投标企业风险的方法、装置、存储介质及计算机设备 | |
RU155719U1 (ru) | Устройство проверки однородности однотипных выборок | |
US7805329B2 (en) | Development of actual risk costs based on estimated risk costs as well as probabilistic restriction of the actual risk costs | |
Acharya et al. | Adaptive estimation in weighted group testing | |
US20150287050A1 (en) | Split testing framework | |
Abdi et al. | Coefficients of correlation, alienation and determination | |
RU182446U1 (ru) | Усовершенствованное устройство проверки однородности нескольких однотипных выборок | |
Wu et al. | Validation of nonparametric two-sample bootstrap in ROC analysis on large datasets | |
WO2020124977A1 (zh) | 生产数据处理方法、装置、计算机设备和存储介质 | |
US20230325757A1 (en) | Computer-implemented method and system for testing a model | |
US20230237076A1 (en) | Automatically drawing infographics for statistical data based on a data model | |
CN115344495A (zh) | 批量任务测试的数据分析方法、装置、计算机设备及介质 | |
WO2023009275A1 (en) | Method and system for evaluating peer groups for comparative anomaly | |
CN109885504B (zh) | 推荐系统的测试方法、装置、介质及电子设备 | |
Perkins et al. | Some deficiencies of χ2 and classical exact tests of significance | |
Perkins et al. | χ2 and classical exact tests often wildly misreport significance; the remedy lies in computers | |
McDonald et al. | Extending computations for disparity testing when data sources are uncertain | |
Städler et al. | Two-sample testing in high-dimensional models | |
CN110837525A (zh) | 数据处理方法及其装置、电子设备以及计算机可读介质 | |
CN111125185A (zh) | 数据处理方法、装置、介质及电子设备 | |
Lopes et al. | Mallows distance in VARFIMA (0, d, 0) processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM1K | Utility model has become invalid (non-payment of fees) |
Effective date: 20151224 |