Многократные измерения. Проверка нормальности закона распределения


Для нахождения доверительного интервала необходимо знать вид закона распределения. Обычно, вид закона заранее не известен. В этом случае выдвигают гипотезу о виде закона, и затем, статистически проверяют её. Среди прочих законов наибольший интерес представляют нормальные законы распределения. Это обусловлено тем, что результаты измерений определяются совместным влиянием многих факторов. Из теории вероятности известно, что величина, определяемая влияние большого числа факторов обычно распределяется по нормальному закону. Нормальный закон является удобным для использования, поскольку имеется таблица и пакеты прикладных программ, позволяющих производить соответствующие расчеты. Поэтому гипотеза, которая выдвигается при проверке закона – это гипотеза о нормальности распределения.

Проверка гипотезы могут производиться различными критериями. Выбор критерия определяются прежде всего количеством измерений. Если измерений меньше 6-8, то ,обычно, статистическую проверку не производят – слишком мало данных. Хотя есть мат. аппарат, позволяющих решать при 3-х измерениях. В этом случае необходимо иметь априорную информацию и виде закона либо использовать неравенство Чебышева.

Наиболее достоверная проверка нормальности закона распределения может быть когда количество измерений N больше 45. Обычно, в этом случае используют критерий Хи квадрат (критерий Пирсона). Сущность этого критерия заключается в том, что строят гистограмму распределения результатов, а затем сравнивают  реальную вероятность попадания результатов измерения в определённый интервал с теоретической вероятностью, которая имела бы место если бы закон был нормальным.

При построении гистограммы важным моментом является разбивка диапазона возможных значений измеряемой величины на интервалы. Для этого, прежде всего, находят диапазон    Qmin-Qmax а затем разбивают на K интервалов, равных друг другу. Его выбирают исходя из N. При N от 100 до 500 K равно 8-12 интервалов, и от 500 до 1000 К равно от 10 до 18.

Стремятся к тому чтобы в каждом интервале было не менее 3-5 измерений.

Затем подсчитывают mj – это число, попавшее в  интервал j и строят гистограмму в осях Q и mj/n

По существу mj/n –это статистическая частота попадания результата в j-й интервал.

На данном этапе по виду гистограммы уже можно отвергнуть гипотезу, если гистограмма явно не соответствует нормальному закону. Для принятия гипотезы о нормальности распределения за меру расхождения экспериментальных данных с теоретическим законом  принимают разность между экспериментальной частотой mj/n и теоретической вероятности Pj и рассчитывают параметры Хи2 . 

Хи2=сума от I до К * n/p (mj/n-Pj)2

Если Хи2 меньше Хи20, то с принятой доверительной вероятностью гипотеза о нормальности распределения принимается. Если неравенство не выполняется, то гипотеза отвергается. В этом случае выдвигают гипотезу о другом законе распределения, который так же  проверяется по критерию Пирсона до тех пор, пока не будет выявлен приемлемый закон распределения.

На практике количество распределений обычно N меньше 30-40/ в этом случае применяется составной критерий. Он состоит из 2-х этапов:

1) Находят коэффициент d, который определяется следующей формулой:

D=(сумма I Qi – Q I) / корень n сумма (Q1-Q)2.  Затем задаётся p1 с учётом n находят границы принятия гипотезы dmin  dmax

Проверяют следующие неравенства: dmin меньше или равно d меньше или равно dmax если оно выполняется, то первый этап считается пройденным и переходят ко 2-му этапу. Если не выполняется, то гипотеза отвергается.

2) Задаются доверительной информацией P2 и по соответствующим статистическим таблицам определяют значение m tpi . затем определяют количество экспериментальных результатов измерений которое выходит за интервал Q+-Sqtpi и проверяют неравенство mэкс меньше или равно m.

Если неравенство не выполняется, то гипотеза о нормальности отвергается, а если выполняется, то гипотеза о нормальности применяется с вероятностью:

P больше или равно P1+P2-1

Если гипотеза о нормальности распределения отвергается, то t определяется из неравенства Чебышева: P больше или равно 1-1/t2


Предыдущие материалы: Следующие материалы: