Статистика
<<  Статистические показатели работы органов ЗАГС Республики Татарстан за 2014 год Вопросы организации мониторинга наркологической ситуации в ХМАО – Югре и порядке заполнения статистической ф. 37 и ф.11  >>
Ещё 2 примера исползования статистических критериев
Ещё 2 примера исползования статистических критериев
Ещё 2 примера исползования статистических критериев
Ещё 2 примера исползования статистических критериев
Проверим гипотезу о том, что базальтовые столбики являются 6-ти
Проверим гипотезу о том, что базальтовые столбики являются 6-ти
D
D
Максимальное расхождение соответствует классу 5-гранных столбиков и
Максимальное расхождение соответствует классу 5-гранных столбиков и
Обращаемся к таблице критических значений критерия Колмогорова –
Обращаемся к таблице критических значений критерия Колмогорова –
Долина Смерти (США, Калифорния)
Долина Смерти (США, Калифорния)
СЗ Памир
СЗ Памир
Критерий Колмогорова – Смирнова для двух выборок
Критерий Колмогорова – Смирнова для двух выборок
Статистика критерия Колмогорова – Смирнова:
Статистика критерия Колмогорова – Смирнова:
Теоретические распределения
Теоретические распределения
Нормальное распределение (распределение Гаусса)
Нормальное распределение (распределение Гаусса)
Параметры нормального распределения
Параметры нормального распределения
Параметры нормального распределения
Параметры нормального распределения
Параметры нормального распределения
Параметры нормального распределения
Стандартное нормальное распределение
Стандартное нормальное распределение
Стандартное нормальное распределение
Стандартное нормальное распределение
Стандартизация
Стандартизация
Стандартное нормальное распределение
Стандартное нормальное распределение
Вычисление вероятностей сводится к нахождению определенных интегралов
Вычисление вероятностей сводится к нахождению определенных интегралов
Чтобы пользоваться такими таблицами, нужно предварительно
Чтобы пользоваться такими таблицами, нужно предварительно
68,27% наиболее часто встречающихся значений нормально распределённой
68,27% наиболее часто встречающихся значений нормально распределённой
Квантили вероятности
Квантили вероятности
Коэффициенты вероятности
Коэффициенты вероятности
q0,85 =
q0,85 =
Проверка гипотезы о соответствии распределения наблюдаемой переменной
Проверка гипотезы о соответствии распределения наблюдаемой переменной
Критерий Колмогорова - Смирнова
Критерий Колмогорова - Смирнова
Проверьте соответствие нормальному распределению значений степени
Проверьте соответствие нормальному распределению значений степени
Распределение Стьюдента (t – распределение)
Распределение Стьюдента (t – распределение)
Коэффициенты вероятности t распределения Стьюдента при заданной
Коэффициенты вероятности t распределения Стьюдента при заданной
Оценка погрешности среднего значения
Оценка погрешности среднего значения
Критерий
Критерий
Критерий
Критерий
Парадокс Монти Холла
Парадокс Монти Холла
Статистика критерия Колмогорова – Смирнова:
Статистика критерия Колмогорова – Смирнова:

Презентация на тему: «Ещё 2 примера исползования статистических критериев». Автор: Марков. Файл: «Ещё 2 примера исползования статистических критериев.ppt». Размер zip-архива: 5586 КБ.

Ещё 2 примера исползования статистических критериев

содержание презентации «Ещё 2 примера исползования статистических критериев.ppt»
СлайдТекст
1 Ещё 2 примера исползования статистических критериев

Ещё 2 примера исползования статистических критериев

2 Ещё 2 примера исползования статистических критериев
3 Проверим гипотезу о том, что базальтовые столбики являются 6-ти

Проверим гипотезу о том, что базальтовые столбики являются 6-ти

гранными, предполагая, что отклонения от этого – следствие случайных флуктуаций.

Сравним с гистограммой теоретической модели

Отобразим эти данные на гистограмме.

воспользуемся результатами измерений, приведённых в учебнике Чини.

Теоретическая гистограмма

n=33

n=33

Обратите внимание на то, обе гистограммы построены по одинаковому количеству наблюдений (33).

Выполним статистический анализ.

1. Формулировка нулевой и альтернативной гипотез:

Нулевая гипотеза (H0): центры сжатия равно отстоят друг от друга и поэтому столбики получаются 6-ти гранными.

Альтернативная гипотеза (H1): центры сжатия не равноотстоящие, они распределены как-то иначе, вследствии чего формы поперечных сечений имеют некоторый разброс.

Классы (число граней)

Классы (число граней)

Частоты

Частоты

Базальт

3

1

4

3

5

8

6

15

7

4

8

1

9

0

10

1

?

33

4 D

D

2. Выбор критерия:

Выбираем критерий Колмогорова – Смирнова. Этот критерий позволяет сделать заключение о сходстве или различии эмпирического и теоретического распределения (кртерий Колмогорова) или о сходстве или различии двух эмпирических распределений (критерий Смирнова). Критерий не требует знания закона эмпирического распределения (т.е. является непараметрическим) и может применяться при малом объёме выборки.

3. Объём выборки и малая вероятность:

Были измерены 33 столбика (N=33). Размер критической области выберем равным 0,01

4. Выборочное распределение и статистики критерия:

Статистикой критерия КС является максимум расхождения D между теоретической и наблюдаемой интегральной функцией распределения (ИФР), измеренного по вертикальной шкале (кумулятивная вероятность)

Эмпирическая ИФР

Теоретическая ИФР

5 Максимальное расхождение соответствует классу 5-гранных столбиков и

Максимальное расхождение соответствует классу 5-гранных столбиков и

равно 0,36. Таким образом, статистика критерия D = 0.36.

6 Обращаемся к таблице критических значений критерия Колмогорова –

Обращаемся к таблице критических значений критерия Колмогорова –

Смирнова и находим критическое значение для двухстороннего критерия при выбранном нами значении малой вероятности a = 0,01 и объёме выборки N = 33.

5. Критическая область:

Нашей задаче соответствует двухсторонняя критическая область, поскольку нам не важно, какие столбики преобладают: имеющие больше 6 граней или меньше 6 граней.

0,01

Критическое значение D33;0,01 = 0,277

33

0,277

5. Решение:

Наблюдаемое значение статистики критерия, D = 0,36 попадает внутрь критической области, и, следовательно, мы отвергаем нулевую гипотезу и считаем, что центры сжатия не являются равноотстоящими друг от друга.

7 Долина Смерти (США, Калифорния)

Долина Смерти (США, Калифорния)

8 СЗ Памир

СЗ Памир

Такыр на поляне Сулоева

9 Критерий Колмогорова – Смирнова для двух выборок

Критерий Колмогорова – Смирнова для двух выборок

Ещё один пример.

Формы сечений базальтовых столбиков и глиняных табличек можно сравнить, построив интегральные функции распределения. Это может представлять интерес, если требуется сопоставить соответствующие механизмы образования или даже действие одного механизма образования в разных геологических обстановках. Здесь нас интересует, были ли обе выборки извлечены из одной и той же или одинаковых генеральных совокупностей.

Базальт

Глина

Классы (число граней)

Классы (число граней)

Частоты

Частоты

Базальт

Глина

3

1

1

4

3

7

5

8

10

6

15

8

7

4

6

8

1

4

9

0

0

10

1

0

?

33

36

10 Статистика критерия Колмогорова – Смирнова:

Статистика критерия Колмогорова – Смирнова:

Критические значения ?a критерия Колмогорова - Смирнова

По данным, приведённым в таблице, постройте в MS EXEL интегральные диаграммы и сравните выборки из базальтов и глин с помощью критерия Колмогорова - Смирнова

Классы (число граней)

Классы (число граней)

Частоты

Частоты

Базальт

Глина

3

1

1

4

3

7

5

8

10

6

15

8

7

4

6

8

1

4

9

0

0

10

1

0

?

33

36

Уровень значимости, a

0,4

0,3

0,2

0,1

0,05

0,025

0,01

0,005

0,001

0,0005

Критическое значение, ?

0,89

0,97

1,07

1,22

1,36

1,48

1,63

1,73

1,95

2,03

11 Теоретические распределения

Теоретические распределения

Было бы хорошо, если бы природа создавала генеральные совокупности в точном соответствии с математическими законами, но…

…Этого нет и мы вынуждены строить грубые приближения или предположения.

12 Нормальное распределение (распределение Гаусса)

Нормальное распределение (распределение Гаусса)

Многие наиболее мощные методы статистического анализа основаны на предположении, что лежащая в их основе переменная имеет распределение Гаусса.

Функция плотности вероятности

Интегральная функция вероятности

13 Параметры нормального распределения

Параметры нормального распределения

0.4

0.2

0.0

= 0.0

Параметр

(Математическое ожидание) определяет положение кривой на оси абсцисс

Оценкой

По выборке при нормальном распределении является среднее арифметическое

Которое вычисляется по формуле

14 Параметры нормального распределения

Параметры нормального распределения

1.0

0.8

0.6

0.4

0.2

0.0

= 0.0

Параметр

(Дисперсия) определяет форму кривой (островершинность)

Оценкой по выборке при нормальном распределении является выборочная дисперсия

Которая вычисляется по формуле

15 Параметры нормального распределения

Параметры нормального распределения

1.0

0.8

0.6

0.4

0.2

0.0

= 0.0

Параметр

(Дисперсия) определяет форму кривой (островершинность)

Оценкой по выборке при нормальном распределении является выборочная дисперсия

Которая вычисляется по формуле

16 Стандартное нормальное распределение

Стандартное нормальное распределение

1.0

0.8

0.6

0.4

0.2

0.0

Для выборки

17 Стандартное нормальное распределение

Стандартное нормальное распределение

1.0

0.8

0.6

0.4

0.2

0.0

= 0.0

18 Стандартизация

Стандартизация

1.0

0.8

0.6

0.4

0.2

0.0

19 Стандартное нормальное распределение

Стандартное нормальное распределение

Наиболее важное применение нормального закона распределения, как и других законов, состоит в решении задач двух типов: 1) определение вероятности появления случайной величины в заданном интервале; 2) определение интервала возможных значений случайной величины при заданной вероятности.

20 Вычисление вероятностей сводится к нахождению определенных интегралов

Вычисление вероятностей сводится к нахождению определенных интегралов

Для нахождения вероятности принято пользоваться специальными таблицами, которые составлены для стандартного нормального распределения.

Интеграл вероятности F(t) стандартного нормального закона

Плотность вероятности f(t) стандартного нормального закона

Функция вероятности попадания случайной величины в симметричный интервал от –t до +t

График плотности вероятности. Заштрихованная площадь соответствует вероятности попадания значений случайной величины в интервал от -t до +t

+t

t

0

–t

21 Чтобы пользоваться такими таблицами, нужно предварительно

Чтобы пользоваться такими таблицами, нужно предварительно

преобразовать исходные значения случайной величины по формуле

Такое преобразование называется стандартизацией.

Пример:

Интегральная функция распределения F(t)

Найти вероятность попадания случайной величины в интервал 2,4 – 2,96,

t1 = (2,4 – 2,2)/0,40 = 0,5

t2 = (2,96 – 2,2)/0,40 = 1,90

F(t1) = 0,6915

q = F(t2) – F(t1) = 0,2798

F(t2) = 0,9713

Для отрицательных значений t F(–t) = 1 – F(t): F(-1.2)=1-0.8849=0.1151

t

F(t)

f(t)

Ф(t)

t

F(t)

f(t)

Ф(t)

0,0

0,5000

0,3989

0,0000

1,6

0,9452

0,1109

0,8904

0,1

0,5398

0,3970

0,0797

1,7

0,9554

0,0940

0,9109

0,2

0,5793

0,3910

0,1585

1,8

0,9641

0,0790

0,9281

0,3

0,6179

0,3814

0,2358

1,9

0,9713

0,0656

0,9426

0,4

0,6554

0,3683

0,3108

2,0

0,9772

0,0540

0,9545

0,5

0,6915

0,3521

0,3829

2,1

0,9821

0,0440

0,9643

0,6

0,7257

0,3332

0,4515

2,2

0,9861

0,0355

0,9722

0,7

0,7580

0,3123

0,5161

2,3

0,9893

0,0283

0,9786

0,8

0,7881

0,2897

0,5763

2,4

0,9918

0,0224

0,9836

0,9

0,8159

0,2661

0,6319

2,5

0,9938

0,0175

0,9876

1,0

0,8413

0,2420

0,6827

2,6

0,9953

0,0136

0,9907

1,1

0,8643

0,2179

0,7287

2,7

0,9965

0,0104

0,9931

1,2

0,8849

0,1942

0,7699

2,8

0,9974

0,0079

0,9949

1,3

0,9032

0,1714

0,8064

2,9

0,9981

0,0060

0,9963

1,4

0,9192

0,1497

0,8385

3,0

0,9987

0,0044

0,9973

1,5

0,9332

0,1296

0,8664

3,1

0,9990

0,0033

0,9981

22 68,27% наиболее часто встречающихся значений нормально распределённой

68,27% наиболее часто встречающихся значений нормально распределённой

случайной величины лежат в интервале от -t до +t (µ±?, где µ - математическое ожидание; ? – стандартное отклонение

Функция вероятности попадания случайной величины в симметричный интервал от –t до +t

95,45% - в интервале µ ± 2?

99,73% - в интервале µ ± 3?

t

F(t)

f(t)

Ф(t)

t

F(t)

f(t)

Ф(t)

0,0

0,5000

0,3989

0,0000

1,6

0,9452

0,1109

0,8904

0,1

0,5398

0,3970

0,0797

1,7

0,9554

0,0940

0,9109

0,2

0,5793

0,3910

0,1585

1,8

0,9641

0,0790

0,9281

0,3

0,6179

0,3814

0,2358

1,9

0,9713

0,0656

0,9426

0,4

0,6554

0,3683

0,3108

2,0

0,9772

0,0540

0,9545

0,5

0,6915

0,3521

0,3829

2,1

0,9821

0,0440

0,9643

0,6

0,7257

0,3332

0,4515

2,2

0,9861

0,0355

0,9722

0,7

0,7580

0,3123

0,5161

2,3

0,9893

0,0283

0,9786

0,8

0,7881

0,2897

0,5763

2,4

0,9918

0,0224

0,9836

0,9

0,8159

0,2661

0,6319

2,5

0,9938

0,0175

0,9876

1,0

0,8413

0,2420

0,6827

2,6

0,9953

0,0136

0,9907

1,1

0,8643

0,2179

0,7287

2,7

0,9965

0,0104

0,9931

1,2

0,8849

0,1942

0,7699

2,8

0,9974

0,0079

0,9949

1,3

0,9032

0,1714

0,8064

2,9

0,9981

0,0060

0,9963

1,4

0,9192

0,1497

0,8385

3,0

0,9987

0,0044

0,9973

1,5

0,9332

0,1296

0,8664

3,1

0,9990

0,0033

0,9981

23 Квантили вероятности

Квантили вероятности

p

t

Чаще приходится решать обратную задачу: находить интервал возможных значений t при заданных вероятностях.

Значение, соответствующее заданной кумулятивной вероятности, называется квантилью вероятности. Его можно найти интерполяцией по таблице интегральной вероятности F(t)

t

F(t)

f(t)

Ф(t)

t

F(t)

f(t)

Ф(t)

0,0

0,5000

0,3989

0,0000

1,6

0,9452

0,1109

0,8904

0,1

0,5398

0,3970

0,0797

1,7

0,9554

0,0940

0,9109

0,2

0,5793

0,3910

0,1585

1,8

0,9641

0,0790

0,9281

0,3

0,6179

0,3814

0,2358

1,9

0,9713

0,0656

0,9426

0,4

0,6554

0,3683

0,3108

2,0

0,9772

0,0540

0,9545

0,5

0,6915

0,3521

0,3829

2,1

0,9821

0,0440

0,9643

0,6

0,7257

0,3332

0,4515

2,2

0,9861

0,0355

0,9722

0,7

0,7580

0,3123

0,5161

2,3

0,9893

0,0283

0,9786

Медиана

0,8

0,7881

0,2897

0,5763

2,4

0,9918

0,0224

0,9836

0,9

0,8159

0,2661

0,6319

2,5

0,9938

0,0175

0,9876

1,0

0,8413

0,2420

0,6827

2,6

0,9953

0,0136

0,9907

Чтобы получить реальное значение, надо провести преобразования, обратные стандартизации

1,1

0,8643

0,2179

0,7287

2,7

0,9965

0,0104

0,9931

1,2

0,8849

0,1942

0,7699

2,8

0,9974

0,0079

0,9949

1,3

0,9032

0,1714

0,8064

2,9

0,9981

0,0060

0,9963

1,4

0,9192

0,1497

0,8385

3,0

0,9987

0,0044

0,9973

1,5

0,9332

0,1296

0,8664

3,1

0,9990

0,0033

0,9981

3 квартиль

1 квартиль

Квантиль 0,95

1,0

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0,0

0

-1

3

-4

2

-5

1

5

4

-3

-2

24 Коэффициенты вероятности

Коэффициенты вероятности

Наиболее часто используют значения t, соответствующие заданной вероятности q = Ф(t). Они называются коэффициентами вероятности и служат критериями принятия разнообразных решений.

Для нахождения коэффициента вероятности можно воспользоваться интерполяцией данных таблицы Ф(t)

Функция вероятности попадания случайной величины в симметричный интервал от –t до +t

но лучше иметь специальную таблицу зависимости t от Ф(t).

t

F(t)

f(t)

Ф(t)

t

F(t)

f(t)

Ф(t)

0,0

0,5000

0,3989

0,0000

1,6

0,9452

0,1109

0,8904

0,1

0,5398

0,3970

0,0797

1,7

0,9554

0,0940

0,9109

0,2

0,5793

0,3910

0,1585

1,8

0,9641

0,0790

0,9281

0,3

0,6179

0,3814

0,2358

1,9

0,9713

0,0656

0,9426

0,4

0,6554

0,3683

0,3108

2,0

0,9772

0,0540

0,9545

0,5

0,6915

0,3521

0,3829

2,1

0,9821

0,0440

0,9643

0,6

0,7257

0,3332

0,4515

2,2

0,9861

0,0355

0,9722

0,7

0,7580

0,3123

0,5161

2,3

0,9893

0,0283

0,9786

0,8

0,7881

0,2897

0,5763

2,4

0,9918

0,0224

0,9836

0,9

0,8159

0,2661

0,6319

2,5

0,9938

0,0175

0,9876

1,0

0,8413

0,2420

0,6827

2,6

0,9953

0,0136

0,9907

1,1

0,8643

0,2179

0,7287

2,7

0,9965

0,0104

0,9931

1,2

0,8849

0,1942

0,7699

2,8

0,9974

0,0079

0,9949

1,3

0,9032

0,1714

0,8064

2,9

0,9981

0,0060

0,9963

1,4

0,9192

0,1497

0,8385

3,0

0,9987

0,0044

0,9973

1,5

0,9332

0,1296

0,8664

3,1

0,9990

0,0033

0,9981

+t

t

0

–t

25 q0,85 =

q0,85 =

Коэффициенты вероятности.

1,44

Коэффициенты вероятности t при заданной вероятности q = Ф(t)

На практике наиболее часто используются значения вероятностей q = 0,95 и q = 0,99. Им соответствуют коэффициенты вероятности t = 1,960 и t = 2,576. С другой стороны, часто задаются значения t = 2 и t = 3, им соответствуют вероятности q = 0,9545 и q = 0,9973.

q

0

1

2

3

4

5

6

7

8

9

0,0

0,000

0,013

0,025

0,038

0,050

0,063

0,075

0,088

0,100

0,130

0,1

0,126

0,138

0,151

0,164

0,176

0,189

0,202

0,215

0,228

0,240

0,2

0,253

0,266

0,279

0,292

0,305

0,319

0,332

0,345

0,358

0,372

0,3

0,385

0,399

0,412

0,426

0,440

0,454

0,468

0,482

0,496

0,510

0,4

0,524

0,539

0,553

0,568

0,583

0,598

0,613

0,628

0,643

0,659

0,5

0,674

0,690

0,706

0,722

0,739

0,755

0,772

0,789

0,806

0,824

0,6

0,842

0,860

0,878

0,896

0,915

0,935

0,954

0,974

0,994

1,015

0,7

1,036

1,058

1,080

1,103

1,126

1,150

1,175

1,200

1,227

1,254

0,8

1,282

1,311

1,341

1,372

1,405

1,440

1,476

1,514

1,555

1,598

0,9

1,645

1,695

1,751

1,812

1,881

1,960

2,054

2,170

2,326

2,576

0,99

2,576

2,612

2,652

2,697

2,748

2,807

2,878

2,968

3,090

3,291

26 Проверка гипотезы о соответствии распределения наблюдаемой переменной

Проверка гипотезы о соответствии распределения наблюдаемой переменной

нормальному распределению с помощью непараметрических критериев.

Проверка основана на сравнении эмпирических частот с теоретическими

Класс содержаний х, %

ni

t

f(t)

nt

Выполняется группировка данных и подсчёт частоты

По таблицам определяется значение функции плотности вероятности f(t) для центрального значения каждого класса или (если использовались границы интервалов) разность интегральной вероятности верней и нижней границы класса.

Далее можно пересчитать частоты в частости (делением каждой частоты на объём выборки), найти максимальную разность и применить критерий Колмогорова-Смирнова.

30-32

2

-2,20

0,0355

2,1

32-34

6

-1,80

0,0790

4,6

34-36

9

-1,41

0,1476

8,6

36-38

14

-1,01

0,2396

13,9

38-40

20

-0,62

0,3292

19,1

40-42

25

-0,22

0,3894

22,6

42-44

21

0,17

0,3932

22,8

44-46

17

0,57

0,3391

19,7

46-48

13

0,96

0,2516

14,6

48-50

10

1,38

0,1582

9,2

50-52

5

1,75

0,0863

5,0

52-54

3

2,15

0,0396

2,3

54-56

2

2,55

0,0154

0,9

Сумма

147

2,5037

145,4

27 Критерий Колмогорова - Смирнова

Критерий Колмогорова - Смирнова

0.029 < 0.112 H0 принимается

Эмпирические

Эмпирические

Эмпирические

Теоретические

Теоретические

Теоретические

Разность

Частоты

Частости

Интегральные

Частоты

Частости

Интегральные

D

2

0.013605

0.013605

2.1

0.014443

0.014443

0.000837

6

0.040816

0.054422

4.6

0.031637

0.04608

0.008342

9

0.061224

0.115646

8.6

0.059147

0.105227

0.010419

14

0.095238

0.210884

13.9

0.095598

0.200825

0.010059

20

0.136054

0.346939

19.1

0.131362

0.332187

0.014752

25

0.170068

0.517007

22.6

0.155433

0.48762

0.029386

21

0.142857

0.659864

22.8

0.156809

0.644429

0.015435

17

0.115646

0.77551

19.7

0.135488

0.779917

0.004407

13

0.088435

0.863946

14.6

0.100413

0.88033

0.016385

10

0.068027

0.931973

9.2

0.063274

0.943604

0.011631

5

0.034014

0.965986

5

0.034388

0.977992

0.012005

3

0.020408

0.986395

2.3

0.015818

0.99381

0.007416

2

0.013605

1

0.9

0.00619

1

0

28 Проверьте соответствие нормальному распределению значений степени

Проверьте соответствие нормальному распределению значений степени

серпентинизации (Serp) и скоростей продольных ультразвуковых волн (Vp) выборки из гипербазитов массива Рай-Из.

29 Распределение Стьюдента (t – распределение)

Распределение Стьюдента (t – распределение)

Критерий Стьюдента был разработан английским химиком У.Госсетом (William Sealy Gosset) , когда он работал на пивоваренном заводе Гиннеса и по условиям контракта не имел права открытой публикации своих исследований. Поэтому публикации своих статей по t-критерию У.Госсет сделал в 1908г. в журнале "Биометрика" под псевдонимом "Student", что в переводе означает "Студент". В отечественной же литературе принято писать "Стьюдент". Коварная простота вычисления t-критерия Стьюдента, а также его наличие в большинстве статистических пакетов и программ привели к широкому использованию этого критерия даже в тех условиях, когда применять его нельзя.

K – число степеней свободы, зависящее от объёма выборки.

При увеличении значения k распределение приближается к нормальному и в пределе (при k = ?) совпадает с ним. Практически уже при k = 20 можно пользоваться таблицами нормального распределения.

30 Коэффициенты вероятности t распределения Стьюдента при заданной

Коэффициенты вероятности t распределения Стьюдента при заданной

вероятности ? и степени свободы k

0,10

0,05

0,02

0,01

0,005

0,002

0,001

k

k

Вероятность ?

Вероятность ?

Вероятность ?

Вероятность ?

Вероятность ?

Вероятность ?

Вероятность ?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

22

24

26

28

30

40

50

100

?

6,314

12,706

31,821

63,657

127,321

318,309

636,619

2,920

4,303

6,965

9,925

14,089

22,327

31,599

2,353

3,182

4,541

5,841

7,453

10,214

12,924

2,132

2,776

3,747

4,604

5,597

7,173

8,610

2,015

2,571

3,365

4,032

4,773

5,893

6,869

1,943

2,447

3,143

3,707

4,317

5,208

5,959

1,895

2,365

2,998

3,499

4,029

4,785

5,408

1,860

2,306

2,896

3,355

3,833

4,501

5,041

1,833

2,262

2,821

3,250

3,690

4,297

4,781

1,812

2,228

2,764

3,169

3,581

4,144

4,587

1,796

2,201

2,718

3,106

3,497

4,025

4,437

1,782

2,179

2,681

3,055

3,428

3,930

4,318

1,771

2,160

2,650

3,012

3,372

3,852

4,221

1,761

2,145

2,624

2,977

3,326

3,787

4,140

1,763

2,131

2,602

2,947

3,286

3,733

4,073

1,746

2,120

2,583

2,921

3,252

3,686

4,015

1,740

2,110

2,567

2,898

3,222

3,645

3,985

1,734

2,101

2,552

2,878

3,197

3,610

3,922

1,729

2,093

2,540

2,861

3,174

3,579

3,883

1,725

22,086

2,528

2,845

3,153

3,552

3,849

1,717

2,074

2,508

2,819

3,119

3,505

3,792

1,711

2,064

2,492

2,797

3,091

3,467

3,745

1,706

2,056

2,479

2,779

3,067

3,435

3,707

1,701

2,048

2,467

2,763

3,047

3,408

3,674

1,697

2,042

2,457

2,750

3,030

3,385

3,646

1,684

2,021

2,423

2,704

2,971

3,307

3,551

1,676

2,009

2,403

2,678

2,937

3,261

3,496

1,660

1,984

2,364

2,626

2,871

3,174

3,390

1,645

1,960

2,326

2,576

2,807

3,090

3,291

31 Оценка погрешности среднего значения

Оценка погрешности среднего значения

Среднее значение из n независимых значений случайной величины также является случайной величиной. Если случайная величина имеет дисперсию , то среднее значение имеет дисперсию в n раз меньше

Дисперсия выборочных средних значений

Стандартное отклонение выборочных средних значений (стандартная ошибка среднего)

Относительная погрешность среднего

Интервальная оценка среднего среднего

Вероятность q = Ф(t)

Коэффициент вероятности t

Доверительный интервал

0,683

1

+ ?

0,954

2

+ 2?

0,997

3

+ 3?

32 Критерий

Критерий

(Хи-квадрат)

Параметром распределения хи-квадрат является число степеней свободы k , зависящее от числа классов гистограммы nk (обычно k = nk – 3).

Критерий хи-квадрат является альтернативой критерию Колмогорова-Смирнова. Из-за теоретических ограничений критерий хи-квадрат применим только к выборкам, объём которых не меньше 50, а минимальная частота отдельного класса не меньше 5.

Критерий предложен английским математиком Карлом Пирсоном в 1900 г. Этот критерий представляет собой сумму квадратов отклонений эмпирических частот от частот теоретических, отнесенную к теоретическим частотам.

Плотность вероятности этой величины описывается формулой

При увеличении числа степеней свободы распределение ?2 приближается к нормальному с математическим ожиданием k и дисперсией 2k.

Практически при числе степеней свободы k > 30 можно переходить к таблицам нормального распределения, заменив величину нормированной случайной величиной t:

33 Критерий

Критерий

Коэффициенты вероятности распределения при заданных вероятности ? и числе степеней свободы k

a = 0.05

k = 11-3 = 8

ni

nt

2.338402

k

k

Вероятность ?

Вероятность ?

Вероятность ?

Вероятность ?

Вероятность ?

k

k

Вероятность ?

Вероятность ?

Вероятность ?

Вероятность ?

Вероятность ?

0,10

0,05

0,025

0,01

0,005

0,10

0,05

0,025

0,01

0,005

1

2,71

3,84

5,02

6,64

7,88

16

23,54

26,30

28,84

32,00

34,27

2

4,60

5,99

7,38

9,21

10,66

17

24,77

27,59

30,19

33,41

35,72

3

6,25

7,82

9,35

11,34

12,54

18

25,99

28,87

31,53

34,80

37,16

4

7,78

9,49

11,14

13,28

14,86

19

27,20

30,14

32,85

36,19

38,58

5

9,24

11,07

12,83

15,09

16,75

20

28,41

31,41

34,17

37,57

40,00

6

10,64

12,59

14,45

16,81

18,55

21

29,62

32,67

35,48

38,93

41,40

7

12,02

14,07

16,01

18,48

20,28

22

30,81

33,92

36,78

40,29

42,80

8

13,36

15,51

17,54

20,09

21,96

23

32,01

35,16

38,08

41,64

44,18

9

14,68

16,92

19,02

21,67

23,59

24

33,20

36,42

39,36

42,98

45,56

10

15,99

18,31

20,48

23,21

25,19

25

34,38

37,65

40,65

44,31

46,93

11

17,28

19,68

21,92

24,72

26,76

26

35,56

38,88

41,92

45,64

46,29

12

18,55

21,03

23,34

26,22

28,30

27

36,74

40,11

43,19

46,96

49,64

13

19,81

22,36

24,74

27,69

29,82

28

37,92

41,34

44,46

48,28

50,99

14

21,06

23,68

26,12

29,14

31,32

29

39,09

42,56

45,72

49,59

52,34

15

22,31

25,00

27,49

30,58

32,80

30

40,26

43,77

46,98

50,89

53,67

2

6

8

6.7

0.252239

9

9

8.6

0.018605

14

14

13.9

0.000719

20

20

19.1

0.042408

25

22.6

0.254867

25

21

22.8

0.142105

21

17

19.7

0.370051

17

13

14.6

0.175342

13

10

9.2

0.069565

5

5

0

10

5

3.2

1.0125

5

3

2

34 Парадокс Монти Холла

Парадокс Монти Холла

1/3

1/3

1/3

В поисках автомобиля игрок выбирает дверь 1. Тогда ведущий открывает 3-ю дверь, за которой находится коза, и предлагает игроку изменить свой выбор на дверь 2. Стоит ли ему это делать?

2/3

1/3

2/3

0

2/3

Дверь 1

Дверь 2

Дверь 3

Результат если менять выбор

Результат если не менять выбор

Авто

Коза

Коза

Коза

Авто

Коза

Авто

Коза

Авто

Коза

Коза

Коза

Авто

Авто

Коза

Монти Холл – ведущий американского телешоу «Let’s Make a Deal»

35 Статистика критерия Колмогорова – Смирнова:

Статистика критерия Колмогорова – Смирнова:

Критические значения ?a критерия Колмогорова – Смирнова для сравнения 2-х выборок при N > 35:

D 0.05

D 0.01

По данным, приведённым в таблице, постройте в MS EXEL интегральные диаграммы и сравните выборки из базальтов и глин с помощью критерия Колмогорова - Смирнова

Классы (число граней)

Классы (число граней)

Частоты

Частоты

Базальт

Глина

3

1

1

4

3

7

5

8

10

6

15

8

7

4

6

8

2

4

9

1

0

10

1

0

?

35

36

«Ещё 2 примера исползования статистических критериев»
http://900igr.net/prezentacija/algebra/eschjo-2-primera-ispolzovanija-statisticheskikh-kriteriev-195848.html
cсылка на страницу
Урок

Алгебра

35 тем
Слайды
900igr.net > Презентации по алгебре > Статистика > Ещё 2 примера исползования статистических критериев