Статистика Скачать
презентацию
<<  Основы математической статистики Вероятность и математическая статистика  >>
Математическая статистика
Математическая статистика
Генеральная совокупность
Генеральная совокупность
Наука
Наука
Генеральная совокупность и выборка
Генеральная совокупность и выборка
Способы отбора
Способы отбора
Статистическое распределение выборки
Статистическое распределение выборки
Эмпирическая функция распределения
Эмпирическая функция распределения
Статистические оценки параметров распределения
Статистические оценки параметров распределения
Статистические оценки
Статистические оценки
Точечные оценки
Точечные оценки
Генеральная и выборочная средняя
Генеральная и выборочная средняя
Генеральная и выборочная дисперсии
Генеральная и выборочная дисперсии
Интервальные оценки
Интервальные оценки
Точность и надежность
Точность и надежность
Доверительный интервал
Доверительный интервал
Расчет доверительных интервалов
Расчет доверительных интервалов
Расчет доверительных интервалов при неизвестной дисперсии
Расчет доверительных интервалов при неизвестной дисперсии
Доверительный интервал для оценки дисперсии
Доверительный интервал для оценки дисперсии
Проверка статистических гипотез
Проверка статистических гипотез
Классификация гипотез
Классификация гипотез
Статистический критерий
Статистический критерий
Совокупность значений критерия
Совокупность значений критерия
Совокупность значений критерия
Совокупность значений критерия
Уровень значимости
Уровень значимости
Сравнение двух дисперсий
Сравнение двух дисперсий
Механизм проверки
Механизм проверки
Соответствие двух выборок
Соответствие двух выборок
Проверка гипотезы
Проверка гипотезы
Генеральные совокупности
Генеральные совокупности
Алгоритм проверки
Алгоритм проверки
Закон распределения
Закон распределения
Критерий Пирсона
Критерий Пирсона
Правила проверки
Правила проверки
Корреляционно-регрессионный анализ
Корреляционно-регрессионный анализ
Зависимость
Зависимость
Корреляционная зависимость
Корреляционная зависимость
Коэффициент корреляции
Коэффициент корреляции
Корреляционный момент
Корреляционный момент
Зависимость случайных величин
Зависимость случайных величин
Выборочное корреляционное отношение
Выборочное корреляционное отношение
Достоинства корреляционного отношения
Достоинства корреляционного отношения
Простейшие случаи криволинейной корреляции
Простейшие случаи криволинейной корреляции
Метод наименьших квадратов
Метод наименьших квадратов
Погрешность
Погрешность
Детали изготавливаются на разных станках
Детали изготавливаются на разных станках
Распределение относительных частот
Распределение относительных частот
Нормальное распределение
Нормальное распределение
Найти доверительный интервал
Найти доверительный интервал
Доверительный интервал для неизвестной дисперсии
Доверительный интервал для неизвестной дисперсии
Значение критерия
Значение критерия
Математическое ожидание
Математическое ожидание
Исправленные выборочные дисперсии
Исправленные выборочные дисперсии
Картинки из презентации «Элементы математической статистики» к уроку алгебры на тему «Статистика»

Автор: User. Чтобы познакомиться с картинкой полного размера, нажмите на её эскиз. Чтобы можно было использовать все картинки для урока алгебры, скачайте бесплатно презентацию «Элементы математической статистики.ppt» со всеми картинками в zip-архиве размером 306 КБ.

Скачать презентацию

Элементы математической статистики

содержание презентации «Элементы математической статистики.ppt»
Сл Текст Сл Текст
1Математическая статистика. Анохин Сергей, D-053 Кокорева 2595% случаях – с доверительной вероятностью. Пример.
Ирина, D-063 Руководитель: Попова И. Г. Северск-2005. 26Сравнение мат.ожиданий. Для проверки гипотезы, соответствие
2Содержание. Введение Генеральная совокупность и выборка двух выборок принад-лежности к одной и той же генеральной
Способы отбора Статистическое распределение выборки Эмпирическая совокупности, рассмотрим вопрос о значимости расхождений между
функция распределения Статистические оценки параметров выборочным значением математических ожиданий. Выдвинем нулевую
распределения Проверка статистических гипотез Проверка гипотезы гипотезу о равенстве математических ожиданий. Н0: Мx =Мy
о законе распределения генеральной совокупности Тестирование такой гипотезы основано: на нормальном
Корреляционно-регрессионный анализ. распределении в случае большого объема выборок (n>30), когда
3Введение. Математическая статистика – наука, занимающаяся дисперсии считаются известными на распределении Стьюдента в
методами обработки экспериментальных данных, полученных в случае малого объема выборок (n<30) когда дисперсии являются
результате наблюдений над случайными явлениями. При этом неизвестными. Сравнительные графики плотностей распределения
следующие задачи: описание явлений – упорядочить статистический нормального и Стьюдента приведены на рисунке: синей и розовой
материал, представить в удобном для экспериментатора виде линиями показано распределение Стьюдента, красной – нормальное.
(таблица, график, диаграмма); анализ и прогноз – приближенная 27Проверка гипотезы о равенстве средних при известных
оценка интересующих числовых событий (средняя, дисперсия) и дисперсиях. Для того чтобы при заданном уровне значимости ?
погрешности этих величин; выработка оптимальных решений – в =0.05 проверить нулевую гипотезу Н0: Мх=Му о равенстве
результате возникает задача проверки правдоподобности гипотез, математических ожиданий двух больших нормальных выборок с
решением которой является принятие или неприятие выдвинутой известными дисперсиями Dх и Dу, необходимо: Вычислить
гипотезы. Математическая статистика при решении своих задач наблюдаемое значение критерия: Построить критическую область в
опирается на размышляющий, оценивающий составляющий, аппарат зависимости от конкурирую-щей гипотезы: при конкурирующей
экспериментатора. гипотезе Н1: Мх ? Му по таблице функции Лапласа находят
4Генеральная совокупность и выборка. Полный набор всех критическую точку zкр из равенства Ф(zкр) = (1 – ?) /2. Если
возможных значений дискретной СВ называется генеральной |Zнабл| < zкр, то нет оснований отвергать нулевую гипотезу.
совокупностью. N – объем совокупности. Однако в реальности Если |Zнабл| > zкр, то нулевую гипотезу отвергают. при
провести сплошное обследование нецелесообразно и невозможно. На конкурирующей гипотезе Н1: Мх > Му по таблице функции Лапласа
практике ограничиваются выборкой. Часть генеральной совокупности находят критическую точку zкр из равенства Ф(zкр) = (1 – 2?) /2.
из n элементов, отобранных случайным образом называется Если Zнабл < zкр, то нет оснований отвергать нулевую
выборкой. n ? N Выборка с объемом < 30 называется выборкой гипотезу. Если Zнабл > zкр, то нулевую гипотезу отвергают.
малого объема. при конкурирующей гипотезе Н1: Мх < Му по таблице функции
5Способы отбора. Отбор, не требующий расчленения: простой, Лапласа находят «вспомогательную критическую точку» zкр из
бесповторный с повторениями Отбор, при котором вся генеральная равенства Ф(zкр) = (1 – 2?) /2. Если Zнабл > - zкр, то нет
совокупность делится на части механический типический серийный оснований отвергать нулевую гипотезу. Если Zнабл < - zкр, то
Простой – отбор, при котором объекты извлекаются из совокупности нулевую гипотезу отвергают.
по одному. Механический – генеральная совокупность «механически» 28Проверка гипотезы о равенстве средних при неизвестных
делится на группы. Выборка производится с каждой из групп. дисперсиях. Постановка задач: пусть генеральные совокупности
Типический – объекты выбирают не из всей совокупности, а из распределены нормально, причем их дисперсии Dx и Dy заранее не
каждой ее типической части. Серийный – объекты отбираются не по известны. Взяты две выборки малого объема, требуется сравнить
одному, а сериями, которую подвергают сплошному обследованию. средние этих генеральных совокупностей. Методика проверки задач:
Примеры Для того, чтобы по данным выборки можно было судить об заключается в использовании критерия Стьюдента при условии, что
интересующем нас признаке генеральной совокупности, нужно чтобы генеральные дисперсии не известны, однако в предположении, что
выборка правильно представляла пропорции генеральной они равны между собой. Такая задача возникает: если сравниваются
совокупности, т.е. выборка должна быть репрезентативной средние размеры двух партий деталей, изготовленных на одном и
(представительной). В силу закона больших чисел можно том же станке. Естественно будет предположить, что дисперсии
утверждать, что выборка будет репрезентативной, если каждый контролируемых размеров одинаковы. Алгоритм проверки.
объект отобран случайно и если все объекты имеют одинаковую 29Алгоритм проверки. 1) Прежде чем сравнивать средние
вероятность попасть в выборку. требуется проверить Н0: Dх=Dу 2) Если гипотеза подтвердилась
6Статистическое распределение выборки. . . . . . . Пусть из нужно вычислить наблюдаемое значение критерия: 3) Строим
генеральной совокупности извлечена выборка, причем значение x1 критическую область в зависимости от конкурирующей гипотезы а)
встречалось n1 и т.д., xk – nk. Наблюдаемые значения x Если Н1: Мх ? Му – двусторонняя критическая область строится
называется вариантами, а последовательность вариант, записанных исходя из условия чтобы вероятность попадания наблюдаемого
в возрастающем порядке – вариационным рядом. Число наблюдений значения критерия в эту область была равна принятому уровню
называется частотами. Относительная частота наблюдений – значимости ? взятого из таблицы Стьюдента для числа степеней
отношение числа наблюдений к объему выборки. Wi=ni/n свободы в верхней части таблицы, т.е. для двусторонней
Статистическим распределением называют перечень вариант и критической области при условии |Тнабл| < tкр(?,?), то нет
соответствующих им частот или относительных частот. Пример Для основания отвергать нулевую гипотезу; если |Тнабл| >
визуальной оценки выборочного распределения производится tкр(?,?), то нулевую гипотезу отвергают. б) Если Н1: Мх >Му
группировка данных. Для этого: располагают значения xi по строится правосторонняя критическая область, а критическую точку
возрастанию; весь интервал разбивают на k последовательных находят по таблице Стьюдента из нижней части. Если Тнабл <
непересекающихся интервалов; подсчитывают числа n1 – количество tкр, то нет основания отвергать нулевую гипотезу . Если Тнабл
попавших значений xi в каждый интервал. Такая таблица называется > tкр, то нулевую гипотезу отвергают. в) При конкурирующей
группированным статистическим рядом. xj xj+1. x1 x2. x2 x3. xk-1 гипотезе Н1: Мх < Му по таблице критических точек
xk. nj. n1. n2. nkj. распределения Стьюдента, по заданному уровню значимости
7Эмпирическая функция распределения. Эмпирической функцией ?,помещенному в нижней строке таблицы ,и числу степеней свободы
распределения (функция распределения выборки) называетсяF*(x), k= nх + nу–2 найти «вспомогательную критическую точку» tкр
определяющую для каждого значения xотносительную частоту события односторонней критической области. Если Тнабл < - tкр, то нет
X<x. F*(x)>nx/n; nx – число вариант, меньше x, n – объем основания отвергать нулевую гипотезу. Если Тнабл > - tкр, то
выборки. Свойства. значения F*(x) [0;1] F*(x) – функция нулевую гипотезу отвергают. Тнабл и число степеней свободы.
неубывающая: F*(x2)> F*(x1), если x2> x1 если x1 – 30Проверка гипотезы о законе распределения генеральной
наименьшая варианта, F*(x1)=0 если xk – наибольшая, то F*(x1)=1. совокупности. Если закон распределения не известен, но есть
В отличие от эмпирической функции, функцию F(x) генеральной основание предположить, что он имеет определенный вид (А), то
совокупности называется теоретической. Различия между ними проверяют нулевую гипотезу: Н0: генеральная совокупность
состоят в том, что F(x) определяет вероятность события X<x, а распределена по закону А. Проверка гипотезы о предполагаемом
F(x) – относительную частоту. Наглядным изображением законе распределения производится так же как и проверка гипотезы
статистического ряда распрделения служат полигон и гистограмма. о параметрах распределения, т.е. при случайно отобранной
Полигон – ломаная линия, соединяющая точки (xi;ni). Гистограмма случайной величине – критерия согласия. Критерием согласия
– ступенчатая фигура, состоящая из прямоугольников, основаниями называют критерий проверки гипотезы о предполагаемом законе
которых служат интервалы, длиной n , а высотой – величины ni/n. распределения. Имеется несколько критериев согласия: критерий
Если гистограмма является гистограммой частот, то ее площадь Пирсона; критерий Колмогорова; критерий Смирнова.
равна сумме всех частот, т.е. объему выборки. Если гистограмма 31Критерий Пирсона. Пусть по выборке объема n получены
является гистограммой относительных частот, то ее площадь равна эмпирические частоты, т.е. мы имеем предполагаемое
сумме всех относительных частот. распределение. Допустим, что в предположении нормального
8Статистические оценки параметров распределения. Точечные распределения генеральной совокупности вычислены теоретические
оценки Интервальные оценки Точность и надежность Доверительный частоты (). При уровне значимости ? требуется проверить
интервал для мат.ожидания Доверительный интервал для оценки гипотезу: генеральная совокупность распределена нормально. В
дисперсии. качестве критической проверку нулевой гипотезы примем случайную
9Для того, чтобы статистические оценки давали хорошее величину: (*) Эта величина случайная, т.к. в различных опытах
приближение оценивающих параметров, они должны удовлетворять она принимает различные, заранее не известные, значения. Чем
условиям: объем выборки должен быть достаточным для оценивания меньше различаются эмпирические и теоретические частоты, тем
оценка интересующего нас параметра есть случайная величина. меньше величина критерия => он характеризует близость
Статистические оценки: Несмещенные – есть оценка мат.ожидания, эмпирических и теоретических распределений. Доказано, что при
которая равна оценивающему параметру; Смещенные – оценка M(x)? закон распределения случайной величины (*) не зависит от того,
оценивающему параметру; Эффективные – оценка, имеющая при какому закону распределения подчинена генеральная совокупность,
заданном объеме выборки n наименьшую дисперсию; Состоятельные – а стремится к закону распределения ?2 с числом степеней свободы:
оценка, стремящаяся при n?0 по вероятности к оцениваемому ?=k–1–r , где k – число групп (интервалов) выборки r – число
параметру. параметров предполагаемого распределения. А т.к. для нормального
10Точечные оценки. Точечной называют оценку, определяющую распределения нам интересно М(х) и D(x), то число степеней
одним числом. Пусть требуется изучить количественный признак свободы определяется ?=k–3 Правила проверки. xi. x1. x2. x3. x4.
генеральной совокупности. Допустим, удалось установить, какое x5. ni. n1. n2. n3. n4. n5.
имеется распределение. Тогда возникает задача оценки параметров 32Правила проверки. Для того, чтобы при заданном уровне
данного распределения. Пример Однако чаще всего экспериментатору значимости ? проверить Н0: “генеральная совокупность
не известен вид распределения, т.к. он обладает только данными распределена нормально”, необходимо: вычислить теоретические
выборки и тогда для оценки параметров нужно найти зависимость частоты; вычислить наблюдаемое значение критерия: по таблицам
этих параметров от наблюдаемых величин. Генеральная и выборочная критических точек распределения ?2 по заданному уровню
средняя Генеральная и выборочная дисперсии. значимости и числу степеней свободы ?=k–3, найти критическую
11Генеральная и выборочная средняя. Генеральная средняя – точку: ?2кр=(?,?); сравнить 2 имеющихся критерия: - если
среднее арифметическое значений генеральной совокупности – с ?2набл< ?2кр - нет основания отвергать нулевую гипотезу о
повторениями Генеральная средняя есть среднее взвешенное нормальном распределении. - если ?2набл > ?2кр - нулевую
значений генеральной совокупности с их весами, равными гипотезу о нормальном распределении отвергают. Замечание: объем
соответствующим частотам. Если рассматривать x генеральной выборки должен быть достаточно велик (более 50); малочисленные
совокупности как СВ, то Выборочная средняя – среднее группы следует объединять в одну, суммируя частоты; т.к.
арифметическое значений выборки. Пусть имеется выборка объема n. возможные ошибки первого и второго рода, то в окончательном
Тогда выборочная средняя равна: Выборочная средняя по данным выводе следует проявить осторожность: можно повторить опыт;
одной выборки есть определенное число. Если извлекать другие увеличить число наблюдений; для проверки воспользоваться другими
выборки такого же объема из генеральной совокупности, то критериями; построить график распределения; вычислить эксцесс и
выборочная средняя меняется от выборки к выборке. Выборочная асимметрию. для контроля вычислений формулу преобразуют к виду.
средняя есть несмещенная оценка генеральной средней. При 33Корреляционно-регрессионный анализ. Корреляционная
увеличении объема выборки n выборочная средняя стремится к зависимость Корреляционный момент Коррелированность и
генеральной средней. зависимость случайных величин Выборочное корреляционное
12Генеральная и выборочная дисперсии. Генеральной дисперсией отношение Простейшие случаи криволинейной корреляции Метод
называют среднее арифметическое квадратов отклонений значений наименьших квадратов.
генеральной совокупности от их среднего значения. Кроме 34Во многих задачах требуется установить или оценить
дисперсий для характеристики рассеивания значений генеральной зависимость изучаемо случайной величины Y от одной или
совокупности вокруг своего среднего пользуются другой нескольких других случайных величин. Две случайные величины
характеристикой – средним квадратическим отклонением. Выборочной могут быть связаны: - функциональной зависимостью -
дисперсией называют среднее арифметическое квадратов отклонений статистической - независимой Строгая функциональная зависимость
наблюдаемых значений выборки от их среднего значения. – с реализуется редко, т.к. обе случайных величины или одна
повторениями Для оценки рассеивания выборки служит выборочное подвержены действию других случайных величин. Статистической
среднеквадратическое отклонение. называется зависимость, при которой изменение одной из величин
13Интервальные оценки. Интервальной оценкой называют оценку, влечет изменение распределения другой. В частности она
определяющуюся двумя концами интервала. При выборке малого проявляется в том что изменение одной из величин влечет
объема точечная оценка может значительно отличаться от изменение среднего значения другой. Такая статистическая
оцениваемого параметра, что приводит к грубым ошибкам. По этой зависимость называется корреляционной.
причине при небольшом объеме выборки следует пользоваться 35Корреляционная зависимость. Предположим изучается связь
другими оценками. Интервальные оценки позволяют определить между случайными величинами Х и Y. Пусть каждому значению Х
точность и надежность оценок. соответствует несколько значений Y. Условным средним называется
14Точность и надежность. Пусть найденная по данной выборке среднее арифметическое случайной величины Y соответствующее
статистическая характеристика ?* служит оценкой неизвестного значению случайной величины Х равное х. Если каждому значению Х
параметра ? генеральной совокупности. Будем считать ? постоянным соответствует одно значение , то очевидно что она – функция от
числом. ?* будет тем точнее определять параметр ?, чем меньше х. В этом случае говорят, что случайная величина Y зависит от Х
абсолютная величина разности |?­??*|<?. Чем меньше ?, тем корреляционно. Корреляционной зависимостью Yx называют
точнее оценка. Однако статистические методы не позволяют функциональную зависимость от значений х. = f(x) - уравнение
категорически утверждать, что ?* удовлетворяет условию регрессии Y на Х, а график – линией регрессии Y на Х. f(x) –
|?­??*|<?, а можно лишь говорить о вероятности, с которой это функция регрессии. Аналогично определяется условная средняя Х на
неравенство осуществляется: P(|?­??*|<?)=? Надежностью Y: = f(y). Две основные задачи теории корреляции: Оценить
(доверительной вероятностью) оценки ? по ??* называется тесноту (силу) корреляционной связи Если связь существует, то
вероятность ?, с которой осуществляется неравенство нужно установит ее форму – вид функциональной зависимости между
|?­??*|<?. Обычно надежность оказывается заранее заданным и величиной Х. Для решения первой задачи существует коэффициент
числом, близким к 1. Наиболее частые значения ?: 0,95; 0,98; корреляции.
0,99; 0,999. Соотношение P(|?-??*|<?)=? означает вероятность 36Коэффициент корреляции. Выборочным коэффициентом корреляции
того, что интервал (?*– ?; ?*+?) заключает в себя (покрывает) называется отношение разности между М(Х) произведения случайных
неизвестный параметр ?, равна доверительной вероятности ?. величины и произведением математических ожиданий этих случайных
Доверительным интервалом называется интервал (?*– ?; ?*+?), величин к ?? случайных величин X и Y. Он служит для оценки
покрывающий неизвестный параметр ? с надежностью ?. Иногда тесноты линейной корреляционной зависимости. Свойства
вместо доверительной вероятности ? используют обратную величину коэффициента корреляции rв по абсолютной величине ? 1 Если rв=
– уровень значимости ? = 1–?. Если ? – вероятность, что 0, то Х и Y не связаны линейной зависимостью, а другая может при
оцениваемый параметр попадет в интервал, ? – вероятность, что не этом существовать. Если |rв| = 1, то Х и Y связаны строго
попадет. В статистических таблицах указывается именно ?. корреляционной зависимостью. Т.к. rв характеризует степень
15Доверительный интервал для мат.ожидания. Рассмотрим тесноты линейной связи, то она проявляется в том, что при
нахождение доверительного интервала для M(X) нормально возрастании одной случайной величины другая имеет тенденцию
распределенной СВ, т.е. нужно найти такой интервал, чтобы возрастать, т.е. наблюдается положительная корреляция, rв>0;
выполнялось следующее неравенство , т.е. данный интервал ширину если при возрастании одной случайной величины другая – убывает,
2?. Он обладает симметрией. Вероятность того, что определяется: rв<0. Remark: Зависимость тем ближе к линейному закону, чем
законом нормального распределения, если известна D(x)=?2 или |rв| ближе к единице. Для описания системы двух случайных
распределения Стьюдента, если D(x) неизвестна, а подсчитана ее величин или зависимости между двумя случайными величинами, кроме
несмещенная оценка S2. Критерий Стьюдента определяется таким математического ожидания и дисперсии используют и другие
параметром как степень свободы ?=n–1. Для расчетов доверительных величины. Коэффициент корреляции rв является частным случаем
интервалов для M(X) используют два подхода: когда D(x) известна такой характеристики, более частным случаем выступает
когда D(x) неизвестна. корреляционный момент ?ху.
16Расчет доверительных интервалов при известной дисперсии. 37Корреляционный момент. Корреляционным моментом ?ху случайных
Будем рассматривать выборочную среднюю как случайную величину. величин Х и Y, называют математическое ожидание при отклонении
Примем без доказательств, что если СВ Х распределена нормально, этих величин. ?ху = М [(Х – М(Х))*(Y – М(Y))] ?ху = М (Х*Y) –
то и выборочная средняя по независимым наблюдениям распределена М(Х)*М(Y) rв = ?ху / ?х*?у Свойства корреляционного момента:
нормально. P(|X–M(x)|<?)=2?(х)=?. Таким образом для корреляционный момент служит для характеристики связи между
нормального распределения 2?(х)=?. Параметр t в функции Лапласа: случайными величинами Х и Y; корреляционный момент двух
Таким образом для отыскания границ доверительного интервала: по независимых величин равен нулю; корреляционный момент имеет
таблицам функции Лапласа находим значение аргумента t, для размерность равную произведению размерности величин Х и Y;
которого ?(t)=?/2. зная значение t из условия находим ? (граница размерность корреляционного момента является недостатком при
интервала): Записываем доверительный интервал: Пример. сравнении зависимости двух случайных величин, чтобы избежать
17Расчет доверительных интервалов при неизвестной дисперсии. это, был введен коэффициент корреляции.
Если D(x) неизвестна, а ее несмещенная оценка S2, то в этом 38Коррелированность и зависимость случайных величин. Две
случае ? покрытия M(x) интервалом вычисляют по закону случайных величин называются коррелированными, если их
распределения Стьюдента со степенью свободы ?=n–1 и ?=1–?. корреляционный момент (или что то же самое коэффициент
Имеются таблицы, которые по заданным уровням значимости и корреляции) равен нулю; Х и Y называются некоррелированными
степеням определяют значения критерия Стьюдента t?,? по формуле случайными величина-ми, если их корреляционный момент равен
Таким образом доверительный интервал для М(х) при неизвестной нулю; Две коррелированные величины также зависимы. Обратное
дисперсии строится в виде Данный интервал определяет, что с предположение не всегда имеет место.
доверительной вероятностью ? он покрывает истинное значение 39Выборочное корреляционное отношение. Для оценки тесноты
М(х). Пример. нелинейной корреляционной связи служат такие характеристики как:
18Доверительный интервал для оценки дисперсии. Доверительный выборочное корреляционное отношение ?ух (игрек к икс) и ?ху (икс
интервал строится на основании того, что величина (n–1)S2/? к игрек). Выборочным корреляционным отношением называется,
распределена по закону «хи-квадрат»(?2) со степенями ?=n–1. отношение межгруппового среднеквадратического отклонения к
Выборочная дисперсия D(x) и нормального распределения связаны общему среднеквадратическому отклонению. ?ух = ?мехгр / ?общ
следующим соотношением: ?= (n–1)S2/? ?2 ?2= (n–1)S2 Для заданной Свойства корреляционного отношения: если корреляционное
доверительной вероятности ? или, что тождественно, для заданного отношение равно нулю, Х и Y не связаны друг с другом; если
уровня значимости ?=1–?. Потребуем, чтобы выполнялось следующее корреляционное отношение = 1, Х и Y не связаны корреляционной
соотношение P(?2 ?/2,? <?)= P(?2 1–?/2 <?)= ?/2; ?2< ?2 зависимостью; значение корреляционного отношения удовлетворяет
?/2, ? <?2 Из этого соотношения следует, что границы двойному неравенству 0 ? ?ух ? 1; корреляционное отношение
доверительного интервала в явном виде выглядят следующим всегда меньше или равно коэффициенту корреляции ?ух ? |rв|.
образом: Пример. 40Достоинства корреляционного отношения. Корреляционное
19Проверка статистических гипотез. Статистической гипотезой отношение служит мерой тесноты связи любой, в том числе и
называют, гипотезу о видах неизвестного распределения или о линейной. В этом его достоинство перед коэффициентом корреляции,
параметрах известного распределения. Проверка статистической который оценивает степень тесноты только линейной связи.
гипотезы заключается в сопоставлении некоторых статистических Недостатки корреляционного отношения. Корреляционное отношение
показателей, вычисленным по данным выборки со значениями этих же не позволяет судить на сколько близко расположены точки
показателей, определенными теоретически в предположении, что найденным по данным наблюдения к кривой определенного вида
проверяемая гипотеза верна. Классификация гипотез. В результате (гипербола, парабола, синусоида и т.д.). Это объясняется тем,
проверки могут быть приняты два неправильных решения, т.е. что при определении корреляционного отношения вид связи не
допущены ошибки двух родов. Ошибка первого рода состоит в том, учитывается.
что будет отвергнута правильная гипотеза. Ошибка второго рода 41Простейшие случаи криволинейной корреляции. Если график
состоит в том, что будет принята неправильная гипотеза. регрессии Y на Х изображен кривой линией, то корреляция
Вероятность совершить ошибку первого рода принято обозначать ?. называется криволинейной. Примеры функции регрессии
На практике, наиболее часто используют ?=0,05, это означает, что Параболическая корреляция второго порядка = ах? + вх + с
в 5 случаях из 100 имеется риск допустить ошибку первого рода, Параболическая корреляция третьего порядка =а+вх?+сх + d
т.е. отвергнуть правильную гипотезу. Статистический критерий, Гиперболическая = а/х + в Для определения вида функции регрессии
статистическая область Сравнение двух дисперсий Сравнение строят на графике точки с координатами (х, ). По их расположению
математических ожиданий Проверка гипотезы о равенстве средних делают заключение о примерном виде функции регрессии. При
при и известных дисперсиях Проверка гипотезы о равенстве средних окончательном решении принимают во внимание особенности,
при неизвестных дисперсиях. вытекаемые из сущности решаемой задачи. Теория криволинейной
20Классификация гипотез. Статистические, нестатистические корреляции решает те же задачи что и теория линейной корреляции,
Выдвинутая, конкурирующая. Выдвинутую гипотезу называют нулевой т.е. устанавливает формы и тесноты корреляционной зависимости.
(основной) и обозначают Н0. Конкурирующая гипотеза Н1 – это Неизвестные параметры уравнения регрессии ищут методом
гипотеза альтернативная нулевой, т.е. противоречащая основной. «наименьших квадратов».
Пример По количеству предположений: простые, сложные. Простая – 42Метод наименьших квадратов. Метод наименьших квадратов
это гипотеза содержащая только одно предположение. Сложная – заключается в том, что сумма квадратов отклонений теоретических
гипотеза состоящая из конечного или бесконечного числа простых данных от экспериментальных, должна быть наименьшей. Будем
гипотез. искать уравнение регрессии в виде у = f(x). Предположим, что
21Статистический критерий, статистическая область. Для имеет место линейная зависимость ?(х)= а0 +а1х а0, а1 –
проверки Н0, используют специально подобранную слу-чайную коэффициенты линейной зависимости ?(х) – предполагаемая
величину, точное или приближенное значение которой из-вестно. теоретическая зависимость Используя метод наименьших квадратов
Эту величину обозначают через U или Z, если она распреде-лена построим функцию равную сумме квадратов отклонений
нормально; F или ?? - по закону Фишера; ?? - по закону «хи экспериментальных данных от теоретических данных: По методу
квадрат»; Т или t - по распределению Стьюдента. Статистическим наименьших квадратов для нахождения коэффициентов а0, а1,
критерием называют случайную величину служащую для проверки Н0. необходимо составить систему двух уравнений, для этого
Наблюдаемым значением критерия называют, значение критерия необходимо взять частные производные от функции S и приравнять
выраженное по данным выборки. После выбора определенного их к нулю. Учитывая число функций ?(х)=а0+а1х Окончательной
критерия, множество всех его возможных значений разбивается на системой уравнений по методу наименьшего квадрата имеет вид
два подмножества: содержит значения критерия при котором Н0 Решая полученную систему найдем неизвестные коэффициенты а0 и
отвергается; содержит значения критериев при которых Н0 а1, запишем уравнение регрессии в виде ?(х) = а0 + а1х.
принимается. 43Для того чтобы найти погрешность данного метода необходимо
22Критической областью называют, совокупность значений вычислить Если предположили нелинейную корреляцию, то уравнение
критерия при которых Н0 отвергается. Областью принятия гипотезы связи пытаемся искать в виде ?(х)=а0+а1х+а2х?, то аналогично по
(областью допустимых значений), называют совокупность критерия методу наименьших квадратов найдем функцию Находим частные
при которой Н0 принимают. Основной принцип проверки производные данной функции Запишем систему уравнений Аналогично
статистических гипотез: если наблюдаемое значение критерия находим а0, а1, а2 и записываем уравнение регрессии в виде
принадлежит критической области, то гипотезу отвергают; если ?(х)=а0+а1х+а2х? Определяем погрешность с помощью ?. Заключение
наблюдаемое значение критерия принадлежит области покрытия о реальной зависимости между случайными величинами Х и Y делаем
гипотезы, то гипотезу принимают. Критическая область и область путем графического представления.
покрытия гипотез – это интервалы, следовательно существует точка 44Если нужно отобрать 20% изготовленных деталей, то отбирают
которая их разделяет. Критической точкой (границей), называют каждую пятую. Детали изготавливаются на разных станках. Выборка
точку определяющую критическую область от области принятия производится с каждого станка. Изделия изготавливаются
гипотез. Различают: 1. Одностостороннюю критическую область станками-автоматами. Обследованию подвергается продукция
левостороннюю правостороннюю 2. Двустороннюю критическую нескольких автоматов.
область. 45Определить объем, написать распределение относительных
23Правостороннюю называют критическую область определяемую частот. n=3+10+12=20. x. 2. 6. 12. ni. 3. 10. 7. x. 2. 6. 12. W.
неравенством К>Ккр Левостороннюю называют критическую область 3/20. 10/20. 7/20. ? Wi=1 ? ni=n. Задано распределение частот
определяемую неравенством К<Ккр Двустороннюю называют выборки.
критическую область определяемая двумя неравенствами К<К? и 46Пусть имеется нормальное распределение. Тогда нужно оценить,
К>К2; К?>К2 При отыскании критической области задают ? найти M(x) и ?. Для показательного распределения нужно оценить
(уровень значимости) и ищут критические точки исходя из параметр ?. f(x)= ?.e-?x.
требований, что критерий К примет значение лежащее в критической 47Найти доверительный интервал с надежностью 0.9 неизвестного
области, при этом вероятность такого события равна принятому M(X) нормально распределенной СВ Х, если известны =20.9, ?=2,
уровню значимости ?, т.е. для правосторонней области n=16, ?=0.9. 2?(t)=? ?(t)=?/2=0.45 t=1.645 =0.82 (20.9–0.82;
Р(К>Ккр)= ?; для левосторонней области Р(К<Ккр)= ?; для 20.9+0.82) (20.08; 21.72).
двусторонней области Р(К>|Ккр|)= ?/2 Если наблюдаемое 48По данным выборки, объема 50, найдена =-0.155, S=936. Найти
значение критерия принадлежит критичес-кой области, нулевую доверительный интервал для неизвестной дисперсии, ?=0.95. n=50,
гипотезу отвергают, если не принадлежит, то нет оснований ?=49, ?=0.05. По таблицам распределения Стьюдента для уровня
отвергать Н0. Для многих критериев составлены таблицы: значимости ?=0.05 и числа степеней свободы ?=49 найдем значение
Стьюдента; ??; Фишера. критерия Стьюдента t?,?=2.009 Запишем значение границы интервала
24Сравнение двух дисперсий. Рассмотрим гипотезу о параметрах =0.27 Запишем границы доверительного интервала (-0.425;0.115). С
нормального распределе-ния. Пусть имеется две серии опытов, вероятностью 0.95 истинное значение М(х) лежит в пределах
регистрирующая значение некоторой случайной величины. Х: х1, х2 (-0.425;0.115).
… хn Y: y1, y2 … уn Осуществим проверку нулевой гипотезы о 49При доверительной вероятности 90% найти доверительный
равенстве диспер-сий при неизвестных математических ожиданиях. интервал для D(x), если для выборки, объемом 5 выборочная
Н0: Dx =Dy Постановка задачи. Пусть даны две случайные величины D(x)=6.6, а выборочная средняя 0.4. По таблицам распределения ?2
Х и Y, распределенные нормально. По данным выборки объем их nx и найдем значение критерия ?2 для уровня значимости ?=4 и
ny подсчитаны выбо-рочные дисперсии S, Sтребуется. Механизм ?=/2=0.05 ?20.05,4=9.5 ?2 ?/2,? = ?20.95,4=0.711 4.6.6/9.5 <
проверки. Цель работы при заданном уровне значимости ? проверить ?2 < 4.6.6/0.711 2.78 < ?2 < 37.13.
ну-левую гипотезу о равенстве дисперсий. Такая задача возникает 50Если Н0 состоит в предположении, что математическое ожидание
при сравнении точности двух прибо-ров, или при сравнении М(Х) нормального распределения равно 10, то Н1 может состоять в
различных методов измерения. Т.е. когда выборочные дисперсии предположении, что М(Х) не равно 10. Н0: М(Х)=10 Н1: М(Х)?10.
отличаются, возникает вопрос значимости или не значимости это 51По двум малым независимым выборкам объемов nx=11 и ny=14 из
различие. Если различие неразличимо, то имеет место нулевая нормальных распределений найдены исправленные выборочные
гипотеза, т.е. приборы, например имеют одинаковую точность. А дисперсии S?x =0.76 и S2y=0.38. При уровне значимости ?=0.05
различия вы-борочных дисперсий объясняется случайными причинами. проверить нулевую гипотезу Н0: Dx=Dy о равенстве диспер-сий при
25Механизм проверки. По данным выборок значений nх и nу, конкурирующей гипотезе Н1: Dx>Dy. Решение: Найдем отношение
вычисляют наблюдаемое значение критерия как отношение большей большей исправленной дисперсии к меньшей: Fнабл = S?б / S?м =
дисперсии к меньшей: Критическая область строится в зависимости 0.76 / 0.38 = 2 По условию конкурирующая гипотеза имеет вид Н1:
от конкурирующей гипотезы. По таблицам распределения Фишера, по Dx>Dy, поэтому критическая область – правосторонняя. По
заданному уровню значимости ? и вычисленным степеням свободы ?x, таблице критических то-чек распределения Фишера, по уровню
?y находят табличное значение критерия: для альтернативной значимости ?=0,05 и числам степеней свободы k1 = nx – 1 = 11 – 1
гипотезы Н1: Dx >Dy Fкр в зависимости от параметров Fкр (?, = 10 и k2 = ny – 1 = 14 – 1 = 13 находим критическую точку: Fкр
?x, ?y) для альтернативной гипотезы Н1: Dx ? Dy Fкр в (?, k?, k2) = Fкр (0.05,10,13) = 2.67 Так как Fнабл = 2. <
зависимости от параметров Fкр (?/2, ?x, ?y) Если Fнаб >Fкр, Fкр = 2.67, то нет оснований отвергать Но о равенстве дисперсий.
то Н0 отвергают. Если Fнаб <Fкр, то нет оснований отвергать Другими словами, исправленные выборочные дисперсии различаются
Н0, предположение о том что Dx, Dy, принимается с уровнем ?, в незначимо.
«Элементы математической статистики» | Элементы математической статистики.ppt
http://900igr.net/kartinki/algebra/Elementy-matematicheskoj-statistiki/Elementy-matematicheskoj-statistiki.html
cсылка на страницу

Статистика

другие презентации о статистике

«Теория вероятности и статистика» - Интервалы вариантов. Обозначения. Формула для вычисления дисперсии. Обобщение. Теория вероятностей и математическая статистика. Фиксированные числа. Среднее квадратическое отклонение. В качестве критерия используется случайная величина. Элементы комбинаторики. Действия над событиями. Законы распределения случайных величин.

«Элементы математической статистики» - Коэффициент корреляции. Соответствие двух выборок. Проверка гипотезы. Корреляционная зависимость. Расчет доверительных интервалов при неизвестной дисперсии. Найти доверительный интервал. Зависимость случайных величин. Исправленные выборочные дисперсии. Интервальные оценки. Корреляционный момент. Точечные оценки.

«Основы математической статистики» - Среднее квадратичное отклонение. Условная вероятность. Функция действительной переменной. Биномиальное распределение. Эмпирическая функция распределения. Оценка функции распределения. Говорят, что событие А не зависит от события В, если P(A|B)=P(A). Интервал для дисперсии. Свойства вероятности. Некоторые определения.

«Вероятность и математическая статистика» - Способ перебора возможных вариантов. Перестановка. Примеры столбчатых диаграмм. В алфавите племени Уауа имеются только две буквы. Дерево возможных вариантов. Изображения диаграмм. Наглядное представление статистической информации. Яблоко. Белые и красные розы. Ручки четырех цветов. Какая диаграмма лучше.

«Основные статистические характеристики» - Размах. Школьные тетради. Медиана ряда. Статистика. Мода ряда. Основные статистические характеристики. Среднее арифметическое ряда чисел. Размах ряда. Медиана. Петроний. Найдите среднее арифметическое.

«Статистическое исследование» - Кто тебе помогает разобрать трудную тему по математике. Нужна ли математика в будущей вашей профессии. Задачи. Рассмотрим ряд чисел. Средним арифметическим ряда чисел называется частное. Статистика — это прежде всего способ мышления. Нравится ли тебе заниматься изучением математики. Сбор данных. Мотивация учебной деятельности.

Урок

Алгебра

34 темы
Картинки
Презентация: Элементы математической статистики | Тема: Статистика | Урок: Алгебра | Вид: Картинки
900igr.net > Презентации по алгебре > Статистика > Элементы математической статистики.ppt