Таблица нормального распределения

Здравствуйте! Продолжаем разговор о нормальном законе распределения. Нормальный закон – это целое семейство распределений, каждое из которых определяется своими параметрами (математическим ожиданием и дисперсией). Среди них особое место занимает т.н. стандартное нормальное распределение, которое используется в качестве вероятностно-статистической модели. Имея в распоряжении такую модель (формулу), можно получить вероятности интересующих событий. Однако провести необходимые расчеты в уме или даже на калькуляторе не просто. Чтобы облегчить задачу, вероятности давно рассчитали и занесли в специальные таблицы. Об этом сегодняшняя заметка.

Преподаватели в институтах учат пользоваться таблицей нормального распределения примерно так: берем значение переменной (z), и далее на пересечении соответствующего столбца и строки находим нужную вероятность. Студент пытается повторить, но тут же забывает, что сделал, т.к. никакого понимания не было изначально.

Думается, нужно немножко растолковать что к чему. Для начала отметим, что таблицы с нормальным распределением встречаются двух типов:

— таблица значений плотности стандартного нормального распределения;

— таблица значений функции стандартного нормального распределения (интеграла от плотности).

Таблица плотности используется редко. Тем не менее, посмотрим, как она выглядит. Функция Гаусса для нормированных данных имеет вид:

Функция Гаусса

Допустим, нас интересует плотность для значения z = 1, т.е. плотность значения, отстоящего от матожидания на 1 сигму. Ниже показан кусок таблицы. Первым делом нужно убедиться, что это именно та таблица, которая нас интересует, для чего нужно посмотреть на название.

Таблица плотности стандартного нормального распределения

Далее в зависимости от организации данных ищем нужное значение по названию столбца и строки. В нашем примере берем строку 1,0 и смотрим в первый столбец данных, т.к. сотых долей нет. Искомое значение равно 0,2420 (0 перед 2420 опущен). Не пугайтесь различных обозначений переменной, чаще всего в таблицах указывается именно x. Главное – это формула над таблицей.

Функция Гаусса симметрична относительно оси ординат. Поэтому φ(z)= φ(-z), т.е. плотность для 1 тождественна плотности для -1, что отчетливо видно на рисунке.

График функции Гаусса

Чтобы не тратить зря бумагу, таблицы плотности стандартного нормального распределения печатают только для положительных значений.

Однако для аналитика, как правило, интерес представляет значение функции стандартного нормального распределения (функции Лапласа):

Функция стандартного нормального распределения

Такие таблицы также обычно делают только для положительных значений. Поэтому для корректного использования таблиц и нахождению любых нужных вероятностей следует предварительно познакомиться с некоторым ключевыми свойствами стандартного нормального распределения.

Функция Ф(z) симметрична относительно своего значения 0,5 (а не оси ординат, как плотность). Отсюда справедливо равенство:

Свойство 1

Это факт показан на картинке:

Свойство нормального распределения 1

Значения функции Ф(-z) и Ф(z) делят график на 3 части. Причем верхняя и нижняя части равны (обозначены галочками). Для того, чтобы дополнить вероятность Ф(z) до 1, достаточно добавить недостающую величину Ф(-z). Получится равенство, указанное чуть выше.

Если нужно отыскать вероятность попадания в интервал (0; z), то есть вероятность отклонения от нуля в положительную сторону до некоторого количества стандартных отклонений, достаточно от значения функции стандартного нормального распределения отнять 0,5:

Свойство 2

Это равенство вполне понятно, если вспомнить свойство непрерывного распределения. Множество значений от -∞ до z можно разделить на два интервала: от -∞ до 0 и от 0 до z. Вероятность попадания в интервал от -∞ до 0 равна 0,5, что и вычитается в формуле выше. Для наглядности можно взглянуть на рисунок.

Свойство нормального распределения 2

На кривой Гаусса, эта же ситуация выглядит как площадь от центра вправо до z.

Свойство нормального распределения 2 на кривой Гаусса

Довольно часто аналитика интересует вероятность отклонения в обе стороны от нуля. А так как функция симметрична относительно центра, предыдущую формулу нужно умножить на 2:

Свойство 3

Рисунок ниже.

Свойство нормального распределения 3

Под кривой Гаусса – это центральная часть, ограниченная выбранным значением –z слева и z справа.

Свойство нормального распределения 3 на кривой Гаусса

Указанные свойства следует принять во внимание, т.к. табличные значения редко соответствуют интересующему интервалу.

Для облегчения задачи в учебниках обычно публикуют таблицы для функции вида:

Функция стандартного нормального распределения

Если нужна вероятность отклонения в обе стороны от нуля, то, как мы только что убедились, табличное значение для данной функции просто умножается на 2.

Теперь посмотрим на конкретные примеры использования статистической таблицы функции стандартного нормального распределения. Найдем табличные значения для трех z: 1,64, 1,96 и 3.

Таблица функции Лапласа

Как понять смысл этих чисел? Начнем с z=1,64, для которого табличное значение составляет 0,4495. Проще всего пояснить смысл на рисунке.

Значение функции Лапласа для z=1,64 в правую сторону

То есть вероятность того, что стандартизованная нормально распределенная случайная величина попадет в интервал от 0 до 1,64, равна 0,4495. При решении задач обычно нужно рассчитать вероятность отклонения в обе стороны, поэтому умножим величину 0,4495 на 2 и получим примерно 0,9. Занимаемая площадь под кривой Гаусса показана ниже.

Значение функции Лапласа для z=1,64 под кривой Гаусса

Таким образом, 90% всех нормально распределенных значений попадает в интервал ±1,64σ от средней арифметической. Я не случайно выбрал значение z=1,64, т.к. окрестность вокруг средней арифметической, занимающая 90% всей площади, иногда используется для проверки статистических гипотез и расчета доверительных интервалов. Если проверяемое значение не попадает в обозначенную область, то его наступление маловероятно (всего 10%).

Для проверки гипотез, однако, чаще используется интервал, накрывающий 95% всех значений. Половина вероятности от 0,95 – это 0,4750 (см. второе выделенное в таблице значение).

Значение функции Лапласа для z=1,96 в правую сторону

Для этой вероятности z=1,96. Т.е. в пределах почти ±2σ от средней находится 95% значений. Только 5% выпадают за эти пределы. Такой уровень погрешности часто используется при решении практических задач.

Значение функции Лапласа для z=1,96 под кривой Гаусса

Еще одно интересное и часто используемое табличное значение соответствует z=3, оно равно по нашей таблице 0,4986. Умножим на 2 и получим 0,997. То бишь в рамках ±3σ от средней арифметической заключены почти все значения нормально распределенной совокупности данных.

Значение функции Лапласа для z=3 под кривой Гаусса

Тот факт, что почти все значения находятся в пределах ±3σ от средней называют правилом трех сигм. Это правило часто используется для решения различных задач, т.к. с его помощью можно заранее очертить круг возможных значений, за пределы которого данные почти никогда не попадают. И если такое значение обнаружено, то скорее всего, оно относится к другой совокупности данных либо является аномальным отклонением (выбросом).

Понимание смысла статистических таблиц позволяет еще лучше представить математический аппарат статистических методов. Надеюсь, мне удалось это передать.

В Excel есть готовые функции для расчета вероятностей, связанных с нормальным распределением.

Всех благ и до новых встреч.

Поделиться в социальных сетях:
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  • анна

    Как связаны между собой значение функции ошибок Гаусса и ее аргумент?

  • Татьяна

    Спасибо, действительно очень полезный материал!