F-критерий Фишера
F-критерий Фишера (также F-тест, критерий Фишера — Снедекора) — это статистический критерий, используемый для проверки гипотез о равенстве дисперсий двух генеральных совокупностей, а также для оценки значимости регрессионной модели в целом. Критерий основан на F-распределении (распределении Фишера), которое описывает отношение двух независимых оценок дисперсий. Назван в честь английского статистика Рональда Фишера, который разработал его для анализа дисперсии (ANOVA), и американского математика Джорджа Снедекора, который стандартизировал таблицы распределения.
История
Рональд Фишер впервые предложил F-критерий в 1920-х годах в контексте дисперсионного анализа, который он разрабатывал для сельскохозяйственных экспериментов. Фишер стремился создать метод, позволяющий сравнивать средние значения нескольких групп, учитывая случайные вариации внутри групп. Для этого ему потребовалось оценить, насколько разброс между группами превышает разброс внутри групп. Отношение этих двух дисперсий подчиняется распределению, которое Фишер назвал в честь другого статистика — Уильяма Снедекора, который опубликовал таблицы критических значений для этого распределения в 1930-х годах. Само распределение иногда называют распределением Фишера — Снедекора.
Математическая основа
F-критерий основан на F-распределении, которое является непрерывным вероятностным распределением, определяемым двумя параметрами: степенями свободы числителя (df₁) и знаменателя (df₂). Плотность F-распределения положительна только для неотрицательных значений.
Статистика критерия
Статистика F-критерия вычисляется как отношение двух независимых оценок дисперсий:
F = s₁² / s₂²
где s₁² и s₂² — выборочные дисперсии двух сравниваемых групп. При справедливости нулевой гипотезы (H₀: σ₁² = σ₂²) это отношение подчиняется F-распределению с df₁ = n₁ − 1 и df₂ = n₂ − 1 степенями свободы, где n₁ и n₂ — объёмы выборок.
Для регрессионного анализа F-статистика вычисляется как:
F = (R² / k) / ((1 − R²) / (n − k − 1))
где R² — коэффициент детерминации, k — число независимых переменных в модели, n — объём выборки. Эта статистика проверяет гипотезу о том, что все коэффициенты регрессии (кроме свободного члена) равны нулю.
Применение
Проверка равенства дисперсий
Наиболее распространённое применение F-критерия — проверка гипотезы о равенстве дисперсий двух нормально распределённых совокупностей. Это важно, например, перед проведением t-теста для независимых выборок, который требует предположения о равенстве дисперсий (гомоскедастичности). Если F-тест показывает значимое различие дисперсий, следует использовать модифицированный t-тест (например, тест Уэлча).
Дисперсионный анализ (ANOVA)
В однофакторном дисперсионном анализе F-критерий используется для проверки гипотезы о равенстве средних значений в нескольких группах. Нулевая гипотеза утверждает, что все групповые средние равны. F-статистика в ANOVA вычисляется как отношение межгрупповой дисперсии к внутригрупповой дисперсии. Если это отношение превышает критическое значение, нулевая гипотеза отклоняется, что свидетельствует о значимых различиях между группами.
Регрессионный анализ
В множественной линейной регрессии F-критерий проверяет общую значимость модели. Нулевая гипотеза состоит в том, что все коэффициенты регрессии (кроме свободного члена) равны нулю, то есть модель не объясняет изменчивость зависимой переменной. Если F-статистика значима, модель считается статистически значимой.
Другие применения
- Сравнение моделей: F-тест используется для сравнения вложенных регрессионных моделей (одна модель является частным случаем другой). Проверяется, значимо ли улучшает добавление новых предикторов качество модели.
- Анализ временных рядов: в авторегрессионных моделях (ARIMA) F-критерий помогает определить порядок модели.
- Качество подгонки: в некоторых нелинейных моделях F-статистика используется для оценки адекватности подгонки.
Условия применения
Для корректного использования F-критерия необходимо соблюдение следующих условий:
- Независимость наблюдений: выборки должны быть независимыми друг от друга.
- Нормальность распределения: данные в каждой группе должны быть приблизительно нормально распределены. F-тест чувствителен к отклонениям от нормальности, особенно при малых объёмах выборок.
- Случайность выборок: данные должны быть получены в результате случайной выборки или рандомизации.
Если условия нормальности не выполняются, рекомендуется использовать непараметрические альтернативы, такие как критерий Левене или критерий Бартлетта для сравнения дисперсий.
Ограничения и критика
- Чувствительность к нормальности: F-критерий для дисперсий крайне чувствителен к отклонениям от нормального распределения. При асимметрии или выбросах результаты могут быть ненадёжными.
- Односторонность: классический F-тест для дисперсий является односторонним (проверяет, превышает ли одна дисперсия другую). Для двусторонних гипотез требуется осторожность.
- Множественное тестирование: при одновременной проверке нескольких гипотез с помощью F-критерия возрастает риск ошибки первого рода (ложноположительных результатов).
- Зависимость от объёма выборки: при больших выборках даже незначительные различия дисперсий могут стать статистически значимыми, что не всегда имеет практическое значение.
Пример использования
Предположим, исследователь хочет сравнить дисперсии двух методов измерения концентрации вещества. Первая выборка (n₁ = 10) даёт дисперсию s₁² = 4.2, вторая (n₂ = 12) — s₂² = 1.8. Вычисляем F = 4.2 / 1.8 ≈ 2.33. Степени свободы: df₁ = 9, df₂ = 11. По таблице F-распределения для уровня значимости α = 0.05 критическое значение F(9, 11) ≈ 2.90. Поскольку 2.33 < 2.90, нулевая гипотеза о равенстве дисперсий не отклоняется. Различие дисперсий статистически незначимо.
Варианты и модификации
- Двусторонний F-тест: для проверки гипотезы σ₁² ≠ σ₂² используется двусторонний критерий, где критическая область включает как малые, так и большие значения F.
- F-тест Уэлча: модификация, менее чувствительная к нарушению нормальности.
- Критерий Левене: альтернатива F-тесту для дисперсий, более устойчивая к отклонениям от нормальности.
- Критерий Бартлетта: используется для сравнения дисперсий более чем двух групп, но также чувствителен к нормальности.
Значение в статистике
F-критерий Фишера является фундаментальным инструментом в прикладной статистике, особенно в дисперсионном анализе и регрессионном моделировании. Он лежит в основе многих современных методов, включая общие линейные модели, анализ временных рядов и машинное обучение. Несмотря на ограничения, F-тест остаётся стандартным методом проверки гипотез о дисперсиях и значимости моделей в научных исследованиях, экономике, биологии, психологии и других областях.
Источники
- Фишер Р. А. Статистические методы для исследователей. — 1925.
- Снедекор Дж. У. Статистические методы в применении к исследованиям в сельском хозяйстве и биологии. — 1937.
- Леман Э. Л. Проверка статистических гипотез. — 1959.
- Монтгомери Д. К. Планирование эксперимента и анализ данных. — 2012.
BFOmetr — база данных и аналитика по компаниям России.
На главную BFOmetr →