Метод выживаемости
Метод выживаемости — это совокупность статистических и математических подходов, используемых для анализа времени до наступления интересующего события (например, смерти, отказа оборудования, рецидива заболевания, увольнения с работы). Метод применяется в медицинских исследованиях, социальных науках, биологии, технике, экономике и демографии. Ключевой особенностью метода является возможность работы с неполными данными, когда для части объектов наблюдения интересующее событие ещё не наступило к моменту окончания исследования.
История
Основы метода выживаемости восходят к демографическим таблицам смертности XVII века, составленным Джоном Граунтом. Однако современный математический аппарат начал формироваться в середине XX века. В 1958 году американские статистики Эдвард Каплан и Пол Мейер опубликовали метод оценки функции выживаемости по неполным данным (оценка Каплана — Мейера). В 1972 году сэр Дэвид Кокс предложил модель пропорциональных рисков (регрессия Кокса), которая стала основой для многофакторного анализа выживаемости в медицине. С 1980-х годов методы выживаемости внедряются в техническую диагностику и актуарные расчёты.
Основные понятия и термины
Событие и время до события
Событие — заранее определённый исход (смерть, рецидив, поломка, смена статуса). Время до события — интервал от начала наблюдения до наступления события или до момента прекращения наблюдения.
Цензурирование
Цензурирование — ситуация, когда точное время события неизвестно. Различают:
- правое цензурирование — наблюдение прекращается до наступления события (наиболее распространённый тип);
- левое цензурирование — событие произошло до начала наблюдения;
- интервальное цензурирование — известно только, что событие наступило в некотором временном промежутке.
Функция выживаемости
Функция выживаемости \( S(t) \) — вероятность того, что время до события превышает заданное \( t \): \[ S(t) = P(T > t) \] где \( T \) — случайная величина времени до события. Функция монотонно убывает от 1 при \( t=0 \) до 0 при \( t \to \infty \).
Функция риска (hazard function)
Функция риска \( h(t) \) — мгновенная вероятность наступления события в момент времени \( t \) при условии, что до этого момента событие не наступило: \[ h(t) = \lim_{\Delta t \to 0} \frac{P(t \le T < t+\Delta t \mid T \ge t)}{\Delta t} \] Может быть постоянной, возрастающей, убывающей или иметь сложную форму.
Основные методы анализа выживаемости
Непараметрические методы
Метод Каплана — Мейера — оценка функции выживаемости на основе таблицы последовательных времён событий. Позволяет построить ступенчатую кривую выживаемости. Используется для сравнения двух и более групп (например, экспериментальной и контрольной). Сравнение групп выполняется с помощью лог-рангового теста или теста Гехана — Бреслоу.
Таблицы смертности (life tables) — группировка временного интервала по равным промежуткам и расчёт числа событий и лиц под риском в каждом интервале. Часто применяется в демографии и страховании.
Полупараметрические методы
Модель пропорциональных рисков Кокса — регрессионная модель, в которой функция риска представляется как произведение базовой функции риска \( h_0(t) \) и экспоненты от линейной комбинации ковариат: \[ h(t \mid \mathbf{X}) = h_0(t) \exp(\beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k) \] Базовая функция риска не параметризуется, что делает модель полупараметрической. Коэффициенты \( \beta \) интерпретируются как логарифмы отношения рисков (hazard ratio). Модель Кокса широко применяется в клинических испытаниях, эпидемиологии и социальных науках.
Параметрические методы
Параметрические методы предполагают, что распределение времени до события принадлежит некоторому параметрическому семейству. Наиболее распространённые модели:
- экспоненциальное распределение — постоянная функция риска;
- распределение Вейбулла — монотонная функция риска (возрастающая или убывающая);
- логарифмически нормальное распределение — функция риска с максимумом;
- распределение Гомпертца — экспоненциально возрастающая функция риска, часто используется в демографии.
Параметрические модели позволяют строить прогнозы и выполнять оценку медианного времени до события.
Сравнение групп
Для проверки гипотез о равенстве функций выживаемости в двух или более группах используются:
- лог-ранговый тест — наиболее распространённый, чувствителен к различиям в «хвосте» кривых;
- тест Гехана — Бреслоу — придаёт больший вес ранним событиям;
- тест Флеминга — Харрингтона — с настраиваемым весом.
Применение в медицине и эпидемиологии
Метод выживаемости — основной инструмент анализа результатов клинических исследований. Позволяет:
- оценивать эффективность лекарственных препаратов по времени до рецидива или смерти;
- сравнивать выживаемость при разных методах лечения;
- строить прогностические модели на основе клинических и молекулярных маркеров (например, стадия опухоли, возраст, уровень биомаркера);
- оценивать время до развития осложнений.
Примеры применения: исследование 5-летней выживаемости при раке, анализ времени до сердечно-сосудистого события в кардиологических испытаниях.
Применение в технике и актуарных расчётах
Анализ надёжности (reliability analysis)
Метод выживаемости используется для оценки времени до отказа технических систем. Основные задачи:
- проверка наработки до отказа механических узлов, электроники, программного обеспечения;
- построение кривых надёжности и функции риска;
- планирование профилактических ремонтов и запасных частей.
Актуарные расчёты
В страховании методы выживаемости применяются для:
- расчёта страховых тарифов на дожитие и на случай смерти;
- построения таблиц смертности для разных демографических групп;
- оценки вероятности наступления страхового случая.
Применение в социальных и экономических науках
Методы выживаемости используются для анализа:
- продолжительности безработицы (время от потери работы до трудоустройства);
- времени до смены работы или пенсии;
- длительности браков (времени до развода);
- времени до повторного совершения преступления (рецидивизма).
В этих областях событиями могут быть не только смерти, но и любые качественные переходы (например, выход на пенсию или смена места жительства).
Программное обеспечение
Для анализа выживаемости существует множество статистических пакетов:
- R: пакеты
survival,survminer,coxme; - Python: библиотеки
lifelines,scikit-survival; - SAS: процедура
PROC PHREGиPROC LIFETEST; - Stata: команды
stset,sts list,stcox; - SPSS: модуль
Survival Analysis.
Ограничения и критика
Основные ограничения методов выживаемости:
- проблема пропущенных данных — цензурирование может быть связано с самим событием (например, пациент выбывает из исследования из-за ухудшения состояния), что вносит смещение;
- допущение независимости цензурирования — классические методы требуют, чтобы момент цензурирования не зависел от вероятности события;
- необходимость большого объёма данных для стабильной оценки регрессионных моделей при большом числе ковариат;
- неприменимость к событиям с множественными повторениями без специальных расширений (например, модели с повторными событиями или методом Нельсона — Аалена).
В медицинских исследованиях также отмечается проблема интерпретации отношения рисков (hazard ratio) при нарушении пропорциональности во времени.
Современные направления развития
В последние десятилетия развиваются:
- модели с конкурирующими рисками (competing risks), когда несколько разных событий могут помешать наблюдению друг друга;
- модели с временно изменяющимися ковариатами (time-dependent covariates);
- методы машинного обучения — случайные леса выживаемости, нейронные сети Кокса (DeepSurv);
- байесовские подходы к анализу выживаемости, позволяющие учитывать априорную информацию.
Эти расширения позволяют применять метод выживаемости к более сложным и реалистичным данным.
BFOmetr — база данных и аналитика по компаниям России.
На главную BFOmetr →