На этой странице

Анализ времени до события

Модуль Анализ времени до события оценивает, через какое время произойдёт интересующее событие — смерть, рецидив, отказ техники, отток клиентов — и как этот срок зависит от ковариат. Поддерживаются пять методов, три схемы цензурирования (правое, интервальное, левое усечение) и работа с конкурирующими рисками, когда возможно событие более чем одного типа.

Что такое анализ выживаемости? Обычная регрессия предполагает, что исходы наблюдаются полностью. Данные о выживаемости устроены иначе: у многих наблюдений к концу исследования событие ещё не произошло, и о них известно лишь то, что они «дожили» как минимум до момента последнего контакта. Эта частичная информация называется цензурированием, а анализ выживаемости — это семейство методов, рассчитанных именно на такие данные. Результатом обычно бывают либо кривая выживаемости — вероятность всё ещё быть без события в каждый момент времени, — либо модель риска, показывающая, как ковариаты ускоряют или замедляют наступление события.

  1. Выберите переменную времени и индикатор события
  2. Назначьте каждому наблюдаемому уровню индикатора события роль (цензурировано, событие или конкурирующая причина)
  3. При необходимости задайте время вхождения, группирующую переменную и ковариаты
  4. Выберите метод анализа и тип цензурирования, затем настройте параметры выбранного метода
  5. Нажмите Рассчитать

Роли переменных

В левой колонке расположены селекторы переменных; в правой — настройка метода.

Переменная времени

Неотрицательная числовая переменная, измеряющая длительность от начала наблюдения до события или до момента последнего контакта. Дни, месяцы, годы — единицы измерения важны только для интерпретации вывода. Отрицательные и пропущенные значения автоматически отбрасываются.

Индикатор события и роли уровней

Категориальная переменная, отмечающая, что произошло с каждым наблюдением. После её выбора под селектором появляется таблица Роли уровней: каждому наблюдаемому значению назначается одна из ролей:

  • Цензурировано — событие не произошло (например, «жив», «0», «нет»)
  • Событие — событие произошло (одиночное событие)
  • Событие (причина 2), Событие (причина 3), Событие (причина 4) — различные причины для анализа конкурирующих рисков

По умолчанию используются распространённые соглашения: значения 0, false, no, censored, alive сразу относятся к Цензурировано, всё остальное — к Событию. При необходимости назначения можно отредактировать.

Зачем нужны роли уровней? В разных областях используются разные кодировки выживаемости — где-то 0/1, где-то «жив»/«умер», где-то многоуровневый код причины смерти. Вместо того чтобы заставлять перекодировать переменную заранее, модуль позволяет назначить роли каждому уровню прямо здесь. Если ролей с не-цензурированными значениями назначено две и больше, автоматически разблокируются методы конкурирующих рисков.

Если у переменной события более 20 различных значений, назначение ролей блокируется — практически всегда это означает, что по ошибке выбрана непрерывная переменная. Перекодируйте её в категориальный индикатор события.

Время вхождения (левое усечение)

Необязательная числовая переменная для отложенного вхождения: наблюдение попадает в множество риска не с нуля, а с некоторого момента. Полезно при анализе с возрастом в качестве оси времени или когда наблюдения попадают в регистр в разном возрасте.

Что такое левое усечение? Представьте исследование смертности после выхода на пенсию по данным регистра. Пенсионер, попавший в регистр в 70 лет, не находился под риском в регистре между 65 и 70 — это окно левоусечено. Игнорирование времени вхождения смещает оценки выживаемости вверх, потому что наблюдения, попавшие в когорту поздно, оказываются недопредставленными.

Левое усечение в текущей реализации не поддерживается одновременно с интервальным цензурированием и с регрессией Файна–Грея.

Группировка и страты

Необязательная категориальная переменная. Её роль зависит от метода:

  • В непараметрическом анализе она разделяет кривые и активирует критерий сравнения групп
  • В регрессии Кокса она стратифицирует базовый риск — у каждой страты собственный базовый риск, тогда как эффекты коэффициентов ковариат остаются общими
  • В параметрической регрессии она добавляется в правую часть формулы как фиксированный фактор
  • В регрессии конкурирующих рисков (только в варианте по причинам) она стратифицирует базовый риск; Файн–Грей её игнорирует (добавьте её в ковариаты, если хотите проверить эффект)

Ковариаты

Список с множественным выбором — предикторы для регрессионных методов (Кокс, параметрическая, регрессия конкурирующих рисков). Категориальные ковариаты кодируются как факторы; референсным становится первый по сортировке уровень, числовые ковариаты включаются как есть. Кумулятивная инцидентность и непараметрический анализ ковариаты игнорируют.

Цензурирование

Тип Когда применять
Правое цензурирование Время события известно точно, иначе известно лишь то, что наблюдение оставалось без события до момента последнего контакта. По умолчанию.
Интервальное цензурирование Время события известно лишь как находящееся между двумя осмотрами (например, ежегодный скрининг). Требуется переменная верхней границы.

Левое усечение задаётся отдельно через время вхождения, а не через выпадающий список цензурирования. Эти две схемы можно сочетать на правоцензурированных данных.

При выборе Интервального цензурирования появляется селектор Верхняя граница. Укажите числовую переменную с верхним концом интервала и используйте NA для правоцензурированных строк (тогда переменная времени содержит время последнего контакта).

Правое или интервальное цензурирование: при правом цензурировании момент события известен точно, либо известно, что к моменту последнего контакта оно ещё не произошло. При интервальном цензурировании известно лишь, что событие произошло между двумя проверками — типично для периодического скрининга. Если интервально-цензурированное событие считать произошедшим в верхнем конце интервала, оценки выживаемости смещаются вниз.

Интервальное цензурирование в текущей версии поддерживается только для непараметрических и параметрических методов. Регрессия Кокса, кумулятивная инцидентность и регрессия конкурирующих рисков требуют правоцензурированных данных.

Методы анализа

Метод Что оценивает Необходимый ввод
Непараметрическая кривая выживаемости S(t) (Каплан–Майер) или H(t) (Нельсон–Ален) без допущений о распределении Время, событие
Регрессия Кокса пропорциональных рисков Отношения рисков для ковариат, оставляя базовый риск произвольным Время, событие, ≥ 1 ковариата
Параметрическая регрессия выживаемости Кривые выживаемости и эффекты ковариат при заданном распределении (Вейбулла, экспоненциальном, логнормальном, логлогистическом, гауссовском, Гомпертца) Время, событие
Кумулятивная инцидентность (конкурирующие риски) Функции инцидентности для каждой причины, когда возможно событие более чем одного типа Время, событие с ≥ 2 не-цензурированными ролями
Регрессия конкурирующих рисков Специфичные для причины риски (Кокс) или субдистрибутивные риски Файна–Грея Время, событие с ≥ 2 не-цензурированными ролями, ≥ 1 ковариата

Методы конкурирующих рисков остаются заблокированными в выпадающем списке, пока в таблице ролей не назначены хотя бы две различные не-цензурированные роли.

Непараметрические, полупараметрические, параметрические методы: непараметрические (Каплан–Майер, Нельсон–Ален) ничего не предполагают о форме функции риска — они описательны. Кокс — полупараметрический: он не задаёт базовый риск, но предполагает мультипликативность и постоянство во времени эффектов ковариат. Параметрические методы фиксируют конкретное распределение (Вейбулла, логнормальное и т. д.) — рискованнее, если выбор окажется неверным, зато позволяют экстраполировать за пределы наблюдаемого периода и дают гладкие предсказания.

Параметры выбранного метода

Правая колонка показывает разные карточки в зависимости от выбранного метода.

Непараметрические опции

  • Оценка — Каплан–Майер (функция выживаемости) или Нельсон–Ален (кумулятивный риск через Флеминга–Харрингтона). При выборе Интервального цензурирования поле оценки скрывается, и автоматически применяется НПМП Тёрнбулла.
  • Критерий сравнения групп — активен только при заданной группирующей переменной:
    • Лог-ранговый (ρ = 0) — стандартный, события взвешиваются одинаково по всему времени
    • Пето–Пето (ρ = 1) — больший вес ранним событиям
    • Тарон–Уэр (ρ = 0.5) — промежуточная схема взвешивания
    • Пропустить тест — выводить только кривые
    • При трёх и более группах выполняются попарные сравнения с тем же весом, и применяется настройка поправки на множественные сравнения (по умолчанию — Беньямини–Хохберг для попарной таблицы)
  • Вероятности выживания во временных точках — список значений через пробел (например, 12 24 36 60). Выводятся как S(t) с доверительными границами и числом наблюдений в группе риска. Оставьте поле пустым, чтобы пропустить.
  • Отображение — переключатели Полоса доверительного интервала и Метки цензурирования на кривой.

Выбор веса лог-рангового критерия: стандартный лог-ранговый критерий предполагает, что отношение рисков между группами примерно постоянно во времени. Если различие, как ожидается, наиболее заметно на ранних временах (например, лечение, помогающее в первые месяцы), Пето–Пето может быть мощнее. Тарон–Уэр — промежуточный вариант. Не выбирайте вес после того, как увидели, какой из них дал наименьшее p — это p-хакинг. Выбирайте его исходя из содержательного вопроса.

Опции регрессии Кокса

  • Обработка совпадений — как частичное правдоподобие учитывает события в одинаковые моменты:
    • Эфрон (по умолчанию) — точно и недорого вычислительно; правильный выбор почти для всех
    • Бреслоу — более простое приближение; смещён при большом числе совпадений
    • Точное частичное правдоподобие — точное, но медленное; на практике совпадает с Эфроном, кроме экстремальных случаев
  • Робастная (сэндвич) оценка дисперсии — стандартные ошибки Хьюбера–Уайта. Применяйте при возможной кластеризации наблюдений или мягкой неверной спецификации модели.
  • Диагностика (каждый переключатель добавляет раздел вывода):
    • Критерий пропорциональности рисков (остатки Шёнфельда)cox.zph по каждому члену плюс глобальный тест, со скаттер-графиком остатков и наложенным локальным сглаживанием
    • График log-log относительно группирующей переменной — кривые log(−log S(t)); параллельные линии подтверждают допущение о пропорциональности рисков
    • Проверка функциональной формы (мартингальные остатки) — по одной панели «остатки–ковариата» на каждую непрерывную ковариату, с локальным сглаживанием — нелинейность сглаженной кривой указывает на нелинейный эффект
    • Диагностика влияния (dfbeta) — изменение каждого коэффициента при удалении одного наблюдения; выводится максимальный и средний |dfbeta|, плюс точечный график по наблюдениям
    • Конкордация (C-индекс) — метрика дискриминации (0.5 — на уровне случайного, 1.0 — идеальное упорядочивание)

Опции параметрической регрессии

  • Семейство распределений:

    Семейство Тип Примечания
    Вейбулла AFT Гибкая монотонная функция риска; сводится к экспоненциальной при параметре формы = 1
    Экспоненциальное AFT Постоянный риск — сильное допущение, полезно как базовая модель
    Логнормальное AFT Риск растёт, затем падает; пригодно для «горбатой» формы риска
    Логлогистическое AFT Похоже на логнормальное, с более лёгкими хвостами
    Гауссовское AFT Линейная регрессия в шкале времени; редко уместно
    Гомпертца (пропорциональные риски) PH Экспоненциально растущий риск — типичная модель смертности взрослых
    Сравнить все (рейтинг по AIC) Подгоняет все семейства, выводит подгонку с лучшим AIC, плюс таблицу рейтинга и столбчатый график

    AFT-модели сообщают отношения времён (множитель к шкале времени), Гомпертц — отношения рисков.

  • Наложить подогнанные кривые на Каплан–Майера — добавляет график сравнения параметрической кривой выживаемости с непараметрической кривой Каплан–Майера, при заданной группирующей переменной — отдельно по группам.

AFT и PH: в модели пропорциональных рисков (Кокс, Гомпертц) ковариата умножает функцию риска. В модели ускоренного отказа (AFT — Вейбулл, логнормальное, логлогистическое, гауссовское) она растягивает или сжимает шкалу времени — отношение времён 1.5 означает, что событие в среднем наступает в 1.5 раза позже. AFT-эффекты порой интуитивнее для клиницистов, потому что выражены в единицах времени.

Гомпертц с интервальным цензурированием: Гомпертц подгоняется через eha::phreg, не принимающий интервально-цензурированный ввод. При выборе интервального цензурирования вариант становится недоступным, а Сравнить все автоматически исключает Гомпертца из сравнения.

Опции регрессии конкурирующих рисков

  • Подход:
    • Специфичные для причины риски (Кокс по каждой причине) — отдельная модель Кокса на каждую причину; остальные причины считаются цензурированием. Отвечает на вопрос: «что предсказывает эту причину среди тех, у кого ещё не наступило ни одно событие?»
    • Субдистрибутивные риски Файна–Грея — моделирует кумулятивную инцидентность напрямую через cmprsk::crr. Отвечает на вопрос: «что предсказывает наступление именно этой причины первой?»

Специфичные для причины и Файн–Грей: оба подхода отвечают на разные вопросы и могут давать разные знаки. Специфичные для причины риски описывают этиологию каждой причины среди ныне выживающих. Субдистрибутивные риски Файна–Грея описывают прогноз — как ковариата сдвигает итоговую кумулятивную инцидентность с учётом того, что конкурирующие события блокируют интересующую причину. Для решений на уровне пациента чаще полезнее Файн–Грей, для биологического механизма — специфичные для причины.

Проверки объёма выборки и EPV

Перед подгонкой любой регрессии модуль проверяет соотношение событий и параметров (events per variable, EPV):

  • Событий < параметров — подгонка блокируется ошибкой; уменьшите число ковариат или соберите больше данных
  • Событий < 10 × параметров — неблокирующее предупреждение; эмпирическое правило — не менее 10 событий на параметр для устойчивых оценок

Эффективное число параметров — сумма степеней свободы ковариат: 1 на каждую числовую, (уровней − 1) на каждый фактор. Параметрические подгонки добавляют 1 на параметр масштаба (2 для Гомпертца — масштаб и форма). Для регрессии конкурирующих рисков проверка использует причину с наименьшим числом событий как наихудший случай, поскольку каждая причина — отдельная модель.

Почему десять событий на переменную? При числе событий меньше числа параметров частичное правдоподобие сингулярно — есть бесконечно много комбинаций коэффициентов, одинаково подгоняющих данные, и стандартные ошибки получаются неправдоподобными. Даже при допустимой подгонке EPV ниже 10 делает коэффициенты чувствительными к отдельным наблюдениям и даёт ненадёжные доверительные интервалы для отношений рисков.

Чтение результатов

Каждый запуск даёт карточку вывода с заголовком, включающим метод, переменную времени и переменную события.

Непараметрический анализ выживаемости

  • Сводка по кривой — N, события, цензурированные, медианная выживаемость с доверительным интервалом и (для Каплан–Майера / Нельсон–Алена) ограниченное среднее время выживания (RMST) с его стандартной ошибкой. Медиана выводится как , когда более половины наблюдений ещё в группе риска на максимальном следе наблюдения.
  • Вероятности выживания во временных точках (если поле Вероятности выживания во временных точках заполнено) — S(t), доверительные границы и число в группе риска для каждой запрошенной точки на страту.
  • Сравнение групп — χ² лог-рангового семейства, ст.св. и p-значение (опускается при выборе Пропустить тест или при отсутствии группировки).
  • Попарные сравнения (три и более группы) — χ², ст.св., сырое и скорректированное p для каждой пары. Поправка использует глобальную настройку p-значений.
  • График кривой выживаемости — кривые Каплан–Майера, Нельсон–Алена или НПМП Тёрнбулла с опциональной полосой ДИ и метками цензурирования.
  • График кумулятивного риска — H(t) во времени. Не выводится для Тёрнбулла (подгонка Icens не даёт пригодной функции риска).

Что такое RMST? Ограниченное среднее время выживания — это площадь под кривой выживаемости до выбранной точки отсечения, интерпретируемая как среднее время без события в этом окне. В отличие от медианы, RMST определён, даже если событие наступило менее чем у половины наблюдений, и имеет ясный клинический смысл: «лечение добавляет 4.2 месяца жизни без события за 5 лет». RMST выводится с границей по наибольшему общему следу наблюдения между стратами.

Полосы ДИ на кривых выживаемости: полоса показывает поточечные доверительные интервалы для S(t). Кривые с явно расходящимися полосами говорят о реальном межгрупповом различии, но формальный тест — это лог-ранговый критерий в таблице Сравнение групп.

Регрессия Кокса

  • Сводка модели — N, события, метод обработки совпадений, флаг робастных СО.
  • Коэффициенты — по строке на каждый член (уровни факторов разворачиваются). Столбцы:
    • ОР — отношение рисков с доверительным интервалом
    • log(HR) — сам коэффициент
    • СО — стандартная ошибка
    • z со звёздочками значимости
    • p-значение
  • Общие тесты — χ² критерия отношения правдоподобий, Вальда и счёта (лог-рангового), ст.св., p. Проверяют общую нулевую гипотезу о равенстве всех коэффициентов нулю.
  • Конкордация (C-индекс) (если включена) — значение и СО.
  • Форест-график отношений рисков — лог-шкала с референсной линией HR = 1.
  • Критерий пропорциональности рисков (если включён) — поэлементный и глобальный χ² из cox.zph. Значимый результат означает, что эффект данного члена меняется во времени.
  • Остатки Шёнфельда — точечный график шкалированных остатков по времени, по одной панели на каждый член, с локальным сглаживанием. Нелинейность сглаженной кривой — визуальный аналог значимого cox.zph.
  • График log-log (если включён и задана группирующая переменная) — log(−log S(t)) по стратам. Примерно параллельные кривые подтверждают пропорциональность на уровне страт.
  • Мартингальные остатки (если включены) — по одной панели на каждую непрерывную ковариату с ковариатой по оси x и остатком по оси y. Нелинейность сглаженной кривой указывает на нелинейный эффект.
  • Диагностика влияния (сводка dfbeta) + Остатки dfbeta по наблюдениям (если включены) — максимальный и средний |dfbeta| по членам, а также точечный график по наблюдениям для выявления отдельных влиятельных точек.
  • Базовая выживаемость — референсная кривая (или кривые) survfit.coxph; числовые ковариаты вычисляются на их выборочном среднем, факторные — на референсном уровне (а не на нуле), так что кривая отображает выживаемость «среднего» наблюдения.

Чтение отношений рисков: ОР = 1 означает, что предиктор не влияет на функцию риска. ОР = 2 означает удвоение риска при росте предиктора на единицу; ОР = 0.5 — снижение вдвое. Сначала смотрите ДИ — если он пересекает 1, эффект незначим. Для бинарной 0/1-ковариаты ОР — это отношение рисков между двумя группами при контроле остальных членов модели.

Что означает нарушение допущения PH? Значимый cox.zph говорит, что отношение рисков для данного члена непостоянно во времени — эффект ковариаты растёт или убывает с накоплением периода наблюдения. Тогда подогнанное HR — это своего рода взвешенное среднее по периоду наблюдения. Типичные средства устранения: стратификация по проблемной переменной, подгонка коэффициента, зависящего от времени (пока не поддерживается), или переход к параметрической модели, где форма зависимости от времени видна явно.

Параметрическая регрессия

  • Сводка модели — распределение, N, события, AIC, логарифм правдоподобия, параметр масштаба (где применимо).
  • Рейтинг по AIC (режим «Сравнить все») — AIC, ΔAIC, логарифм правдоподобия и флаг сходимости для каждого семейства, отсортированные от лучшего к худшему. Затем — столбчатый график AIC по распределениям.
  • Коэффициенты — структура та же, что у Кокса, но столбец экспоненты называется Отношение времён для AFT-семейств и ОР для Гомпертца. Параметры распределения (Log(scale), log(shape)) выводятся отдельными строками снизу таблицы — это не эффекты ковариат.
  • Каплан–Майер vs параметрическая подгонка (если активно Наложить подогнанные кривые на Каплан–Майера) — референсная кривая КМ (с полосой ДИ) и гладкая параметрическая кривая. При заданной группирующей переменной кривые разделены по группам. Гладкая кривая использует числовые ковариаты на их среднем и факторные — на референсном уровне.

Чтение отношений времён: в AFT-модели отношение времён = exp(коэффициент). Отношение времён 1.4 у бинарной ковариаты означает, что события в этой группе наступают в среднем в 1.4 раза позже (на 40% позже). Меньшие отношения времён — более раннее наступление событий.

Оговорка к рейтингу по AIC: AIC сравнивает подгонки на одних данных, поэтому рейтинг осмыслен, но низкий AIC не гарантирует, что победившее семейство «правильное». Всегда сверяйте график наложения — параметрическая кривая, систематически расходящаяся с КМ в хвосте, — тревожный признак, даже когда AIC у неё минимален.

Кумулятивная инцидентность (конкурирующие риски)

  • Сводка по кумулятивной инцидентности — N и события по группам × причинам.
  • K-выборочный тест Грея (при заданной группирующей переменной) — χ², ст.св., p по каждой причине. Проверяет, различаются ли функции кумулятивной инцидентности между группами для данной причины.
  • Кривые кумулятивной инцидентности — F(t) по причинам × группам. Доверительные границы используют преобразование complementary log-log над F.

Кумулятивная инцидентность и 1 − KM: если считать события не интересующих причин обычным цензурированием и приводить 1 − KM, инцидентность интересующей причины систематически завышается — это эквивалент допущения, что конкурирующие события рано или поздно «превратятся» в интересующее, если ждать достаточно долго. CIF (Аалена–Йохансена / cmprsk::cuminc) делит риск так, что суммарные инцидентности всех причин складываются с выживаемостью без событий до 1.

Регрессия конкурирующих рисков

  • Сводка подгонки — N, события и флаг сходимости по каждой причине.
  • Специфичные для причины риски: {причина} или Субдистрибутивные риски: {причина} — таблица коэффициентов на каждую причину. Для субдистрибутивных рисков столбцы называются sHR (субдистрибутивное отношение рисков) и log(sHR) вместо HR / log(HR).
  • Общие тесты: {причина} (только для специфичных для причины рисков) — LR / Вальда / счёта на каждую подгонку, той же структуры, что у Кокса.
  • Форест-график ОР (специфичные для причины) или Форест-график sHR (Файн–Грей) — общий форест с одной строкой на каждую пару (причина, член).

Если подгонка для какой-либо причины не сошлась (малая подгруппа, разделение, численные проблемы), на её месте появляется предупреждение, а не таблица коэффициентов.

Исключённые наблюдения и пропущенные значения

Каждая карточка вывода завершается примечанием «исключено строк», когда какие-либо данные были отброшены. Модуль молча исключает строки с:

  • Нечисловым или отрицательным временем
  • Пустым уровнем события или уровнем без назначенной роли
  • При интервальном цензурировании — отсутствующей верхней границей (когда событие произошло) или верхней границей меньше нижней
  • Пропущенным значением группирующей переменной или времени вхождения
  • Пропущенным значением ковариаты (для регрессионных методов)

Это локальное удаление по строкам внутри метода — глобальная настройка пропущенных данных здесь не применяется, поскольку анализу выживаемости нужны точные времена наблюдения.

Чек-лист отчётности

Метод:

  • Переменная времени, индикатор события и какие роли назначены каждому уровню
  • Схема цензурирования (правое или интервальное; левое усечение, если применялось)
  • Метод (Каплан–Майер, Кокс, параметрический Вейбулл и т. д.) и какие допущения проверялись
  • Для Кокса: обработка совпадений, использование робастных СО, выполненная диагностика
  • Для параметрической регрессии: выбранное семейство и (при сравнении) критерий выбора
  • Для конкурирующих рисков: подход (специфичный для причины или Файн–Грей), определение каждой причины
  • Ковариаты и как выбраны референсные уровни факторов
  • N до и после исключений; число событий по причинам, где применимо

Результаты:

  • Медианная выживаемость (или RMST) по группам с доверительными интервалами
  • Вероятности выживания в клинически значимых временных точках
  • Для критериев сравнения: тест (лог-ранговый / Пето–Пето / Тарон–Уэр / Грея), χ², ст.св., p; скорректированные p для попарных сравнений, где применимо
  • Для Кокса: ОР с ДИ, χ²/p общего теста и явное утверждение о допущении пропорциональности рисков
  • Для параметрической регрессии: отношения времён (или ОР для Гомпертца) с ДИ, AIC и таблица сравнения, где применимо
  • Для регрессии конкурирующих рисков: таблица коэффициентов по каждой причине с подходящей меткой риска (HR или sHR)

Воспроизводимость

Каждый анализ печатает базовый R-код в консоль R — его можно изучить, скопировать или перезапустить. Модуль использует survival (Каплан–Майер, Нельсон–Ален, лог-ранговый, Кокс, параметрические AFT), eha (подгонка Гомпертца с пропорциональными рисками), Icens (НПМП Тёрнбулла для интервального цензурирования) и cmprsk (кумулятивная инцидентность и регрессия Файна–Грея). Уровни доверия следуют глобальной настройке доверия, а попарные непараметрические сравнения учитывают настройку поправки на множественные сравнения. Цитаты использованных R-пакетов автоматически появляются в верхней части карточки вывода.

Типичные ошибки

Считать цензурированные навсегда без события. Цензурирование означает, что событие не произошло к моменту последнего контакта, а не что не произойдёт никогда. Утверждения вроде «выжило 75%» всегда должны указывать окно наблюдения — медиана KM не определена, когда более половины наблюдений ещё в группе риска.

Игнорировать конкурирующие риски. Если возможно событие более одного типа, а вы анализируете одну причину, считая остальные обычным цензурированием, 1 − KM завышает инцидентность интересующей причины. При нетривиальных конкурирующих событиях используйте кумулятивную инцидентность (или Файн–Грея).

Проверять пропорциональность рисков только глобально. Незначимый глобальный cox.zph не означает, что все члены в порядке — отдельный член может нарушать PH, в то время как глобальный тест остаётся незначимым. Всегда смотрите поэлементный тест и графики остатков Шёнфельда.

Выбирать параметрическое распределение только по AIC. AIC ранжирует подгонки на ваших данных, но не гарантирует, что какая-либо из них хорошо описывает истинный риск. Сверяйте параметрическое наложение с КМ-кривой, прежде чем сообщать AFT-эффект.

Информативное цензурирование. Методы выживаемости предполагают, что наблюдения, попавшие в цензурированные, не отличаются по риску от тех, кто остаётся в группе риска. Если цензурирование вызвано ухудшением прогноза (тяжёлые пациенты выпадают из наблюдения), результаты KM и Кокса смещены, и встроенного исправления нет. Опишите механизм цензурирования в публикации.

Смещение «бессмертного времени» (immortal time bias). Определение принадлежности к группе по событию, происходящему уже во время наблюдения (например, «пациенты, в итоге получившие препарат X»), даёт этим наблюдениям гарантированное окно без событий до момента, когда их вообще можно было классифицировать, что смещает сравнение. Определяйте группы только по исходной информации либо используйте время-зависимую ковариату (пока не поддерживается в этом модуле — для предобработки данных воспользуйтесь консолью R).