На этой странице
- Анализ мощности
- Выбор критерия
- Вычислить
- Параметры
- Результаты
- Кривая мощности и тепловая карта чувствительности
- Справочные значения
- Конвертер размеров эффекта
- Ввод размера эффекта
- Вывод конвертера
- Планировщик поправки к уровню значимости
- Ввод поправки
- Вывод поправки
- Планировщик надёжности и ослабления
- Ослабление корреляции
- Планирование длины шкалы (формула Спирмена–Брауна)
- Планирование точности (ширина ДИ)
- Ввод точности
- Вывод точности
- Оптимизатор распределения по группам
- Ввод распределения
- Вывод распределения
- Контрольный список для отчёта
- Воспроизводимость
Планировщик анализа
Планировщик анализа — набор инструментов для планирования исследования, включающий шесть блоков: анализ мощности, конвертер размеров эффекта, планировщик поправки к уровню значимости, планирование надёжности и ослабления, планирование точности и оптимизатор распределения по группам. Каждый блок — раскрывающийся раздел; открывайте нужный.
Зачем планировать заранее? Проводить исследование без предварительного планирования объёма выборки, ожидаемого размера эффекта и стратегии работы со множественными сравнениями — всё равно что строить дом без проекта. Анализ мощности показывает, сколько нужно участников. Планировщик поправки — как обращаться с множественными тестами. Планирование надёжности — сколько пунктов нужно вашей шкале. Сделать это до сбора данных позволяет избежать двух самых распространённых проблем в исследованиях: недостаточно мощных работ, которые упускают реальные эффекты, и постфактумных объяснений неожиданных результатов.
Анализ мощности
Определяет объём выборки, статистическую мощность или минимально обнаруживаемый размер эффекта для планируемого исследования.
Что такое статистическая мощность? Мощность — это вероятность того, что исследование обнаружит реальный эффект, если он существует. Мощность 0.80 означает 80%-й шанс получить значимый результат при наличии истинного эффекта — и 20%-й шанс его пропустить. Принятый ориентир — 0.80, хотя для дорогостоящих исследований или важных решений лучше стремиться к 0.90. Мощность зависит от трёх вещей: размера эффекта (крупные эффекты обнаружить легче), объёма выборки (больше данных — лучше) и уровня значимости (более строгая альфа требует больше доказательств).
Выбор критерия
Выберите статистический критерий, который планируете использовать:
| Категория | Критерии |
|---|---|
| t-критерии | Одновыборочный, Для независимых выборок (по умолчанию), Парный |
| Дисперсионный анализ | Однофакторный, многофакторный |
| Корреляция | Корреляция Пирсона |
| Регрессия | Множественная регрессия |
| Хи-квадрат | Критерий согласия, Критерий независимости |
| Доли | Одновыборочный, Двухвыборочный |
Метрика размера эффекта, поля параметров и подпись объёма выборки обновляются автоматически в зависимости от выбранного критерия.
Вычислить
Выберите, какой параметр вычислять — остальные два задаются вручную:
- Объём выборки (по умолчанию) — «сколько участников мне нужно?»
- Мощность — «какова вероятность обнаружить эффект при данном объёме выборки?»
- Размер эффекта — «какой минимальный эффект я могу обнаружить при данном объёме выборки?»
Параметры
Все критерии используют следующие основные поля:
- Размер эффекта — ожидаемая величина эффекта. Метрика меняется в зависимости от критерия (d Коэна для t-критериев, f Коэна для однофакторного дисперсионного анализа, r для корреляции, f² для регрессии и факторного дисперсионного анализа, w Коэна для хи-квадрат, h Коэна для долей). Значения по умолчанию соответствуют «средним» конвенциям Коэна.
- Уровень значимости (α) — по умолчанию 0.05
- Мощность (1 − β) — по умолчанию 0.80
- Объём выборки — подпись адаптируется к критерию («на группу», «число пар», «общий объём выборки» и т. д.)
Дополнительные поля для отдельных критериев:
- Стороны критерия (все t-критерии и корреляция Пирсона) — двусторонний (по умолчанию), односторонний (больше) или односторонний (меньше)
- Число групп (однофакторный дисперсионный анализ) — по умолчанию 3
- Ст.св. числителя / знаменателя (многофакторный дисперсионный анализ) — для задания эффекта и ошибки
- Число предикторов (регрессия) — по умолчанию 3
- Степени свободы (хи-квадрат) — подсказка показывает формулу: категории − 1 для критерия согласия, (строки − 1) × (столбцы − 1) для критерия независимости
Какой размер эффекта использовать? Не выбирайте «средний» только потому, что он стоит по умолчанию. Изучите предыдущие исследования в вашей области — лучший источник это метаанализы. Если данных нет, проведите небольшое пилотное исследование. Конвенции Коэна (малый / средний / крупный) — грубые ориентиры, а не нормативы. В одних областях d = 0.20 — значимый эффект, в других — шум.
Результаты
После нажатия Вычислить:
- Основной результат — выделенная рамка с ответом (например, «Требуемый объём выборки: 64 на группу (128 всего)»)
- Использованные параметры — сводная таблица всех введённых значений
- Анализ чувствительности — таблица, показывающая фактическую мощность (пересчитанную через
pwr) при 50%, 75%, 100%, 125% и 150% от опорного объёма выборки. Опорным значением выступает рассчитанный N при поиске объёма выборки и введённый N в остальных режимах.
Всегда проверяйте анализ чувствительности. Ваша оценка размера эффекта — лишь оценка. Таблица показывает, что произойдёт, если она окажется неверной. Если мощность падает до 0.50 при 75% от расчётного N, ваше исследование ненадёжно — стоит ориентироваться на больший объём выборки.
Кривая мощности и тепловая карта чувствительности
Рядом с результатами доступны три кнопки:
- Показать кривую мощности — строит интерактивный график зависимости мощности (ось Y) от объёма выборки (ось X). Зелёное перекрестие отмечает рассчитанный результат. Наводите курсор на кривую, чтобы увидеть мощность при любом объёме выборки.
- Показать тепловую карту чувствительности — отображает двумерную сетку мощности по диапазону объёмов выборки (ось X) и размеров эффекта (ось Y), привязанную к текущим значениям. В каждой ячейке — фактическая мощность, рассчитанная пакетом
pwr, окрашенная по последовательной шкале (светлый = низкая мощность, тёмный = высокая); значение пишется внутри ячейки. - Экспортировать кривую в PNG — сохраняет видимую кривую мощности в PNG с двукратным разрешением. Требуется, чтобы кривая была отображена.
Справочные значения
До выполнения расчёта отображается карточка с конвенциями Коэна:
| Метрика | Малый | Средний | Крупный |
|---|---|---|---|
| d Коэна | 0.20 | 0.50 | 0.80 |
| r Пирсона | 0.10 | 0.30 | 0.50 |
| f Коэна | 0.10 | 0.25 | 0.40 |
| f² Коэна | 0.02 | 0.15 | 0.35 |
| w Коэна | 0.10 | 0.30 | 0.50 |
Конвертер размеров эффекта
Преобразует одно значение размера эффекта во все остальные поддерживаемые метрики. Пригодится, когда в статье приведена одна метрика (например, отношение шансов), а для анализа мощности или сравнения нужна другая (например, d Коэна).
Ввод размера эффекта
Выберите тип входного значения из 15 вариантов: d Коэна, g Хеджеса, корреляция r, R², эта-квадрат, частный эта-квадрат, омега-квадрат, f Коэна, f² Коэна, w Коэна, h Коэна, V Крамера, отношение шансов, CLES (общеязыковой размер эффекта), NNT (число необходимых для лечения).
При необходимости появляются дополнительные поля:
- Объём выборки — повышает точность для g Хеджеса (обязателен при конвертации из g)
- Размерность таблицы — обязателен для V Крамера
- Доли (p1, p2) — обязательны для h Коэна
- Степени свободы — обязательны для частного эта-квадрат как при вводе, так и при выводе; без них значение частной η² трактуется по формуле обычной η²
- Частота события в контрольной группе — обязательна для NNT
Как работает конвертер: все входные типы сначала преобразуются в d Коэна как промежуточную точку, затем из d — во все остальные метрики. Конвертация между двумя не-d метриками проходит через промежуточный шаг, что может вносить небольшие артефакты округления.
Вывод конвертера
После нажатия Конвертировать таблица показывает каждую метрику с её значением и словесной интерпретацией (пренебрежимо малый, малый, средний или крупный) согласно конвенциям Коэна. Метрики, требующие дополнительных данных, которые не были введены, показывают прочерк.
Планировщик поправки к уровню значимости
Показывает скорректированные пороги значимости для множественной проверки, чтобы вы могли спланировать поправку до проведения исследования.
Зачем корректировать при множественной проверке? Если проверить 20 гипотез при α = 0.05, можно ожидать одного ложноположительного результата по чистой случайности — даже если ни одного реального эффекта нет. Поправка корректирует порог, сдерживая это накопление ошибок. Вопрос в том, как корректировать. Этот инструмент показывает, что каждый метод делает с вашим пороговым значением для каждого теста, — чтобы вы могли принять взвешенное решение. См. также настройку поправки к p-значениям для применения поправок к реальным результатам.
Ввод поправки
- Число сравнений — по умолчанию 10
- Семейный уровень альфа — по умолчанию 0.05
Вывод поправки
После нажатия Вычислить пороги таблица показывает скорректированный порог p-значения для трёх рангов: наиболее значимое p-значение (p₍₁₎), среднеранговое и наименее значимое (p₍ₘ₎).
| Метод | Принцип работы |
|---|---|
| Бонферрони | Постоянный порог: α / m. Прост, но консервативен. |
| Шидака | Чуть менее консервативен, чем Бонферрони: 1 − (1 − α)^(1/m). |
| Холма / Хохберга / Хоммеля | Пошаговые методы, использующие разные пороги для каждого ранжированного p-значения. Все три дают одинаковые пороговые значения, но различаются по процедуре. По мощности: Хоммель ≥ Хохберга ≥ Холма. |
| Бенджамини–Хохберга (FDR) | Контролирует частоту ложных открытий, а не уровень семейной ошибки — более либеральный, лучше подходит для поисковых исследований. |
| Бенджамини–Йекутиели (BY) | Консервативный контроль FDR без предположений о зависимости между тестами. |
Чтение таблицы: последовательные методы (Холма, Хохберга, Бенджамини–Хохберга) сравнивают каждое p-значение с разным порогом в зависимости от его ранга. Таблица показывает, как выглядят эти пороги в трёх позициях. Наиболее значимое p-значение имеет самый строгий порог; наименее значимое — самый мягкий.
Планировщик надёжности и ослабления
Два инструмента для планирования с учётом надёжности измерений.
Ослабление корреляции
Показывает, как ненадёжность измерений ослабляет наблюдаемые корреляции.
Ввод:
- Истинная / ожидаемая корреляция — корреляция, которую вы ожидаете между конструктами (должна лежать в [−1, 1]; по умолчанию 0.50)
- Надёжность меры X — α Кронбаха или омега (должна лежать в (0, 1]; по умолчанию 0.80)
- Надёжность меры Y — (должна лежать в (0, 1]; по умолчанию 0.80)
Вывод: ожидаемая наблюдаемая (ослабленная) корреляция, коэффициент ослабления и объяснение на понятном языке.
Почему это важно для планирования: если надёжность ваших мер составляет 0.70, истинная корреляция r = 0.50 проявится в данных примерно как r = 0.35. Это значит, что для её обнаружения потребуется больший объём выборки — анализ мощности следует проводить по ослабленной корреляции, а не по истинной. Этот инструмент помогает увидеть разрыв между ними.
Планирование длины шкалы (формула Спирмена–Брауна)
Оценивает, как добавление или удаление пунктов меняет надёжность шкалы.
Ввод:
- Текущая надёжность — строго между 0 и 1 (по умолчанию 0.70)
- Текущее число пунктов — не менее 1 (по умолчанию 10)
- Целевая надёжность — строго между 0 и 1 (по умолчанию 0.80)
Вывод: требуемое число пунктов, нужно ли их добавить или убрать (и сколько), а также таблица с прогнозируемой надёжностью при нескольких вариантах длины шкалы (половина, текущая, 1.5×, 2× и целевая). Целевая строка выделяется.
Убывающая отдача: удвоение числа пунктов в шкале из 10 с α = 0.70 поднимет надёжность примерно до 0.82 — хороший прирост. Но увеличение с 20 до 40 пунктов даст лишь рост с 0.82 до 0.90. Каждый дополнительный пункт вносит всё меньший вклад. В какой-то момент длинный опросник вызывает усталость у респондентов, что снижает качество данных. Ищите оптимальный баланс.
Планирование точности (ширина ДИ)
Определяет объём выборки исходя из требуемой точности оценки, а не из мощности критериев. Используется, когда цель — «оценить среднее с точностью ±2 балла», а не «обнаружить значимое различие».
Мощность и точность: анализ мощности отвечает на вопрос «смогу ли я обнаружить эффект?» Планирование точности — «смогу ли я точно оценить значение?» Они отвечают на разные вопросы и могут давать разный объём выборки. Если ваше исследование описательное (распространённость, средние баллы, сила корреляции), планирование точности — более подходящий инструмент.
Ввод точности
- Тип оценки — Среднее (по умолчанию), Доля или Корреляция
- Среднее: введите ожидаемое СО (по умолчанию 1.0 — из пилотного исследования или литературы)
- Доля: введите ожидаемую долю (по умолчанию 0.50 — наиболее консервативный вариант, дающий максимальную дисперсию)
- Корреляция: введите ожидаемую корреляцию (по умолчанию 0.30)
- Уровень доверия — 90%, 95% (по умолчанию) или 99%
- Желаемая погрешность — полуширина доверительного интервала (по умолчанию 0.50)
Вывод точности
После нажатия Вычислить объём выборки:
- Требуемый объём выборки
- Описание свойств полученного ДИ
- Таблица с требуемым N при шести значениях погрешности (0.5×, 0.75×, 1×, 1.25×, 1.5× и 2× от введённого значения). Введённое значение выделяется.
Зачем нужна таблица: уменьшение погрешности вдвое примерно учетверяет требуемый объём выборки. Таблица делает этот компромисс наглядным — возможно, погрешность ±0.75 окажется достаточной, тогда как ±0.50 потребует вчетверо больше участников.
Оптимизатор распределения по группам
Исследует, как неравный размер групп влияет на мощность при сравнении двух групп.
Ввод распределения
- Объёмы групп (n1, n2) — оба по умолчанию 50
- Размер эффекта (d Коэна) — по умолчанию 0.50
- Уровень значимости (α) — по умолчанию 0.05
Вывод распределения
После нажатия Вычислить мощность:
- Достигнутая мощность при заданном распределении
- Общее N и разбивка n1/n2
- При равных группах: примечание, подтверждающее оптимальность такого распределения
- При неравных группах: потеря мощности по сравнению с равным распределением в процентах
Таблица Мощность по соотношению групп сравнивает стандартные соотношения (1:1, 1:2, 2:1, 1:3, 3:1, 2:3, 3:2) при одном и том же общем N. Строка с равным распределением выделяется зелёным; текущее распределение — синим. Строки отсортированы по убыванию мощности.
Когда оправдано неравное распределение: равные группы всегда максимизируют статистическую мощность, но практические ограничения нередко делают равенство невозможным. В клинических исследованиях набрать пациентов с редкой патологией сложнее, чем здоровых участников контрольной группы. В педагогических исследованиях классы имеют фиксированный состав. Этот инструмент показывает, насколько именно падает мощность — как правило, меньше, чем кажется. Соотношение 2:1 при N = 90 (60 против 30) обычно теряет лишь 1–3% мощности по сравнению с 45 против 45.
Контрольный список для отчёта
Параметры анализа мощности и планирования исследования следует указывать в разделе Метод статьи, в идеале в подразделе «Определение объёма выборки» или «Анализ мощности».
Для анализа мощности укажите:
- Статистический критерий, для которого проводилось планирование (например, t-критерий для независимых выборок)
- Целевую мощность (например, 0.80)
- Уровень значимости (например, 0.05, одно- или двусторонний)
- Ожидаемый размер эффекта и его источник (предыдущие исследования, метаанализ, пилотное исследование — но не просто «средний по Коэну» без обоснования)
- Полученный требуемый объём выборки
- Учитывался ли отсев (например, «мы планировали набрать N = 80 с учётом ожидаемого 20% выбытия участников»)
Для поправки к уровню значимости укажите:
- Выбранный метод поправки и его обоснование (например, «Бенджамини–Хохберга для контроля частоты ложных открытий на уровне 5%»)
- Число сравнений в семействе
Для планирования точности укажите:
- Целевую погрешность и уровень доверия
- Ожидаемую изменчивость (СО, долю или корреляцию) и её источник
«Мы использовали средний размер эффекта по Коэну» — не является обоснованием. Рецензенты всё чаще ожидают содержательного объяснения: какой размер эффекта значим именно в вашем контексте? Обратитесь к предыдущим исследованиям, метаанализам или воспользуйтесь конвертером размеров эффекта для перевода между метриками. Если предыдущих данных нет, честно укажите это и приведите анализ чувствительности, показывающий мощность для диапазона правдоподобных размеров эффекта.
Воспроизводимость
Расчёты мощности используют пакет R pwr. R-код каждого расчёта выводится в консоль R. Не забудьте включить ссылку в список литературы:
Champely S (2023). pwr: Basic Functions for Power Analysis. R package version 1.3-0, https://doi.org/10.32614/CRAN.package.pwr.