На этой странице
Начало работы
DataSuite 2 — статистическое приложение, которое работает полностью в браузере. Оно не требует установки, данные не покидают ваш компьютер, а все вычисления выполняются локально на встроенном движке R.
Будь то быстрая описательная сводка или конфирматорный факторный анализ, алгоритм работы один и тот же: загрузить данные, выбрать анализ, прочитать результаты. Эта страница проведёт вас по основным шагам.
Как загружается приложение
DataSuite загружает модули по мере необходимости — когда вы впервые открываете какой-либо анализ, его код загружается с сервера. Индикатор загрузки показывает прогресс для каждого файла. Если соединение прервётся или файл не удастся загрузить, приложение автоматически повторит попытку (до трёх раз с увеличивающимися интервалами). Если все попытки окажутся неудачными, рядом с каждым файлом появится кнопка Повторить, чтобы вы могли попробовать снова после восстановления соединения.
Работа без интернета: добавьте
?preload=allв адресную строку (например,https://.../?preload=all), чтобы загрузить все модули сразу. После завершения начальной загрузки приложение полностью работает офлайн. Обратите внимание: пакеты R, необходимые для конкретных анализов, в комплект предзагрузки не входят — если вы планируете использовать какой-либо анализ без интернета, запустите его хотя бы один раз или установите нужные пакеты вручную через консоль R с помощьюds_library(packageName).
Загрузка данных
Откройте раздел Загрузка и просмотр данных (он открывается по умолчанию). Нажмите Выбрать файл и укажите нужный файл.
Поддерживаемые форматы:
- текст с разделителями — CSV, TSV, TXT
- таблицы — XLS, XLSX, ODS
- JSON — построчный, поколоночный формат или файл проекта DataSuite, восстанавливающий предыдущую сессию целиком (кроме результатов)
После импорта каждая переменная автоматически классифицируется как непрерывная или категориальная на основе содержимого. Если у Вас есть ординальные (ранговые) переменные - укажите их тип явным образом в соответствующем окне. По умолчанию все переменные включены в анализ.
Совет: если у вас есть сохранённый файл проекта DataSuite (.json), его загрузка восстановит всё, кроме результатов — типы переменных, фильтры, правила преобразований и настройки.
Импорт из таблиц с несколькими листами
При открытии файла XLSX или ODS с несколькими листами (или с одним листом и неоднозначными заголовками) появляется модальное окно импорта с предпросмотром, обновляющимся при изменении настроек. Файлы с одним листом и однозначными заголовками импортируются без модального окна.
Выбор листов: каждый лист указан с флажком и размерами. Можно выбрать один или несколько листов.
Стратегии объединения (при выборе нескольких листов):
- Добавить строки — листы складываются вертикально. Столбцы сопоставляются по названию заголовка (без учёта регистра и пробелов). За основу берётся самый широкий лист.
- Объединить столбцы — листы соединяются горизонтально. При разном количестве строк появляется предупреждение, поскольку выравнивание позиционное.
Сопоставление столбцов (появляется автоматически при добавлении строк с несовпадающими столбцами): для каждого несопоставленного столбца указан его исходный лист и выпадающий список с тремя вариантами:
- Оставить как новый столбец — столбец включается в результат; в листах, где его нет, значения остаются пустыми
- Исключить — столбец полностью удаляется
- Объединить с другим столбцом — данные столбца переносятся в существующий столбец. Варианты объединения сгруппированы: «сопоставленные» (столбцы из основного листа) и «несопоставленные» (столбцы из других листов).
Группирующая переменная: при добавлении строк флажок позволяет добавить категориальный столбец, значения которого указывают, с какого листа пришла каждая строка. Имя столбца (по умолчанию: «Sheet») и метки для каждого листа настраиваются.
Определение заголовков
Приложение определяет количество строк заголовков, подсчитывая последовательные строковые значения от начала каждого столбца (пропуская пустые), исключая полностью категориальные столбцы и беря максимум. Многострочные заголовки объединяются через « > ». Определённое значение можно скорректировать через спиннер в окне импорта.
Объединённые ячейки: объединённые ячейки Excel/ODS заполняются автоматически — значение из верхней левой ячейки распространяется по всему диапазону объединения. Это сохраняет многострочные групповые заголовки (например, название опросника над несколькими столбцами субшкал) без перетекания в соседние столбцы.
Дублирующиеся имена столбцов: если после схлопывания несколько столбцов имеют одинаковый заголовок, к каждой группе добавляется счётчик — например, «Балл (1)», «Балл (2)». Столбцы с уникальными именами остаются без изменений.
Очистка пустых строк и столбцов: ведущие и завершающие пустые строки, а также полностью пустые столбцы автоматически удаляются при импорте. Это обрабатывает смещённые таблицы, случайные строки-разделители и грязные завершающие столбцы.
Просмотр данных
После загрузки данные отображаются в постраничной таблице. Можно выбрать отображение 10, 25, 50 или 100 строк на странице. Пропущенные значения показываются как «(пусто)» приглушённым шрифтом.
Выбор переменных
Нажмите кнопку Переменные в верхней панели. Если часть переменных исключена, кнопка показывает счётчик вида «5/12».
Модальное окно содержит две вкладки:
- Выбор — нажимайте или зажимайте с перетаскиванием, чтобы указать, какие переменные участвуют в анализах. Кнопки «выбрать все», «снять все» и «инвертировать» позволяют быстро изменить выбор.
- Типы переменных — задайте каждой переменной шкалу измерений: непрерывная, порядковая или категориальная. Щёлкните ячейку, чтобы изменить одну переменную, или перетащите по столбцу, чтобы задать сразу несколько.
Нужно ли управлять переменными? Во многих случаях — нет. Модули анализа автоматически используют подходящие переменные: например, для матрицы корреляций Пирсона берутся только непрерывные переменные. Исключать переменные вручную стоит лишь тогда, когда они мешают конкретному анализу — например, если нужно убрать столбец с идентификаторами из описательной статистики.
Если переменная содержит нечисловые данные, назначить ей числовой тип не получится — сначала нужно преобразовать значения.
Фильтрация наблюдений
Нажмите кнопку Наблюдения, чтобы открыть фильтр. Доступны два вида фильтров:
- Категориальный — выберите, какие значения категориальной переменной оставить
- Числовой — задайте условие, например «больше 50» или «от 10 до 20»
Несколько фильтров объединяются по логике И — строка должна соответствовать всем условиям одновременно. Фильтры записываются в файл проекта и сохраняются между сессиями.
Запуск анализа
Откройте выпадающее меню Меню в верхней панели и выберите нужный модуль:
- Анализ распределений — критерии нормальности, таблицы частот, гистограммы, графики Q-Q и другие
- Описательная статистика — средние, медианы, меры разброса и другие
- Сравнительный анализ — t-критерий, дисперсионный анализ, критерий Манна–Уитни и другие
- Корреляционный анализ — корреляции Пирсона, Спирмена, Кендалла и другие
- Анализ надёжности — α Кронбаха, ω Макдональда, анализ пунктов и другие
- Факторный анализ — разведочный факторный анализ, метод главных компонент
- Подтверждающий факторный анализ — спецификация и оценка подгонки модели КФА
- Кластерный анализ — k-средних, иерархический, бикластеризация и другие
- Регрессионный анализ — линейная, логистическая, порядковая, мультиномиальная, регуляризованная регрессия и другие
- Анализ времени до события — Каплан–Майер, Кокс, параметрические и конкурирующих рисков модели выживаемости
- Анализ временных рядов — разведка, ARIMA / SARIMA, гонка прогнозов, периодограммы и точки разрыва
- Планировщик анализа — расчёт объёма выборки и статистической мощности
У каждого модуля есть свои настройки. Общий принцип работы: выберите переменные, при необходимости скорректируйте параметры и нажмите кнопку расчёта. Результаты появятся в разделе вывода ниже.
Чтение результатов
Результаты накапливаются в разделе вывода в нижней части страницы. В левом нижнем углу экрана появляется плавающее оглавление, позволяющее перемещаться между результатами.
У каждой карточки результатов есть небольшая кнопка × (видна при наведении), чтобы её удалить. Чтобы удалить всё сразу, нажмите Очистить все результаты (кнопка появляется только при наличии результатов). Это сбрасывает раздел вывода, ссылки и оглавление в исходное состояние. Перед очисткой появляется запрос на подтверждение.
Ссылки на источники
Блок со ссылками появляется под результатами, когда какой-либо анализ использует пакет R. Он содержит цветной заголовок «Просим ссылаться на работы, использованные в вашем анализе» и два списка:
- Основные ссылки — по одной ключевой публикации на каждый пакет
- Дополнительные ссылки — вспомогательные методологические работы (отображаются только при наличии)
Ссылки накапливаются в течение сессии и не удаляются при удалении отдельных карточек результатов — они отражают все фактически использованные пакеты. Блок со ссылками также отображается в оглавлении для быстрой навигации.
Экспорт результатов
Таблицы и текст можно скопировать прямо из раздела вывода и вставить в свой документ. Имейте в виду, что большинство текстовых редакторов и программ для презентаций при вставке удаляют часть оформления (цвета, выделение значимости, границы таблиц) — содержимое и структура сохраняются, но визуальное форматирование может потребовать небольшой доработки.
Для более чистого экспорта нажмите Экспорт в DOCX в правом верхнем углу раздела вывода. Будет загружен документ Word со всеми текущими результатами — графиками, таблицами и форматированием, воспроизведёнными максимально точно. Рядом расположены кнопки группового экспорта для сохранения графиков в виде отдельных файлов в ZIP-архиве.
Настройки
Нажмите кнопку Настройки (иконка гаечного ключа) в верхней панели, чтобы задать параметры:
- Знаки после запятой — сколько цифр отображать в результатах (0–10)
- Уровень доверия — 90%, 95%, 99% или 99.9%
- Отображение p-значений — точные значения, категории (например, «p < 0.05») или скрыть
- Выделение значимости — полужирный шрифт, цветной текст или цветной фон для значимых результатов
- Стиль таблиц — полные границы, стиль APA, без границ, горизонтальные линии или минимальный
- Пропущенные данные — попарное исключение, полное исключение или импутация (среднее, медиана, мода, константа)
- Язык — английский, русский или китайский
Изменения применяются немедленно ко всем существующим и будущим результатам.
Сохранение работы
В разделе Загрузка и просмотр данных используйте карточку Скачать, чтобы экспортировать данные. Формат по умолчанию — файл проекта DataSuite (.json), который сохраняет всё, кроме результатов: данные, типы переменных, фильтры, правила преобразований и настройки. Загрузите его позже, чтобы продолжить с того места, где остановились.
При необходимости данные можно экспортировать и в других форматах — CSV, Excel, ODS и других.
Следующие шаги
- Узнайте, как изменять структуру и перекодировать данные, в разделе преобразование данных
- Подсчитайте баллы по опросникам шаг за шагом по руководству по подсчёту баллов
- Изучите отдельные модули анализа из списка выше
- Воспользуйтесь консолью R, чтобы выполнить собственный код или посмотреть, что происходит «под капотом» у DataSuite
- Настройте параметры в соответствии со своим стилем публикации