На этой странице

Как загружается приложение
Загрузка данных
Импорт из таблиц с несколькими листами
Определение заголовков
Просмотр данных
Выбор переменных
Фильтрация наблюдений
Запуск анализа
Чтение результатов
Ссылки на источники
Экспорт результатов
Настройки
Сохранение работы
Следующие шаги

Начало работы

DataSuite 2 — статистическое приложение, которое работает полностью в браузере. Оно не требует установки, данные не покидают ваш компьютер, а все вычисления выполняются локально на встроенном движке R.

Будь то быстрая описательная сводка или конфирматорный факторный анализ, алгоритм работы один и тот же: загрузить данные, выбрать анализ, прочитать результаты. Эта страница проведёт вас по основным шагам.

Как загружается приложение

DataSuite загружает модули по мере необходимости — когда вы впервые открываете какой-либо анализ, его код загружается с сервера. Индикатор загрузки показывает прогресс для каждого файла. Если соединение прервётся или файл не удастся загрузить, приложение автоматически повторит попытку (до трёх раз с увеличивающимися интервалами). Если все попытки окажутся неудачными, рядом с каждым файлом появится кнопка Повторить, чтобы вы могли попробовать снова после восстановления соединения.

Работа без интернета: добавьте ?preload=all в адресную строку (например, https://.../?preload=all), чтобы загрузить все модули сразу. После завершения начальной загрузки приложение полностью работает офлайн. Обратите внимание: пакеты R, необходимые для конкретных анализов, в комплект предзагрузки не входят — если вы планируете использовать какой-либо анализ без интернета, запустите его хотя бы один раз или установите нужные пакеты вручную через консоль R с помощью ds_library(packageName).

Загрузка данных

Откройте раздел Загрузка и просмотр данных (он открывается по умолчанию). Нажмите Выбрать файл и укажите нужный файл.

Поддерживаемые форматы:

текст с разделителями — CSV, TSV, TXT
таблицы — XLS, XLSX, ODS
JSON — построчный, поколоночный формат или файл проекта DataSuite, восстанавливающий предыдущую сессию целиком (кроме результатов)

После импорта каждая переменная автоматически классифицируется как непрерывная или категориальная на основе содержимого. Если у Вас есть ординальные (ранговые) переменные - укажите их тип явным образом в соответствующем окне. По умолчанию все переменные включены в анализ.

Совет: если у вас есть сохранённый файл проекта DataSuite (.json), его загрузка восстановит всё, кроме результатов — типы переменных, фильтры, правила преобразований и настройки.

Импорт из таблиц с несколькими листами

При открытии файла XLSX или ODS с несколькими листами (или с одним листом и неоднозначными заголовками) появляется модальное окно импорта с предпросмотром, обновляющимся при изменении настроек. Файлы с одним листом и однозначными заголовками импортируются без модального окна.

Выбор листов: каждый лист указан с флажком и размерами. Можно выбрать один или несколько листов.

Стратегии объединения (при выборе нескольких листов):

Добавить строки — листы складываются вертикально. Столбцы сопоставляются по названию заголовка (без учёта регистра и пробелов). За основу берётся самый широкий лист.
Объединить столбцы — листы соединяются горизонтально. При разном количестве строк появляется предупреждение, поскольку выравнивание позиционное.

Сопоставление столбцов (появляется автоматически при добавлении строк с несовпадающими столбцами): для каждого несопоставленного столбца указан его исходный лист и выпадающий список с тремя вариантами:

Оставить как новый столбец — столбец включается в результат; в листах, где его нет, значения остаются пустыми
Исключить — столбец полностью удаляется
Объединить с другим столбцом — данные столбца переносятся в существующий столбец. Варианты объединения сгруппированы: «сопоставленные» (столбцы из основного листа) и «несопоставленные» (столбцы из других листов).

Группирующая переменная: при добавлении строк флажок позволяет добавить категориальный столбец, значения которого указывают, с какого листа пришла каждая строка. Имя столбца (по умолчанию: «Sheet») и метки для каждого листа настраиваются.

Определение заголовков

Приложение определяет количество строк заголовков, подсчитывая последовательные строковые значения от начала каждого столбца (пропуская пустые), исключая полностью категориальные столбцы и беря максимум. Многострочные заголовки объединяются через « > ». Определённое значение можно скорректировать через спиннер в окне импорта.

Объединённые ячейки: объединённые ячейки Excel/ODS заполняются автоматически — значение из верхней левой ячейки распространяется по всему диапазону объединения. Это сохраняет многострочные групповые заголовки (например, название опросника над несколькими столбцами субшкал) без перетекания в соседние столбцы.

Дублирующиеся имена столбцов: если после схлопывания несколько столбцов имеют одинаковый заголовок, к каждой группе добавляется счётчик — например, «Балл (1)», «Балл (2)». Столбцы с уникальными именами остаются без изменений.

Очистка пустых строк и столбцов: ведущие и завершающие пустые строки, а также полностью пустые столбцы автоматически удаляются при импорте. Это обрабатывает смещённые таблицы, случайные строки-разделители и грязные завершающие столбцы.

Просмотр данных

После загрузки данные отображаются в постраничной таблице. Можно выбрать отображение 10, 25, 50 или 100 строк на странице. Пропущенные значения показываются как «(пусто)» приглушённым шрифтом.

Выбор переменных

Нажмите кнопку Переменные в верхней панели. Если часть переменных исключена, кнопка показывает счётчик вида «5/12».

Модальное окно содержит две вкладки:

Выбор — нажимайте или зажимайте с перетаскиванием, чтобы указать, какие переменные участвуют в анализах. Кнопки «выбрать все», «снять все» и «инвертировать» позволяют быстро изменить выбор.
Типы переменных — задайте каждой переменной шкалу измерений: непрерывная, порядковая или категориальная. Щёлкните ячейку, чтобы изменить одну переменную, или перетащите по столбцу, чтобы задать сразу несколько.

Нужно ли управлять переменными? Во многих случаях — нет. Модули анализа автоматически используют подходящие переменные: например, для матрицы корреляций Пирсона берутся только непрерывные переменные. Исключать переменные вручную стоит лишь тогда, когда они мешают конкретному анализу — например, если нужно убрать столбец с идентификаторами из описательной статистики.

Если переменная содержит нечисловые данные, назначить ей числовой тип не получится — сначала нужно преобразовать значения.

Фильтрация наблюдений

Нажмите кнопку Наблюдения, чтобы открыть фильтр. Доступны два вида фильтров:

Категориальный — выберите, какие значения категориальной переменной оставить
Числовой — задайте условие, например «больше 50» или «от 10 до 20»

Несколько фильтров объединяются по логике И — строка должна соответствовать всем условиям одновременно. Фильтры записываются в файл проекта и сохраняются между сессиями.

Запуск анализа

Откройте выпадающее меню Меню в верхней панели и выберите нужный модуль:

Анализ распределений — критерии нормальности, таблицы частот, гистограммы, графики Q-Q и другие
Описательная статистика — средние, медианы, меры разброса и другие
Сравнительный анализ — t-критерий, дисперсионный анализ, критерий Манна–Уитни и другие
Корреляционный анализ — корреляции Пирсона, Спирмена, Кендалла и другие
Анализ надёжности — α Кронбаха, ω Макдональда, анализ пунктов и другие
Факторный анализ — разведочный факторный анализ, метод главных компонент
Подтверждающий факторный анализ — спецификация и оценка подгонки модели КФА
Кластерный анализ — k-средних, иерархический, бикластеризация и другие
Регрессионный анализ — линейная, логистическая, порядковая, мультиномиальная, регуляризованная регрессия и другие
Анализ времени до события — Каплан–Майер, Кокс, параметрические и конкурирующих рисков модели выживаемости
Анализ временных рядов — разведка, ARIMA / SARIMA, гонка прогнозов, периодограммы и точки разрыва
Планировщик анализа — расчёт объёма выборки и статистической мощности

У каждого модуля есть свои настройки. Общий принцип работы: выберите переменные, при необходимости скорректируйте параметры и нажмите кнопку расчёта. Результаты появятся в разделе вывода ниже.

Чтение результатов

Результаты накапливаются в разделе вывода в нижней части страницы. В левом нижнем углу экрана появляется плавающее оглавление, позволяющее перемещаться между результатами.

У каждой карточки результатов есть небольшая кнопка × (видна при наведении), чтобы её удалить. Чтобы удалить всё сразу, нажмите Очистить все результаты (кнопка появляется только при наличии результатов). Это сбрасывает раздел вывода, ссылки и оглавление в исходное состояние. Перед очисткой появляется запрос на подтверждение.

Ссылки на источники

Блок со ссылками появляется под результатами, когда какой-либо анализ использует пакет R. Он содержит цветной заголовок «Просим ссылаться на работы, использованные в вашем анализе» и два списка:

Основные ссылки — по одной ключевой публикации на каждый пакет
Дополнительные ссылки — вспомогательные методологические работы (отображаются только при наличии)

Ссылки накапливаются в течение сессии и не удаляются при удалении отдельных карточек результатов — они отражают все фактически использованные пакеты. Блок со ссылками также отображается в оглавлении для быстрой навигации.

Экспорт результатов

Таблицы и текст можно скопировать прямо из раздела вывода и вставить в свой документ. Имейте в виду, что большинство текстовых редакторов и программ для презентаций при вставке удаляют часть оформления (цвета, выделение значимости, границы таблиц) — содержимое и структура сохраняются, но визуальное форматирование может потребовать небольшой доработки.

Для более чистого экспорта нажмите Экспорт в DOCX в правом верхнем углу раздела вывода. Будет загружен документ Word со всеми текущими результатами — графиками, таблицами и форматированием, воспроизведёнными максимально точно. Рядом расположены кнопки группового экспорта для сохранения графиков в виде отдельных файлов в ZIP-архиве.

Настройки

Нажмите кнопку Настройки (иконка гаечного ключа) в верхней панели, чтобы задать параметры:

Знаки после запятой — сколько цифр отображать в результатах (0–10)
Уровень доверия — 90%, 95%, 99% или 99.9%
Отображение p-значений — точные значения, категории (например, «p < 0.05») или скрыть
Выделение значимости — полужирный шрифт, цветной текст или цветной фон для значимых результатов
Стиль таблиц — полные границы, стиль APA, без границ, горизонтальные линии или минимальный
Пропущенные данные — попарное исключение, полное исключение или импутация (среднее, медиана, мода, константа)
Язык — английский, русский или китайский

Изменения применяются немедленно ко всем существующим и будущим результатам.

Сохранение работы

В разделе Загрузка и просмотр данных используйте карточку Скачать, чтобы экспортировать данные. Формат по умолчанию — файл проекта DataSuite (.json), который сохраняет всё, кроме результатов: данные, типы переменных, фильтры, правила преобразований и настройки. Загрузите его позже, чтобы продолжить с того места, где остановились.

При необходимости данные можно экспортировать и в других форматах — CSV, Excel, ODS и других.

Следующие шаги

Узнайте, как изменять структуру и перекодировать данные, в разделе преобразование данных
Подсчитайте баллы по опросникам шаг за шагом по руководству по подсчёту баллов
Изучите отдельные модули анализа из списка выше
Воспользуйтесь консолью R, чтобы выполнить собственный код или посмотреть, что происходит «под капотом» у DataSuite
Настройте параметры в соответствии со своим стилем публикации

Начало работы #

Как загружается приложение #

Загрузка данных #

Импорт из таблиц с несколькими листами #

Определение заголовков #

Просмотр данных #

Выбор переменных #

Фильтрация наблюдений #

Запуск анализа #

Чтение результатов #

Ссылки на источники #

Экспорт результатов #

Настройки #

Сохранение работы #

Следующие шаги #