На этой странице

Начало работы

DataSuite 2 — статистическое приложение, которое работает полностью в браузере. Оно не требует установки, данные не покидают ваш компьютер, а все вычисления выполняются локально на встроенном движке R.

Будь то быстрая описательная сводка или конфирматорный факторный анализ, алгоритм работы один и тот же: загрузить данные, выбрать анализ, прочитать результаты. Эта страница проведёт вас по основным шагам.

Как загружается приложение

DataSuite загружает модули по мере необходимости — когда вы впервые открываете какой-либо анализ, его код загружается с сервера. Индикатор загрузки показывает прогресс для каждого файла. Если соединение прервётся или файл не удастся загрузить, приложение автоматически повторит попытку (до трёх раз с увеличивающимися интервалами). Если все попытки окажутся неудачными, рядом с каждым файлом появится кнопка Повторить, чтобы вы могли попробовать снова после восстановления соединения.

Работа без интернета: добавьте ?preload=all в адресную строку (например, https://.../?preload=all), чтобы загрузить все модули сразу. После завершения начальной загрузки приложение полностью работает офлайн. Обратите внимание: пакеты R, необходимые для конкретных анализов, в комплект предзагрузки не входят — если вы планируете использовать какой-либо анализ без интернета, запустите его хотя бы один раз или установите нужные пакеты вручную через консоль R с помощью ds_library(packageName).

Загрузка данных

Откройте раздел Загрузка и просмотр данных (он открывается по умолчанию). Нажмите Выбрать файл и укажите нужный файл.

Поддерживаемые форматы:

  • текст с разделителями — CSV, TSV, TXT
  • таблицы — XLS, XLSX, ODS
  • JSON — построчный, поколоночный формат или файл проекта DataSuite, восстанавливающий предыдущую сессию целиком (кроме результатов)

После импорта каждая переменная автоматически классифицируется как непрерывная или категориальная на основе содержимого. Если у Вас есть ординальные (ранговые) переменные - укажите их тип явным образом в соответствующем окне. По умолчанию все переменные включены в анализ.

Совет: если у вас есть сохранённый файл проекта DataSuite (.json), его загрузка восстановит всё, кроме результатов — типы переменных, фильтры, правила преобразований и настройки.

Импорт из таблиц с несколькими листами

При открытии файла XLSX или ODS с несколькими листами (или с одним листом и неоднозначными заголовками) появляется модальное окно импорта с предпросмотром, обновляющимся при изменении настроек. Файлы с одним листом и однозначными заголовками импортируются без модального окна.

Выбор листов: каждый лист указан с флажком и размерами. Можно выбрать один или несколько листов.

Стратегии объединения (при выборе нескольких листов):

  • Добавить строки — листы складываются вертикально. Столбцы сопоставляются по названию заголовка (без учёта регистра и пробелов). За основу берётся самый широкий лист.
  • Объединить столбцы — листы соединяются горизонтально. При разном количестве строк появляется предупреждение, поскольку выравнивание позиционное.

Сопоставление столбцов (появляется автоматически при добавлении строк с несовпадающими столбцами): для каждого несопоставленного столбца указан его исходный лист и выпадающий список с тремя вариантами:

  • Оставить как новый столбец — столбец включается в результат; в листах, где его нет, значения остаются пустыми
  • Исключить — столбец полностью удаляется
  • Объединить с другим столбцом — данные столбца переносятся в существующий столбец. Варианты объединения сгруппированы: «сопоставленные» (столбцы из основного листа) и «несопоставленные» (столбцы из других листов).

Группирующая переменная: при добавлении строк флажок позволяет добавить категориальный столбец, значения которого указывают, с какого листа пришла каждая строка. Имя столбца (по умолчанию: «Sheet») и метки для каждого листа настраиваются.

Определение заголовков

Приложение определяет количество строк заголовков, подсчитывая последовательные строковые значения от начала каждого столбца (пропуская пустые), исключая полностью категориальные столбцы и беря максимум. Многострочные заголовки объединяются через « > ». Определённое значение можно скорректировать через спиннер в окне импорта.

Объединённые ячейки: объединённые ячейки Excel/ODS заполняются автоматически — значение из верхней левой ячейки распространяется по всему диапазону объединения. Это сохраняет многострочные групповые заголовки (например, название опросника над несколькими столбцами субшкал) без перетекания в соседние столбцы.

Дублирующиеся имена столбцов: если после схлопывания несколько столбцов имеют одинаковый заголовок, к каждой группе добавляется счётчик — например, «Балл (1)», «Балл (2)». Столбцы с уникальными именами остаются без изменений.

Очистка пустых строк и столбцов: ведущие и завершающие пустые строки, а также полностью пустые столбцы автоматически удаляются при импорте. Это обрабатывает смещённые таблицы, случайные строки-разделители и грязные завершающие столбцы.

Просмотр данных

После загрузки данные отображаются в постраничной таблице. Можно выбрать отображение 10, 25, 50 или 100 строк на странице. Пропущенные значения показываются как «(пусто)» приглушённым шрифтом.

Выбор переменных

Нажмите кнопку Переменные в верхней панели. Если часть переменных исключена, кнопка показывает счётчик вида «5/12».

Модальное окно содержит две вкладки:

  • Выбор — нажимайте или зажимайте с перетаскиванием, чтобы указать, какие переменные участвуют в анализах. Кнопки «выбрать все», «снять все» и «инвертировать» позволяют быстро изменить выбор.
  • Типы переменных — задайте каждой переменной шкалу измерений: непрерывная, порядковая или категориальная. Щёлкните ячейку, чтобы изменить одну переменную, или перетащите по столбцу, чтобы задать сразу несколько.

Нужно ли управлять переменными? Во многих случаях — нет. Модули анализа автоматически используют подходящие переменные: например, для матрицы корреляций Пирсона берутся только непрерывные переменные. Исключать переменные вручную стоит лишь тогда, когда они мешают конкретному анализу — например, если нужно убрать столбец с идентификаторами из описательной статистики.

Если переменная содержит нечисловые данные, назначить ей числовой тип не получится — сначала нужно преобразовать значения.

Фильтрация наблюдений

Нажмите кнопку Наблюдения, чтобы открыть фильтр. Доступны два вида фильтров:

  • Категориальный — выберите, какие значения категориальной переменной оставить
  • Числовой — задайте условие, например «больше 50» или «от 10 до 20»

Несколько фильтров объединяются по логике И — строка должна соответствовать всем условиям одновременно. Фильтры записываются в файл проекта и сохраняются между сессиями.

Запуск анализа

Откройте выпадающее меню Меню в верхней панели и выберите нужный модуль:

У каждого модуля есть свои настройки. Общий принцип работы: выберите переменные, при необходимости скорректируйте параметры и нажмите кнопку расчёта. Результаты появятся в разделе вывода ниже.

Чтение результатов

Результаты накапливаются в разделе вывода в нижней части страницы. В левом нижнем углу экрана появляется плавающее оглавление, позволяющее перемещаться между результатами.

У каждой карточки результатов есть небольшая кнопка × (видна при наведении), чтобы её удалить. Чтобы удалить всё сразу, нажмите Очистить все результаты (кнопка появляется только при наличии результатов). Это сбрасывает раздел вывода, ссылки и оглавление в исходное состояние. Перед очисткой появляется запрос на подтверждение.

Ссылки на источники

Блок со ссылками появляется под результатами, когда какой-либо анализ использует пакет R. Он содержит цветной заголовок «Просим ссылаться на работы, использованные в вашем анализе» и два списка:

  • Основные ссылки — по одной ключевой публикации на каждый пакет
  • Дополнительные ссылки — вспомогательные методологические работы (отображаются только при наличии)

Ссылки накапливаются в течение сессии и не удаляются при удалении отдельных карточек результатов — они отражают все фактически использованные пакеты. Блок со ссылками также отображается в оглавлении для быстрой навигации.

Экспорт результатов

Таблицы и текст можно скопировать прямо из раздела вывода и вставить в свой документ. Имейте в виду, что большинство текстовых редакторов и программ для презентаций при вставке удаляют часть оформления (цвета, выделение значимости, границы таблиц) — содержимое и структура сохраняются, но визуальное форматирование может потребовать небольшой доработки.

Для более чистого экспорта нажмите Экспорт в DOCX в правом верхнем углу раздела вывода. Будет загружен документ Word со всеми текущими результатами — графиками, таблицами и форматированием, воспроизведёнными максимально точно. Рядом расположены кнопки группового экспорта для сохранения графиков в виде отдельных файлов в ZIP-архиве.

Настройки

Нажмите кнопку Настройки (иконка гаечного ключа) в верхней панели, чтобы задать параметры:

  • Знаки после запятой — сколько цифр отображать в результатах (0–10)
  • Уровень доверия — 90%, 95%, 99% или 99.9%
  • Отображение p-значений — точные значения, категории (например, «p < 0.05») или скрыть
  • Выделение значимости — полужирный шрифт, цветной текст или цветной фон для значимых результатов
  • Стиль таблиц — полные границы, стиль APA, без границ, горизонтальные линии или минимальный
  • Пропущенные данные — попарное исключение, полное исключение или импутация (среднее, медиана, мода, константа)
  • Язык — английский, русский или китайский

Изменения применяются немедленно ко всем существующим и будущим результатам.

Сохранение работы

В разделе Загрузка и просмотр данных используйте карточку Скачать, чтобы экспортировать данные. Формат по умолчанию — файл проекта DataSuite (.json), который сохраняет всё, кроме результатов: данные, типы переменных, фильтры, правила преобразований и настройки. Загрузите его позже, чтобы продолжить с того места, где остановились.

При необходимости данные можно экспортировать и в других форматах — CSV, Excel, ODS и других.

Следующие шаги

  • Узнайте, как изменять структуру и перекодировать данные, в разделе преобразование данных
  • Подсчитайте баллы по опросникам шаг за шагом по руководству по подсчёту баллов
  • Изучите отдельные модули анализа из списка выше
  • Воспользуйтесь консолью R, чтобы выполнить собственный код или посмотреть, что происходит «под капотом» у DataSuite
  • Настройте параметры в соответствии со своим стилем публикации