На этой странице

Преобразование данных

Раздел Преобразование данных позволяет изменять данные с помощью системы правил. Правила задаются один раз, применяются в заданном порядке и в любой момент могут быть отредактированы или удалены. Исходные данные всегда сохраняются — преобразования создают новую рабочую копию.

Практическое руководство по подсчёту баллов по опросникам (перекодирование, инвертирование пунктов, вычисление шкал) см. в руководстве по подсчёту баллов.

Редактор правил

Нажмите одну из пяти кнопок в верхней части раздела, чтобы создать правило. Откроется редактор из трёх панелей:

  • Левая панель — выбор входных переменных (нажатием или перетаскиванием для множественного выбора)
  • Центральная панель — настройка преобразования
  • Правая панель — выбор того, куда записывать результаты

Задайте каждому правилу название (обязательно) и при желании описание, затем нажмите Сохранить правило. Преобразование применяется немедленно.

Типы правил

Перекодирование значений

Заменяет конкретные значения на новые. При выборе входных переменных DataSuite сканирует данные и автоматически заполняет столбец Исходное значение всеми уникальными значениями. Заполните столбец Новое значение для каждой строки. При необходимости можно добавлять строки вручную. Значения, не указанные в таблице соответствий, остаются без изменений.

Перекодирование диапазонов

Сопоставляет числовые диапазоны с выходными значениями. Каждая строка задаёт Минимум, Максимум и Результат. Обе границы включительны — значение, попадающее в диапазон, получает соответствующий результат. Значения за пределами всех заданных диапазонов остаются без изменений.

Формула

Математическое выражение, вычисляемое построчно. Выбранные входные переменные обозначаются как v1, v2, v3 и т. д. — метки-ссылки отображаются рядом с каждой переменной на левой панели.

(v1 + v2) / 2

Синтаксис диапазона v1:v7 раскрывается во все переменные этого промежутка, что удобно при использовании агрегирующих функций:

sum(v1:v7) / 7

Доступны три специальных переменных:

  • i — номер текущей строки (начиная с 1)
  • v — текущее значение обрабатываемой переменной (при замене на месте)
  • c — полный массив значений текущей переменной

Многопеременные формулы позволяют создать сразу несколько новых переменных в одном правиле с помощью объявлений @:

@Итог = v1 + v2 + v3
@Среднее = @Итог / 3
@Центр = @Среднее - mean(c)

Каждая строка создаёт (или перезаписывает) переменную. В последующих строках можно ссылаться на переменные, объявленные выше. Редактор показывает, будет ли результат новой переменной или заменит существующую.

Редактор формул обеспечивает подсветку синтаксиса, подсветку парных скобок и автодополнение — начните вводить имя переменной или функции, и появится список предложений (нажмите Ctrl+Space, чтобы открыть его вручную). Синтаксические ошибки подчёркиваются по мере ввода.

Полный список операторов и функций см. в справочнике формул.

Замена по регулярному выражению

Применяет поиск и замену по регулярному выражению к текстовым данным в каждой ячейке отдельно. Задаётся шаблон поиска и строка замены (с поддержкой $1, $2 и т. д. для захваченных групп).

Параметры:

  • Глобальный — заменять все совпадения, а не только первое
  • С учётом регистра
  • Многострочный режим

Интерактивный предпросмотр показывает первое совпадающее значение с подсветкой совпадений и захваченными группами в разных цветах.

Подробнее о синтаксисе шаблонов см. в справочнике регулярных выражений.

Стандартизация

Преобразует числовые значения к стандартизированной шкале:

  • Z-оценка — приводит к среднему = 0 и стандартному отклонению = 1
  • Масштабирование мин-макс — приводит к диапазону 0–1

Пропущенные значения остаются пропущенными. Если все значения одинаковы, z-оценка возвращает 0, а масштабирование мин-макс — 0.5.

Параметры вывода

Для каждого правила (кроме многопеременных формул) доступны три режима вывода:

  • Заменить исходные значения — изменяет входные переменные
  • Заменить другую переменную — записывает результаты в другую существующую переменную (количество входных и выходных переменных должно совпадать)
  • Создать новые переменные — задайте название новой переменной; при выборе нескольких входных переменных каждая получает свою выходную переменную с базовым именем в качестве префикса

Управление правилами

Сохранённые правила отображаются в списке Правила преобразований со следующими сведениями:

  • цветная метка типа правила
  • название и описание правила
  • количество переменных, к которым применяется правило
  • кнопки Редактировать и Удалить

Правила применяются в порядке их расположения в списке. При редактировании правило открывается в редакторе с текущими настройками. Удаление правила (после подтверждения) также удаляет все созданные им переменные.

Библиотека правил

Библиотека правил хранит правила преобразований в браузере постоянно, независимо от загруженного файла данных. Это позволяет повторно использовать правила в разных проектах и сессиях.

Примечание: правила библиотеки хранятся локально в базе данных браузера. Если вы планируете перейти на другой компьютер или браузер, используйте функцию импорта и экспорта для их переноса.

Нажмите Библиотека правил в разделе преобразований, чтобы открыть модальное окно с двумя панелями:

  • Левая панель (правила файла) — правила текущего проекта
  • Правая панель (библиотека) — правила, сохранённые в постоянном хранилище браузера

Рядом с каждым правилом отображается галочка, если аналогичное правило уже есть на другой панели (сравнение происходит по содержимому, а не по названию).

Перемещение правил

  • Отправить в библиотеку — выберите правила на левой панели и добавьте их в постоянное хранилище
  • Загрузить в файл — выберите правила из библиотеки и добавьте их в текущий проект (применяются немедленно)

Если правило с таким же названием, но другим содержимым уже существует, диалог разрешения конфликта предложит перезаписать, сохранить оба (с числовым суффиксом), пропустить или отменить.

Импорт и экспорт

  • Импорт — загрузить правила из JSON-файла, ранее экспортированного из DataSuite
  • Экспорт — скачать выбранные правила библиотеки в виде JSON-файла для передачи другим пользователям

Конвертер таблиц

Конвертер таблиц преобразует данные из широкого формата в длинный — как правило, это необходимо, когда повторные измерения хранятся в отдельных столбцах и их нужно объединить для анализа (например, для критериев повторных измерений).

Настройка

  • Порядок группировки — источником служат столбцы, сгруппированные по условию (все переменные для условия 1, затем условия 2 и т. д.) или по переменной (рядом расположены все условия одной переменной)
  • Количество условий — сколько повторных измерений у каждой переменной (от 2 до 20)
  • Метки условий — название каждого условия (например, «До», «После»). DataSuite пытается определить их автоматически по именам переменных.
  • Идентификатор испытуемого — автоматически сгенерировать номера строк или использовать существующий столбец
  • Название столбца условий — название нового столбца с метками условий (по умолчанию: «Замер»)
  • Переменные для преобразования — выберите нажатием или перетаскиванием, какие переменные нужно преобразовать. При несоответствии количества переменных числу условий появится предупреждение.

Интерактивный предпросмотр справа обновляется по мере изменения настроек и показывает первые и последние строки результата.

Примечание: применение конвертера таблиц заменяет текущий набор данных. Исходные данные не сохраняются — перед применением сохраните файл проекта, если хотите их сберечь.