На этой странице
Преобразование данных
Раздел Преобразование данных позволяет изменять данные с помощью системы правил. Правила задаются один раз, применяются в заданном порядке и в любой момент могут быть отредактированы или удалены. Исходные данные всегда сохраняются — преобразования создают новую рабочую копию.
Практическое руководство по подсчёту баллов по опросникам (перекодирование, инвертирование пунктов, вычисление шкал) см. в руководстве по подсчёту баллов.
Редактор правил
Нажмите одну из пяти кнопок в верхней части раздела, чтобы создать правило. Откроется редактор из трёх панелей:
- Левая панель — выбор входных переменных (нажатием или перетаскиванием для множественного выбора)
- Центральная панель — настройка преобразования
- Правая панель — выбор того, куда записывать результаты
Задайте каждому правилу название (обязательно) и при желании описание, затем нажмите Сохранить правило. Преобразование применяется немедленно.
Типы правил
Перекодирование значений
Заменяет конкретные значения на новые. При выборе входных переменных DataSuite сканирует данные и автоматически заполняет столбец Исходное значение всеми уникальными значениями. Заполните столбец Новое значение для каждой строки. При необходимости можно добавлять строки вручную. Значения, не указанные в таблице соответствий, остаются без изменений.
Перекодирование диапазонов
Сопоставляет числовые диапазоны с выходными значениями. Каждая строка задаёт Минимум, Максимум и Результат. Обе границы включительны — значение, попадающее в диапазон, получает соответствующий результат. Значения за пределами всех заданных диапазонов остаются без изменений.
Формула
Математическое выражение, вычисляемое построчно. Выбранные входные переменные обозначаются как v1, v2, v3 и т. д. — метки-ссылки отображаются рядом с каждой переменной на левой панели.
(v1 + v2) / 2
Синтаксис диапазона v1:v7 раскрывается во все переменные этого промежутка, что удобно при использовании агрегирующих функций:
sum(v1:v7) / 7
Доступны три специальных переменных:
i— номер текущей строки (начиная с 1)v— текущее значение обрабатываемой переменной (при замене на месте)c— полный массив значений текущей переменной
Многопеременные формулы позволяют создать сразу несколько новых переменных в одном правиле с помощью объявлений @:
@Итог = v1 + v2 + v3
@Среднее = @Итог / 3
@Центр = @Среднее - mean(c)
Каждая строка создаёт (или перезаписывает) переменную. В последующих строках можно ссылаться на переменные, объявленные выше. Редактор показывает, будет ли результат новой переменной или заменит существующую.
Редактор формул обеспечивает подсветку синтаксиса, подсветку парных скобок и автодополнение — начните вводить имя переменной или функции, и появится список предложений (нажмите Ctrl+Space, чтобы открыть его вручную). Синтаксические ошибки подчёркиваются по мере ввода.
Полный список операторов и функций см. в справочнике формул.
Замена по регулярному выражению
Применяет поиск и замену по регулярному выражению к текстовым данным в каждой ячейке отдельно. Задаётся шаблон поиска и строка замены (с поддержкой $1, $2 и т. д. для захваченных групп).
Параметры:
- Глобальный — заменять все совпадения, а не только первое
- С учётом регистра
- Многострочный режим
Интерактивный предпросмотр показывает первое совпадающее значение с подсветкой совпадений и захваченными группами в разных цветах.
Подробнее о синтаксисе шаблонов см. в справочнике регулярных выражений.
Стандартизация
Преобразует числовые значения к стандартизированной шкале:
- Z-оценка — приводит к среднему = 0 и стандартному отклонению = 1
- Масштабирование мин-макс — приводит к диапазону 0–1
Пропущенные значения остаются пропущенными. Если все значения одинаковы, z-оценка возвращает 0, а масштабирование мин-макс — 0.5.
Параметры вывода
Для каждого правила (кроме многопеременных формул) доступны три режима вывода:
- Заменить исходные значения — изменяет входные переменные
- Заменить другую переменную — записывает результаты в другую существующую переменную (количество входных и выходных переменных должно совпадать)
- Создать новые переменные — задайте название новой переменной; при выборе нескольких входных переменных каждая получает свою выходную переменную с базовым именем в качестве префикса
Управление правилами
Сохранённые правила отображаются в списке Правила преобразований со следующими сведениями:
- цветная метка типа правила
- название и описание правила
- количество переменных, к которым применяется правило
- кнопки Редактировать и Удалить
Правила применяются в порядке их расположения в списке. При редактировании правило открывается в редакторе с текущими настройками. Удаление правила (после подтверждения) также удаляет все созданные им переменные.
Библиотека правил
Библиотека правил хранит правила преобразований в браузере постоянно, независимо от загруженного файла данных. Это позволяет повторно использовать правила в разных проектах и сессиях.
Примечание: правила библиотеки хранятся локально в базе данных браузера. Если вы планируете перейти на другой компьютер или браузер, используйте функцию импорта и экспорта для их переноса.
Нажмите Библиотека правил в разделе преобразований, чтобы открыть модальное окно с двумя панелями:
- Левая панель (правила файла) — правила текущего проекта
- Правая панель (библиотека) — правила, сохранённые в постоянном хранилище браузера
Рядом с каждым правилом отображается галочка, если аналогичное правило уже есть на другой панели (сравнение происходит по содержимому, а не по названию).
Перемещение правил
- Отправить в библиотеку — выберите правила на левой панели и добавьте их в постоянное хранилище
- Загрузить в файл — выберите правила из библиотеки и добавьте их в текущий проект (применяются немедленно)
Если правило с таким же названием, но другим содержимым уже существует, диалог разрешения конфликта предложит перезаписать, сохранить оба (с числовым суффиксом), пропустить или отменить.
Импорт и экспорт
- Импорт — загрузить правила из JSON-файла, ранее экспортированного из DataSuite
- Экспорт — скачать выбранные правила библиотеки в виде JSON-файла для передачи другим пользователям
Конвертер таблиц
Конвертер таблиц преобразует данные из широкого формата в длинный — как правило, это необходимо, когда повторные измерения хранятся в отдельных столбцах и их нужно объединить для анализа (например, для критериев повторных измерений).
Настройка
- Порядок группировки — источником служат столбцы, сгруппированные по условию (все переменные для условия 1, затем условия 2 и т. д.) или по переменной (рядом расположены все условия одной переменной)
- Количество условий — сколько повторных измерений у каждой переменной (от 2 до 20)
- Метки условий — название каждого условия (например, «До», «После»). DataSuite пытается определить их автоматически по именам переменных.
- Идентификатор испытуемого — автоматически сгенерировать номера строк или использовать существующий столбец
- Название столбца условий — название нового столбца с метками условий (по умолчанию: «Замер»)
- Переменные для преобразования — выберите нажатием или перетаскиванием, какие переменные нужно преобразовать. При несоответствии количества переменных числу условий появится предупреждение.
Интерактивный предпросмотр справа обновляется по мере изменения настроек и показывает первые и последние строки результата.
Примечание: применение конвертера таблиц заменяет текущий набор данных. Исходные данные не сохраняются — перед применением сохраните файл проекта, если хотите их сберечь.