ДЕНЬ 07
Основные виды визуализации данных:
Линейный график, график с заливкой, комбинированные
СЕГОДНЯ

Продолжим изучение теоретических основ визуализации данных и рассмотрим визуальные атрибуты, которые распознаются нашим мозгом подсознательно. Ключевой темой сегодня будет построение линейных графиков и линейных графиков с заливкой. Мы также попробуем скомбинировать навыки прошлого дня и построить комбо-графики с двумя осями, чтобы отображать сразу несколько значений. На полке сегодня две работы Кайро по мировым дата проектам. Как минимум всем посмотреть, а лучше пару раз.

Разбираемся
В способах показа данных во времени
Визуальные атрибуты
Теоретические основы визуализации данных
Зрение – это единственный канал восприятия человека, который обрабатывает максимально возможное количество информации подсознательно. Пока мы смотрим на что-то, наш мозг быстро просчитывает огромное количество вводных параметров и возвращает нам результат. Поэтому, большую часть времени мы не осмысливаем то, что видим, а как будто бы сразу уже знаем что перед нами находится.

Наша зрительная система устроена так, что везде ищет закономерности, так как это упрощает процесс восприятия окружающего мира.

Свет, попадая в наши глаза, стимулирует сетчатку, которая посылает импульсы в очень краткосрочную, так называемую графическую, или иконическую, память. Графическая память считывает выделяющиеся характеристики объектов и создает первичный образ того, что мы видим.

Этот же вид памяти используется нашим когнитивным процессом при считывании графической информации на графиках и диаграммах.
Pre-attentive attributes
Были выделены так называемые pre-attentive attributes, то есть характеристики и свойства объектов, которые наш мозг улавливает еще до "включения" сознания. Это, своего рода, набор визуальных подсказок для мозга, который определяет куда обратить внимание. Благодаря этим атрибутам, мы можем быстро считывать информацию.

Ваши глаза притягивают внимание к таким контрастам, как изменение размера или формы, смена насыщенности цвета, увеличение ширины или длины, а мозг как бы спрашивает: «почему эта штука выделяется на фоне других? Что она пытается мне сказать?»

Визуальные атрибуты помогают кодировать данные максимально эффективно, так как используют ключевые принципы нашего процесса восприятия. Можно заметить, что визуальное представление диаграмм в каком-то роде основывается на визуальных атрибутах. Например, для кодирования данных, барчарт использует длину линии, точечная диаграмма – положение в пространстве, а пузырьковая диаграмма – размер. Мы понимаем, что первая величина на диаграмме больше, чем вторая, потому что высота двух линий, или размер двух точек, различается. При этом, дополняя диаграммы акцентными цветами или, например выделением нужных областей, мы увеличиваем понимание и мгновенное "считывание" данных с визуализаций.
Таким образом, каждый визуальный атрибут обладает каким-то свойством, которое выделяет одни элементы среди других. Будь то ширина линии, или ее цвет или форма. Такие свойства заставляют отдельные элементы бросаться в глаза и выскакивать на передний план на фоне всех других однородных элементов.
Используйте эти знания при работе со свойствами диаграмм и планировании вашего способа визуализации данных.
Графики для показа данных во времени
Линейный график
Изменение во времени
Что это такое
Линейный график – самый базовый способ для показа изменения величины во времени: трендов, прогнозов и динамики. На линейных графиках может быть как одна, так и несколько линий, отображающих разные показатели или наборы данных.

Линейные графики чаще всего используют именно для показа данных во времени. Нам привычно воспринимать непрерывную линию, как что-то связанное со временем. Линия – соединяет отдельные значения данных и обычно показывает изменение или тренд. Линия усиливает акцент на видимых изменениях, отклонениях, минимумах и максимумах.

Бары, наоборот, создают акцент на индивидуальных значениях (на каждый год), нежели на их изменение во времени. Общий тренд будет не так очевиден при большом количестве значений, из-за внешнего вида баров, которые визуально отделяют значения друг от друга.
Линии и бары для показа данных во времени
Более того, на линейных графиках проще увидеть отклонения или изменение позиций между несколькими показателями. Пошаговое сравнение нескольких показателей в барах затрудняет понимание: зрителю приходиться проводить в 2 раза больше когнитивных действий. На примере справа, наши глаза сначала сравнивают два бара между собой за один месяц, а потом уже смотрят на общий тренд за год. На примере слева, эта же картинка становится очевидной и ясной.

Именно такие вещи должны быть целью визуализации. Не просто показать данные, а донести тот инсайт, который вы увидели в данных. При этом, донести свой инсайт и вывод так, чтобы это стало максимально очевидно для зрителей.
// by Cole Nussbaumer Knaflic
Как настроить
Для создания линейного графика в Qlik Sense, вам достаточно одного измерения и одной меры. При этом, измерение всегда располагается по оси X, а меры – по оси Y. Вы можете добавить дополнительные измерения, чтобы построить линейный график по нескольким наборам данных и получить несколько линий.
    В свойствах линейного графика, вы также можете
    • показать точки на линии, чтобы выделить величины из источника данных
    • определить как показывать null-значения (пробелы, соединения точек, нули)
    • выбрать тип линейного графика: с линией или областью
    Линейный график с областью
    Изменение во времени + совокупный эффект
    Что это такое и как настроить
    Простой линейный график может быть переведен в другое представление, с заливкой области. Показывать в виде области изменение всего лишь одного показателя практически бессмысленно. Но, при добавлении на график нескольких измерений, график с областью приобретает новый смысл. Обычно, такой график называют графиком с накоплением.


    График с накоплением работает также как и обычный график за исключением того, что несколько категорий данных могут накладываться непосредственно друг на друга. То есть, каждое значение нового набора данных прибавляется к уже существующим значениям, образуя «новый слой».
    В Qlik Sense, при выборе графика с областью, у вас есть возможность указать как именно следует показывает несколько наборов данных: друг над другом или от общей оси.

    Сравните расположение сегментов и размерность шкалы на двух примерах ниже. Мы используем левый вариант, когда нам важно показать накопленный итог и всю сумму по всем сегментам внутри визуализации. Правый вариант по смыслу аналогичен простому линейному графику.
    Комбинированный график
    Изменение во времени + сравнение категорий
    Когда вам нужно показать несколько мер на визуализации, используйте комбинированные диаграммы с двумя осями.

    Комбинированные диаграммы подходят:
    • при наличии графика и барчарта с одной и той же осью X
    • для сравнения нескольких показателей с другими диапазонами значений
    • для демонстрации корреляции между двумя показателями в одной визуализации
    • для проверки соответствия одного показателя целевому, который определяется другим показателем

    Из практических примеров, можно привести сравнение плана и факта по выручке по категориям товаров или отображение процентной доли рядом с абсолютными значениями. Меры могут иметь разную размерность (абсолютные числа и %, показатель со шкалой от 10 до 100 и в миллиардах), или одинаковую (доходы и расходы, которые нужно сравнивать в одной размерности).

    На диаграмме формируется две оси с индивидуальными или одинаковыми шкалами – одна слева, одна справа.
    Чтобы показать данные на оси одной размерности, выберите в свойствах второго показателя ось первого.

    Вы также можете выбрать каким способом показывать оба показателя: такими же барами, линией или маркерами. Маркерами выступают простые геометрические фигуры, которые откладывают значение точки в виде одного символа. Обычно маркерами показывается дополнительный, не приоритетный показатель, поскольку маркер менее заметен на фоне столбцов.

    Комбинированная диаграмма поддерживает только одно измерение, и поэтому ее нельзя использовать, когда нужно включить в визуализацию два и больше измерений.

    Можно указать только одно измерение и до 15 мер. Каждую из мер можно, как обычно, разбивать на дополнительные, задавать настройки цвета и применять все стандартные свойства.
    Практикуемся
    В решении кейсов
    Сегодня у нас обе практики можно назвать заданиями для души. Рассмотрим сочетание вина и сыра.
    Ответы на душевную практику дня 06
    1. 97 428$
    2. Комиксы, количество проектов: 2015 - 1922, 2016 - 1870, 2017 - 2002
    3. а) 0-12 000 человек
    3. б) Настольная игра Взрывные котята (Exploding Kittens - кстати, довольно популярная и в России!) из США успешно собрала практически 220 тысяч сторонников и 8 782 572 доллара на реализацию проекта

    Ответы на корпоративную практику дня 06
    Практика сырная
    В этом датасете представлена информация по сырам: твердым и мягким, с благородной плесенью и без. Вы сможете узнать, какой продается лучше? Какой самый дорогой, но не такой вкусный как Адыгейский?

    Файл с приложением
    Задания сырные
    Покажите –
    1. Максимальные продажи сыров в динамике (линейный график)
    2. Продажи сыров по типу молока (ария чарт)
    3. Продажи сыров и наценку в рублях (Продажи минус себестоимость) (комбо чарт)
    Практика винная
    Ничто так хорошо не сочетается с сыром как вино. Поэтому в качестве датасета для души на сегодня возьмем оценки вин со всего мира.

    Файл с приложением
    Задания винные
    1. Первой будем "дегустировать" линейную диаграмму. Построим динамику средней оценки вин по году винтажа. В каком году средняя оценка была самой низкой?
    2. Перейдем к линейному графику с заливкой области. В качестве меры возьмем заранее рассчитанную в приложении мастер-меру Средняя цена, а в качестве измерения - год винтажа. Какая была самая высокая и самая низкая цена в 90-е годы?
    3. Завершим работу с датасетом построением комбинированной диаграммы по сорту винограда. Первой мерой будет выступать количество вин (в качестве представления выберем бары), а второй - средняя цена (обозначим на диаграмме линией). Отсортируем полученную диаграмму по количеству вин и ограничим первыми 30 сортами, не включая Другие. Какова средняя цена вин сорта Riesling? Какие сорта южноафриканских вин наиболее часто встречались в датасете?
    Вдохновляемся
    Изучаем прекрасное в сети
    Полезные ссылки по теме
    Сегодня предлагаем вам погрузиться в особенности рассмотренных визуализаций в Qlik Sense, и изучить возможности одного из самых популярных экстеншенов. Happy vizzing!
    Погружаемся
    В тематические книжки и видео
    Артефакты
    Помогут Вам лучше усвоить и вовремя вспомнить основные элементы методик, подходов, последовательностей действий, проверенных практик
    Книги
    Сегодня для вас – подборка книг для вдохновения от современного классика визуализации данных – Альберто Кайро.
    Функциональное искусство
    Альберто Кайро
    Правдивое искусство
    Альберто Кайро
    Итоги этапа
    Изучив два самых популярных вида визуализации – барчарты и лайнчарты –можно смело переходить к завоеванию мира, что мы и сделаем после выходных, потренировавшись строить географические карты, чтобы видеть захватываемую местность. Рекомендуем делать заметки понравившихся проектов у Кайро, это хорошо помогает подбирать варианты для своих данных. На сегодня все. До завтра. Всем хорошего дня. Виз виз ураааа!
    ~
    DATA YOGA CLUB