Пособие по журналистике данных 1.0
Loading

Разные графики рассказывают разные истории

В современном цифровом мире, с перспективой погружения в 3D-опыт, мы склонны забывать о том, что так долго писали исключительно чернилами по бумаге. Сейчас мы думаем об этом статичном и плоском способе как о некоем гражданине второго сорта, но на самом деле на протяжении тех сотен лет, когда мы писали и печатали, нам удалось достичь невероятного уровня богатства знаний и опыта в области представления данных на бумаге. И хотя интерактивные графики, визуализации данных и инфографика и являются последним писком моды, они отказываются от лучших наработок и методов, которым мы научились. И лишь когда мы бросаем взгляд в историю совершенных и искусно выполненных графиков и диаграмм, мы можем осознать этот багаж знаний и использовать его в новой среде.

Некоторые из самых известных графиков и диаграмм появились из необходимости лучше объяснять малопонятные и непрозрачные таблицы данных. Уильям Плэйфэйр (William Playfair) был шотландским полиглотом, который жил в конце 1700-х - начале 1800-х годов. Он единолично представил миру многие из тех же видов графиков и диаграмм, которые мы до сих пор используем и сегодня. В своей книге 1786 года - «Коммерческий и политический атлас» (Commercial and Political Atlas), Плэйфэйр представил гистограмму, столбчатый график, чтобы ясно показать количественные показатели импорта в Шотландию и экспорта из нее новым, визуальным способом.

Рис 90. Ранние гистограммы и столбчатые графики (Уильям Плэйфэйр)

Потом он продолжил популяризировать разные графики, представив в своей книге 1801 года под названием «Статистический конспект» (Statistical Breviary) то, что мы ныне называем круговой, секторной диаграммой. Нужда в этих новых формах графиков и диаграмм возникла из торговой области, но с течением времени появились и другие графики и диаграммы, благодаря которым удавалось даже спасать жизни. В 1854 году Джон Сноу (John Snow) создал свою ныне ставшую знаменитой «Карту распространения холеры в Лондоне», добавив маленькую черную полоску к каждому адресу, по которому был зарегистрирован случай заболевания. Со временем можно было заметить очевидную увеличенную плотность вспышки заболевания, и принять меры к решению проблемы.

Рис 91. Карта распространения холеры в Лондоне (Джон Сноу)

С течением времени

Шло время, и те, кто работал с этими графиками и диаграммами, становились все смелее и смелее, и начинали все больше экспериментировать, приводя это средство отображения информации к тому виду, в котором мы знаем его сейчас. Андре-Мишель Герри (André-Michel Guerry) был первым, кто опубликовал идею карты, где разные регионы окрашивались в разный цвет в зависимости от чего-либо, поддающегося измерению. В 1829 году он создал первую хороплет-карту, взяв регионы во Франции и заштриховав их по уровню преступности. Сегодня мы видим подобные карты, представляющие позиции разных регионов на выборах, кто за кого голосовал, распределение богатства, и многие другие связанные с географическими параметрами переменные. Идея выглядит такой простой, но даже сегодня сложно освоить и понять ее, если она не использована с умом.

Рис 92. Хороплет-карта Франции, демонстрирующая уровень преступности (Андре-Мишель Герри)

Есть много инструментов, которые хороший журналист должен понять и иметь в своем арсенале для создания визуализаций. В том, что касается графиков и диаграмм, важно не бросаться с головой в рискованное предприятие, а заложить отличную основу. Все, что вы создаете, должно исходить из серии элементарных графиков, схем и диаграмм. Если вы способны овладеть основами, то потом вы можете перейти к построению более сложных и продвинутых визуализаций, которые будут состоять из этих базовых элементов.

Двумя основными видами графиков и схем являются гистограммы, сиречь столбчатые графики, и линейные диаграммы. Хотя они и очень похожи в своих вариантах и сценариях использования, они также могут сильно различаться по своему замыслу и смысловому содержанию. Давайте возьмем для примера продажи какой-нибудь компании за каждый месяц года. Мы получим 12 столбцов, представляющих суммы денег, полученные за каждый месяц.

Рис 93. Простая гистограмма: полезная для представления прерывистой, дискретной информации

Давайте посмотрим, почему в этом примере должна быть столбчатая диаграмма, а не линейный график. Линейная диаграмма очень хорошо подходит для непрерывного, сплошного, продолжительного потока данных. А наши цифры продаж - это итог за месяц, там ничего не меняется, они уже статичны. Если эти данные представить в форме столбца, то мы знаем, что в январе компания заработала 100 долларов, а в феврале 120. Если мы представим эту же информацию в виде линейной диаграммы, то тут по-прежнему будет 100 и 120 долларов по состоянию на начало каждого месяца. Но при этом, смотря на линейный график, мы автоматически представляем, что 15 числа компания заработала 110 долларов. Что неправда. Столбцы используются для дискретных, раздельных единиц измерения, а линии - когда данные носят непрерывный характер, например, температура.

Рис 94. Простой линейный график: полезный для представления непрерывной информации

Тут мы можем видеть, что в 8.00 утра температура составляла 20 градусов Цельсия, а 9.00 утра - 22 градуса. Если мы посмотрим на линию, то представим себе, что в 8.30 у нас был 21 градус, что является вполне корректным, так как температура носит непрерывный характер и каждая точка не является суммой других значений, а представляет собой точную величину на данный момент или возможное значение между двумя точными величинами.

И столбцы, и линии могут быть составными. Это отличный инструмент для представления материала, который может работать разными способами. Давайте возьмем для примера компанию, у которой имеется 3 территории, три месторасположения.

Рис 95. Сгруппированная гистограмма

Для каждого месяца у нас будет три столбца, по одному для каждого из магазинов, в общей сложности 36 за год. Если мы поместим их друг рядом с другом, мы сможем быстро увидеть, в каком месяце какой магазин принес самую большую выручку. Это интересная и убедительная история, но в тех же данных кроется и еще кое-что. Если мы поставим столбцы друг на друга, то у нас получится только один столбец для каждого месяца, и мы утратим возможность с легкостью увидеть, какой магазин больше всего принес денег, но зато мы можем увидеть, в какой из месяцев компания в целом поработала лучше всего и заработала больше всего денег.

Рис 96. Составной столбчатый график

Оба этих варианта являются убедительными и действенными способами отображения одной и той же информации, но при этом они рассказывают две разные истории, используя одни и те же первоначальные данные. Как для журналиста, для вас самым важным аспектом работы с данными является то, чтобы в первую очередь выбрать, какую именно историю вы хотите рассказать. О том ли, какой месяц - лучший для бизнеса, или о том, какой магазин может считаться флагманским, по крайней мере, по доходам? Это, конечно, простой пример, но на самом деле, в этом вся суть, это центральный момент журналистики данных: нужно задать правильный вопрос прежде, чем вы зайдете слишком далеко. Сам сюжет, сам материал будет направлять вас и обусловливать ваш выбор варианта визуализации.

Столбчатый график и линейная диаграмма - это действительно повседневные, базовые инструменты, буквально-таки хлеб насущный любого журналиста данных. Отталкиваясь отсюда, вы можете уже расширять ваш инструментарий посредством включения в него гистограмм, горизонтальных графиков, искрографиков, потоковых графиков и других инструментов, которые обладают сходными свойствами, но предназначены для слегка отличающихся друг от друга ситуаций, в том числе по количеству данных, по источникам данных, по местоположению графика в тексте.

В журналистике одна из наиболее часто использующихся графических функций - это карта. Время, количество и географические данные - все это свойственно картам. Мы всегда хотим знать, сколько имеется того или иного в одной области по сравнению с другой, или как данные перетекают из одного региона в другой. Функциональные диаграммы и хороплеты - это очень полезные инструменты, и их обязательно нужно иметь в вашем арсенале и вы должны уметь ими пользоваться, когда работаете над визуализациями в журналистских целях. Знать, как превратить карту в набор разноцветных элементов должным образом, не вводя читателей в заблуждение и не путая его - это крайне важно. Политические карты обычно окрашиваются в разные цвета и сортируются по цветам по принципу «все или ничего» для каждого региона, даже если разница в какой-то части страны не превысила одного процентного пункта. Но работа с цветом не предполагает обязательного бинарного выбора, жесткого выбора одного из двух. Можно с достаточной степенью осторожности использовать оттенки цветов. Умение понимать карты - это значительная часть журналистики. Карты могут с легкостью ответить на вопрос «ГДЕ» из серии «пяти W» .

Когда вы хорошо освоите основные виды графиков и диаграмм, то потом можете приступить к созданию более сложных, разнообразных и фантазийных визуализаций данных. Если вы не понимаете основ, тогда получится, что вы, условно говоря, строите на зыбкой почве. Подобным же образом вы учитесь быть хорошим писателем, хорошим автором, умеющим делать предложения короткими и емкими, умеющим всегда помнить о своей аудитории, и не занимающимся искусственным усложнением вещей, чтобы казаться более умным, а старающимся в максимальной степени передать смысл для читателя. Однако же не стоит перебарщивать с данными. Начинать с небольших объемов - это самый эффективный и действенный способ рассказать историю, медленно наращивая объемы только в случае необходимости.

Решительная и энергичная манера письма подразумевает краткость, лаконичность. В предложении не должно быть ненужных слов, в абзаце - необязательных предложений. По той же причине, по которой в рисунке не должно быть лишних линий, а в машине - лишних деталей. Речь тут не о том, чтобы автор делал все свои предложения максимально короткими, или избегал любых подробностей, или говорил о своей теме лишь в общих чертах, а о том, чтобы каждое слово несло смысл и не выглядело лишним и не необходимым.

Вполне нормально не использовать каждый-каждый элемент данных в вашем сюжете или материале. Вы не должны спрашивать разрешения, можно ли быть сжатым и лаконичным, это просто должно быть правилом.

— Уильям Странк-младший («Элементы стиля» (Elements of Style) - 1918)

Брайан Суда, (optional.is)