Пособие по журналистике данных 1.0
Loading

Дизайн для данных

Примерно так же, как и обычные диаграммы и графики, функциональные и структурные диаграммы также кодируют информацию, превращая ее в соединительные линии, основная суть которых кроется в их толщине и/или цвете. Например, для ситуации с кризисом еврозоны, когда несколько ее государств-членов оказались неспособны платить по своим долгам, New York Times решила распутать паутину заимствований, которая связывает страны-члены ЕС с из торговыми партнерами на другом берегу Атлантики и в Азии. В одном из «режимов» визуализации ширина линий отражает суммы кредитов, идущие от одной страны к другой, а изменение цвета в диапазоне от желтого до оранжевого показывает, насколько этот поток вызывает тревогу или беспокойство - в смысле, что деньги вряд ли вернутся!

Если взять более приятную и радостную тему, то вот, например, журнал National Geographic сделал обманчиво простой график, показывающий связи между тремя американскими городами — Нью-Йорком, Чикаго и Лос-Анджелесом - и ведущими районами производства вина, демонстрируя, как осуществляются транспортные перевозки продукта из каждого из источников, и насколько разные уровни негативных экологических последствий в плане выбросов парниковых газов дают разные маршруты. Так, например, получается, что вина из региона Бордо для жителей Нью-Йорка оказываются более «экологичными», чем калифорнийские.

“SourceMap”, проект, начатый в бизнес-школе Массачусетского института технологий, использует функциональные, структурные диаграммы, чтобы скрупулезно взглянуть на глобальные закупки производственных товаров, их компонентов и сырья. Благодаря обширным и серьезным исследованиям, пользователь теперь может осуществлять поиск самой разной продукции, начиная с обуви под брендом Ecco и заканчивая апельсиновым соком, и выяснить, из каких уголков земного шара эти товары были взяты, и каков будет след именно от их производства в объемах углеродных выбросов.

Показать иерархию

Рис 87. OpenSpending.org (Фонд Open Knowledge)

В 1991 году исследователь Бен Шнейдерман (Ben Shneiderman) изобрел новый вид визуализации под названием “treemap”, состоящий из многочисленных прямоугольников, концентрически вложенных друг в друга. Площадь данного прямоугольника соответствует количеству, которое он представляет, как сам собой, так и беря в совокупности все свое содержимое. Будь то при визуализации национального бюджета по тем или иным органам или их подразделениям, в случае с визуализацией фондового рынка по секторам и компаниям, или языка программирования по классам и подклассам, формат treemap представляет собой компактный и интуитивно понятный интерфейс для представления всей совокупности в целом и ее составных частей. Другим эффективным и действенным форматом является дендрограмма, который выглядит более похожей на обычный организационный график, где подкатегории продолжают отходить в виде ветвей от одного изначального ствола.

Ориентирование в больших базах данных

Рис 88. Каждая смерть на каждой дороге в Великобритании в 1999-2010 годах. (BBC)

В то время как некоторые визуализации данных очень эффективны, когда нужно взять знакомую, известную информацию и представить ее в совершенно новом свете, что происходит, когда у вас имеется совершенно новая информация, в которой люди хотят ориентироваться? Век данных приносит с собой потрясающие новые открытия практически каждый день, начиная с великолепного географического анализа фотографий Flickr Эрика Фишера (Eric Fischer), и заканчивая публикацией властями Нью-Йорка тысяч ранее недоступных и конфиденциальных оценок учителей.

Эти наборы данных приобретают максимальную силу, когда пользователи получают возможность копаться в них и дойти в своей детализации до той информации, которая будет иметь максимальное отношение непосредственно к ним.

В начале 2010 года New York Times получила доступ к обычно имеющим частный, скрытый характер записям и документам Netflix о том, в каких районах какие чаще всего брали в прокат фильмы. И хотя Netflix отказалась раскрыть точные цифры, New York Times смогла создать привлекательную интерактивную базу данных, которая позволяет пользователям просматривать прокатные данные по фильмам из топ-100 в 12 крупнейших метрополиях страны, разбитые по почтовым индексам. При этом по каждому коммьюнити можно смотреть, где именно какой фильм был более популярен - визуально это отображено при помощи цветов разной степени насыщенности.

К концу того же года New York Times опубликовала результаты проводящейся раз в десять лет переписи населения США — всего через несколько часов после того, как эти результаты были обнародованы. Интерфейс, сделанный в Adobe Flash, предложил целый ряд возможных вариантов визуализаций и позволил пользователям просматривать информацию со степенью подробности вплоть до каждого конкретного избирательного участка в стране (коих насчитывается 8,2 миллиона), и увидеть, как распределяются на этих участках жители по расовому признаку, по уровню доходов и по уровню образования. При этом степень детализации данных была настолько высокой, что при просмотре информации в первые часы после публикации создавалось впечатление, что вы, возможно, первый человек в мире, который изучает данный конкретный уголок базы данных.

Аналогичное достойное похвалы использование визуализации в качестве интерфейса базы данных можно отметить в расследовании трагических инцидентах со смертельным исходом на дорогах, проведенном ВВС, а также в многочисленных попытках быстро проиндексировать масштабные массивы не всегда структурированных данных, таких как, например, публикации Wikileaks военных отчетов по Ираку и Афганистану.

Рисовать в своем воображении альтернативное развитие событий

Рис 89. Бюджетные прогнозы, сравнение с действительностью (New York Times)

В New York Times «дикобразоподобный график» Аманды Кокс (Amanda Cox) оказавшихся трагическим образом слишком оптимистичных прогнозов по бюджетному дефициту США за последние годы показывает, что порой бывает так, что то, что произошло, менее интересно, чем то, что не произошло. График температуры Кокс показывает всплеск бюджетного дефицита после десятилетия войн и налоговых льгот, и великолепно иллюстрирует, насколько нереалистичными могут стать прогнозы на будущее.

Бреет Виктор (Bret Victor), давний разработчик интерфейса для продуктов Apple (и создатель теории под названием «Отменить математику» (проект Kill Math), позволяющей использовать визуализацию для удобного представления количественной информации - получился нтерактивный интерфейс, где даже самые сложные уравнения не просто понятны каждому, но и являются новой формой искусства), создал прототип своего рода реагирующего документа. В его примере идеи экономии электроэнергии включают в себя доступные для редактирования исходные условия и положения, в соответствии с которыми даже такой простой шаг как выключение света в пустых комнатах может помочь американцам сэкономить энергию, которую производят от двух до сорока (!) работающих на угле электростанций. Изменение процентных показателей в середине текстового абзаца вызывает соответствующие изменения в остальном тексте на странице!

Если вы хотите ознакомиться с другими примерами и предположениями, то вот список различного использования визуализаций, карт и интерактвной графики, составленный Мэтью Эриксоном (Matthew Ericson) из New York Times.

Когда не использовать визуализацию данных

В конечном итоге эффективная и качественная визуализация данных зависит от качества, чистоты, точности и значимости информации. Ровно как хорошие цитаты, ценные факты и описанию способствуют созданию качественных материалов в рамках повествовательной журналистики, визуализация данных может быть хороша ровно настолько, насколько хороши данные, ее наполняющие.

Когда вашу историю можно рассказать лучше при помощи текста или мультимедиа

Порой бывает так, что одни только данные не могут рассказать историю самым убедительным и наглядным образом. И хотя тут может помочь простой график, иллюстрирующий тенденции или итоговую статистику, текстовый комментарий или описание фактов, связывающих данные с их последствиями в реальном мире, может оказаться более непосредственным, оперативным и впечатляющим, имеющим ударную силу для читателя.

Когда у вас очень мало отправных точек

Как гласит известное изречение, «цифры в отрыве от всего, сами по себе, ничего не значат». И как обычно отвечают редактора в ответ на цитирование статистики - «а по сравнению с чем?» Какова тенденция - понижательная или повышательная? Каковы нормальные показатели? В общем, с чем сравнивать-то?

Когда у вас очень незначительная изменчивость в ваших данных, отсутствует четкая тенденция или выводы

Порой вы собираете и организуете ваши данные в Excel или аналогичном позволяющем строить графики приложении, и обнаруживаете, что информация «зашумлена» и насыщена помехами - много колебаний или относительно плоская тенденция. Поднимаете ли вы в таком случае ось икс до какой-то величины, отличной от нуля, ровно под самое низкое значение, с целью придать графику немного более адекватную форму? Нет! Похоже, у вас имеются неоднозначные, нечеткие, двусмысленные или сомнительные данные, и вам нужно больше копать и анализировать.

Когда карта — не карта

Когда пространственный элемент невыразителен или неубедителен, или отвлекает внимание от более актуальных числовых тенденций, таких как, например, изменение во времени или демонстрация схожих элементов в неблизких областях.

Не забывайте о таблицах

Если у вас сравнительно мало отправных точек, но есть информация, которая может пригодиться некоторым из ваших читателей, рассмотрите такой вариант как просто изложение данных в форме таблицы. Это ясный и легкий для прочтения метод, который не создает нереалистичных ожиданий «сюжета». На самом деле, таблицы могут быть очень эффективным, действенным и элегантным способом изложения основной информации.

Брайан Суда, (optional.is)