Пособие по журналистике данных 1.0
Loading

Визуализация данных по принципу «сделай сам»: наши главные инструменты

Рис 97. Военные отчеты Wikileaks (The Guardian)

Какие инструменты для визуализации данных имеются в интернете, просты в использовании и бесплатны? Мы у себя в Datablog и Datastore стараемся в максимальной степени пользоваться мощными бесплатными возможностями интернета.

Возможно, это прозвучит лицемерно и неискренне, особенно учитывая, что мы явно имеем доступ к великолепным отделам Guardian, занимающимся графикой и интерактивами, по крайней мере, это касается тех проектов, на воплощение которых у нас есть немного больше времени — таких, например, как вот эта карта государственных расходов (созданная при помощи программы Adobe Illustrator) или вот этот интерактив по беспорядкам в «Твиттере».

Но в нашей повседневной работе, когда нам что-то нужно сделать быстро и оперативно, мы часто используем такие же инструменты, которые может использовать любой другой – и создаем графику, которую легко мог бы сделать кто-то еще.

Итак, что мы используем?

Эта доступная онлайн база данных и картографический инструмент стала нашим основным средством для создания быстрых и детализированных карт, особенно таких, где требуется функция приближения. Вы получаете все удобства карт Google с их высоким разрешением, но при этом они вдобавок могут содержать много данных – например, около 100 Мб CSV. Когда вы будете работать с таблицами Fusion в первый раз, они могут показаться несколько мудреными, но не бойтесь. Мы использовали их для создания карт типа вышеприведенной иракской, а также таких, как вот такая вот карта по бездомным.

Рис 98. Интерактивная карта по бездомным (The Guardian)

Основное преимущество – это гибкость. Можно загрузить, скажем, kml-файл региональных границ, и потом объединить его с таблицей данных. Сервис также потихоньку приобретает обновленный пользовательский интерфейс, что должно облегчить работу с ним.

И не нужно быть ни кодером, ни программистом, чтобы все сделать – а вот этот вот инструмент слоев Fusion дает вам возможность объединять несколько карт вместе, добавлять функции поиска и фильтрации, которые вы можете потом встроить в блог или на сайт.

Замечание

используйте shpescape для конвертации служебных файлов shp в таблицы Fusion, которыми вы сможете пользоваться. Также будьте осторожны со слишком сложными и нагруженными картами – Fusion не способен справиться с размерами более миллиона точек на одну клетку.

Tableau Public Если вам не требуется неограниченное пространство профессионального издания, то инструмент бесплатен – а его использование означает, что вы сможете создавать весьма сложные визуализации просто и легко – с данными объемом до 100 000 строк. Мы используем его, в основном, когда нам требуется свести вместе несколько графиков и схем — как, например, в этой карте самых высоких налоговых ставок по всему миру, где присутствует также и столбчатый график.

Или этот сервис можно использовать в качестве анализатора данных — как мы, например, поступили в случае с приведенным ниже проектом по Расходам на федеральные выборы в США (хотя у нас даже кончилось место в бесплатной версии - за этим нужно следить). Tableau также требует того, чтобы данные были отформатированы весьма специфическим способом, чтобы вы могли извлечь из них максимум. Но если вы справитесь с этим, то получите нечто очень интуитивно понятное, которое будет отлично работать. La Nación в Аргентине, например, строит без преувеличению всю свою работу в области журналистики данных на базе Tableau.

Рис 99. Финансирование президентской кампании 2012 года (The Guardian)

У Tableau есть несколько хороших онлайн-обучающих уроков, с которых вы могли бы начать.

Замечание

Tableau сделан для PC, хотя разрабатывается и версия для Mac. Пользуйтесь различными обходными маневрами, чтобы заставить ее работать.

Рис 100. Правительственные расходы и налогообложение в Великобритании (The Guardian)

После чего-то простого - типа линейного или столбчатого графика, или круговой диаграммы - вы обнаружите, что таблицы Google (которые вы создали на основе документов из вашего аккаунта Google) могут дать основу и для более сложных и весьма симпатичных и привлекательных схем. Включая анимированные пузыри, использованные, например, в проекте Gapminder Ханса Рослинга (Hans Rosling). В отличие от программ the по построению схем и графиков от Google, вам не нужно думать о кодировке - это примерно как строить график в Excel, где вы просто обозначаете данные и кликаете на виджет построения соответствующего графика. Опции индивидуальной настройки тоже стоит внимательно изучить - вы можете менять цвета, заголовки и шкалы. Они весьма нейтральные по дизайну, что полезно в случае небольших схем и графиков. Линейные диаграммы также могут похвастаться несколькими приятными возможностями, включая возможность аннотаций и добавления комментариев.

Замечание

отведите некоторое время изучению опций по настройке и кастомизации графиков и схем - вы сможете создать свою собственную цветовую палитру.

Рис 101. Заключенные, отбывающие срок в ожидании исполнения смертного приговора, и исполнения смертных приговоров (Datamarket)

Изучите и проанализируйте эти данные об американских смертных приговорах

Более известный в качестве поставщика данных, Datamarket на самом деле является также и весьма толковым инструментом для визуализации чисел. Вы можете загрузить ваши собственные данные или использовать многочисленные наборы данных, которые они имеют вам предложить - но при этом стоит отметить, что набор ваших возможностей существенно расширяется, если вы подпишетесь на профессиональную версию.

Замечание

Datamarket лучше всего работает с временными рядами данных, также стоит ознакомиться с их обширными наборами данных.

Если какому сайту когда и требовались внимание и забота, то это IBM’овский Many Eyes. Когда он только-только был запущен, созданный Фернандой Вьегас (Fernanda B. Viégas) и Мартином Уоттенбергом (Martin Wattenberg), это был уникальный пример, позволявший людям просто загружать наборы данных и визуализировать их. Теперь, когда его создатели работают в Google, сайт выглядит словно бедный родственник с его приглушенной цветовой палитрой – и уже некоторое время на нем не появляется ничего нового в плане способов визуализации.

Замечание

вы не можете редактировать данные после того, как загрузили их, поэтому обязательно заранее проверьте, все ли у вас правильно, и нет ли ошибок, прежде чем начать выгружать их туда.

Рис 103. Color brewer

Не являясь, строго говоря, инструментом визуализации, Color Brewer («Цветовар») – изначально сконструированный на государственные деньги и разработанный в Университете штата Пенсильвания – на самом деле удобен для выбора цветов карт, и стоит потратить некоторое время на него, если вы планируете что-то в этом роде. Вы можете выбрать базовый цвет и получить кодировку для всей палитры.

И еще немного

Рис 104. Еще от Color Brewer

Если ничего из этого вам не подошло, стоит также ознакомиться с этим материалом от DailyTekk, , где приведено еще больше разных инструментов и возможностей. То, о чем мы написали выше - не единственные инструменты, а просто те, которые мы применяем чаще всего. Существует также множество других, включая:

  • Chartsbin, инструмент для создания кликабельных карт мира

  • iCharts специализируется на маленьких виджетах по созданию схем и графиков

  • Geocommons делится данными и краевыми данными (граничными условиями) для создания глобальных и местных карт

А, да, и конечно есть еще piktochart.com, который представляет образцы для текстуально-цифровых визуализаций, которых на данный момент существует множество.

Саймон Роджерс, The Guardian