Пособие по журналистике данных 1.0
Loading

Визуализация как «рабочая лошадка» журналистики данных

Прежде чем вы приступите к попытке построить график или нанести на карту ваши данные, возьмите и подумайте минутку о том, сколь многочисленную и многозначную роль играет статичная и интерактивная графика в вашей журналистской работе.

На стадии создания материала визуализации могут:

  • Помочь вам найти и определить темы и поставить вопросы для остальной части вашего репортажа

  • Идентифицировать какие-либо аномалии, резко выделяющиеся значения: превосходнейшие истории или, возможно, ошибки в ваших данных

  • Помочь вам найти и выделить типичные примеры

  • Показать вам пробелы в вашем репортаже - чего недостает

Визуализации также играют разные роли непосредственно при публикации:

  • Могут проиллюстрировать какой-то момент сюжета более наглядным способом

  • Могут убрать из повествования ненужную техническую информацию

  • Особенно в тех случаях, когда они интерактивные, они могут давать возможность осуществлять исследовательские работы, а также обеспечивать прозрачность в отношении вашей репортажной работы в глазах ваших читателей

Эти роли заставляют предполагать, что вы должны начинать делать визуализации именно сразу при создании материала, независимо от того, начали вы уже собирать электронные данные или записи или нет. Не считайте это отдельным шагом, вопросом, который можно будет решить уже после того, как большая часть материала будет написана. Данный раздел призван помочь вам вести подготовку сюжета в правильном направлении.

Начать порой означает просто превратить в визуальную форму те записи, которые вы уже сделали. Посмотрите на график на Рис 80, который был в Washington Post в 2006 году.

Рис 80. Развитие сельскохозяйственных субсидий во времени (Washington Post)

Этот график демонстрирует долю сельскохозяйственных доходов, связанную с субсидиями, и ключевые события в этой области за последние 45 лет, он был создан в течение нескольких месяцев. При этом было достаточно проблематично искать и находить данные за разные периоды времени, которые могли бы использоваться и сводиться воедино с аналогичными определениями и значениями. При этом исследование и изучение всех высших и низших точек графика помогло нам удерживать этот контекст в памяти, когда мы делали остальную часть репортажа. Это также означало, что одна работа была практически закончена еще до того, как сюжеты и материалы были написаны.

Вот несколько подсказок, советов по использованию визуализации в начале изучения ваших наборов данных.

Совет 1: Используйте небольшие однотипные составляющие, чтобы быстро ориентироваться в больших наборах данных

Я пользовался этой техникой в Washington Post, когда мы искали подсказку, намек на то, что администрация Джорджа Буша-младшего выдавала гранты по политическим, а не предметно-содержательным мотивам. Большинство из этих программ помощи реализуются по формуле, а оставшиеся финансировались годами, так что нам было любопытно, сможем ли мы найти какой-то характерный образец поведения и вычленить повторяющийся сценарий, просмотрев примерно 1 500 различных произвольным образом выбранных денежных потоков.

Рис 81. HHS Grants: искрографики помогают найти и ухватить суть истории (Washington Post)

Я создал график для каждой программы помощи, где красные точки обозначали год президентских выборов, а зеленые точки - годы выборов в конгресс. Трудная задача: да, наблюдается резкий всплеск в период за шесть месяцев до выборов президента по нескольким из анализируемых программ - красные точки с пиковыми значениями рядом с ними - но это не тот предвыборный год. Вместо года, когда переизбирался Джордж Буш, мы видим, что пики постоянно приходятся на президентские выборы 2000 года, когда в Белом доме был Билл Клинтон, а его вице-президент, Альберт Гор, избирался на этот пост.

И все это было очень легко заметить именно на серии графиков, а отнюдь не в таблицах с цифрами, и интерактивная форма представления информации дала нам возможность проверить разные типы грантов, разные регионы и разные управления и агентства. Карты в небольших количествах могут стать способом показать время и место на статичной картинке, и информацию будет легко сравнить - порой, даже легче, чем в случае с интерактивом.

Этот пример был создан при помощи коротенькой программы, написанной на PHP, но теперь это гораздо проще делать при помощи искрографиков Excel 2007 и 2010. Эдвард Тафт (Edward Tufte), эксперт в области визуализации, изобрел эти «впечатляющие, насыщенные, простые и похожие на слова графики» для передачи информации таким образом, чтобы ее можно было воспринимать буквально с первого взгляда, даже когда речь идет о больших объемах данных. Теперь их можно увидеть повсюду - начиная с маленьких графиков под биржевыми котировками до записей о победах и поражениях в спорте.

Совет 2: Обрабатывайте и анализируйте ваши данные сверху вниз, вдоль и поперек

Когда вы пытаетесь понять сюжет или материал, построенный на базе набора данных, на него просто невозможно взглянуть с неправильной точки зрения; попробуйте сделать это любым способом, который только придет вам в голову, и вы получите разные точки зрения. Если вы делаете материал по преступности, вы, вероятно, будете смотреть на один набор графиков и диаграмм, повествующих о том, как изменилась ситуация с преступлениям против личности за год; можно анализировать процентные изменения, можно делать сравнения с другими городами, а еще можно делать акцент на изменениях с течением времени. Используйте все - исходные цифры, проценты и коэффициенты.

Смотрите на данные, используя разные шкалы. Сначала попробуйте делать это, соблюдая правило, что ось Х - это нулевой уровень. Потом нарушьте это правило, и посмотрите, не появилась ли у вас перед глазами какая-то новая информация. Пробуйте логарифмы и квадратные корни для данных с асимметричным распределением.

Не забывайте об исследовании, проведенном на основе визуального восприятия. Эксперименты Уильяма Кливленда (William Cleveland) показали, что глаз видит изменения в изображении, когда средний уклон составляет 45 градусов. Это означает, что вы можете игнорировать наставления всегда начинать с нуля, и вместо этого работаете над тем, чтобы создать максимально глубокую, поучительную и интуитивно понятную графику. Другое исследование в области эпидемиологии предлагает вам обозначить целевой уровень в качестве границы для вашей диаграммы. Каждый из этих способов помогает вам взглянуть на данные разными способами и с разных точек зрения. Когда они перестанут говорить вам что-то новое, тогда вы будете знать, что этот этап работы закончен.

Совет 3: Не предполагайте

Теперь, когда вы взглянули на ваши данные разными способами, вы, возможно, нашли записи, которые не выглядят верными - возможно, вы не поняли сначала, что они означают, или там есть какие-то отклонения, резко выделяющиеся значения, которые выглядят как ошибки, или есть тенденции, которые кажутся обратными.

Если вы хотите опубликовать что-либо на основании вашего первичного изучения, или сделать это в виде опубликованной визуализации, вам нужно решить эти вопросы, но при этом нельзя делать никаких предположений. Либо это интересные истории, либо это ошибки; интересный вызов здравому смыслу или недоразумение, недопонимание.

Для местных органов власти не является чем-то из ряда вон выходящим публикация таблиц данных, в которых полно ошибок, и кроме того, настолько же легко можно неправильно понять правительственный жаргон, профессиональный канцелярский язык в наборах данных.

Во-первых, пробегитесь обратно по вашей работе. Вы прочли документацию, все ее оговорки - так имеется ли проблема в оригинальной версии данных? Если с вашей стороны все выглядит правильным, тогда пришло время снять трубку. Вы собираетесь решить эту проблему, если вы планируете использовать эти данные, так что можно начать прямо сейчас.

И вместе с тем, не всякая ошибка важна. Например, в записях о финансировании предвыборной кампании часто встречаются несколько сотен почтовых индексов, которых нет в базе данных со 100 000 записей. Пока не случится так, что все эти непонятные индексы не окажуться в одном и том же городе или не будут иметь отношение к одному и тому же кандидату, эти случайные ошибки не имеют никакого значения.

Надо задать себе вопрос: если бы я собирался это использовать, будет ли для читателей принципиально важно иметь точное представление о том, что говорят данные именно в этом конкретном вопросе?

Совет 4: Избегайте вдаваться в излишние подробности, не зацикливайтесь на точности и аккуратности

Обратной стороной ситуации, когда вы не задаете достаточного количества вопросов, является зацикливание на излишней точности и аккуратности, в ущерб сути. Ваша исследовательская графика должна быть в общем и целом правильной, но не нужно волноваться, если у вас попадаются разные уровни округления, если они не дают в целом ровно 100%, или если у вас не хватает данных за один или два года из двадцати. Это часть исследовательского процесса. Вы по-прежнему будете способны видеть крупные тенденции, и будете знать, что еще вам нужно собрать, перед тем, как наступит время публикации.

На самом деле вы можете решить убрать все обозначения и масштабные отметки, примерно как на приведенных выше графиках, чтобы получить еще лучшее общее ощущение от данных.

Совет 5: Создавайте хронологические подборки случаев и событий

В самом начале какого-нибудь сложного проекта начинайте строить хронологию ключевых событий и моментов. Можно использовать Excel, Word или специальный инструмент типа TimeFlow для этих целей, но в какой-то момент вы наткнетесь на набор данных, который вы сможете подложить под нее. Потом, если периодически пробегаться по этой хронологии, вы сможете увидеть, где у вас есть пробелы, которые необходимо заполнить.

Совет 6: Встречайтесь с вашим графическим отделом как можно раньше и почаще

Устройте коллективное обсуждение, «мозговой штурм», решая вопрос о том, какую можно сделать графику, вместе с художниками-иллюстраторами и дизайнерами в вашем ньюсруме. Они взглянут другим взглядом на ваши данные, выскажут предположения о том, как они могут сработать в интерактивном режиме, и помогут с ноу-хау о том, как объединить данные с сюжетами и материалами. Ваша журналистская работа будет сильно облегчена, если вы будете знать, что вам нужно собрать с самого начала, или если вы сможете в экстренном порядке сообщить вашей команде подготовки, что сделать график не представляется возможным, так как вам не хватает данных.

СОВЕТЫ ДЛЯ ПУБЛИКАЦИИ

Вы могли потратить всего несколько дней или даже часов на ваше исследование, или же ваша история могла потребовать месяцев на подготовку. Но когда речь заходит о том, чтобы перейти к стадии публикации, наиболее важными становятся два момента.

Помните тот потерянный год, который вы провели, занимаясь ранними, заблаговременными исследованиями? Вдруг оказывается, что без них вы не можете двигаться дальше. Все эти плохие данные, которые вы проигнорировали в свое время? Они вернутся и будут преследовать вас.

Причина в том, что вы не можете писать на основе некачественных данных. Когда дело касается графика, то либо у вас есть все, что вам нужно, либо нет ничего. И никакой середины быть не может.

  1. Объединяйте усилия по сбору данных с интерактивной графикой

    В интерактивной графике нет никакой тайны или сокрытия. Если вы действительно собираетесь сделать так, чтобы ваши читатели изучали данные любым желаемым ими способом, тогда каждый элемент данных должен быть именно тем, чем он кажется. Пользователи в любой момент могут обнаружить какую-нибудь ошибку, и она может преследовать вас месяцы или годы.

    Если вы строите вашу собственную базу данных, это означает, что вы должны ожидать того, что вам придется ее вычитывать в плане корректуры, проверять факты, и постоянно копировать и редактировать всю базу. Если вы используете данные разных органов власти, вы должны принять решение о том, сколько выборочных проверок вы сделаете, и что вы планируете делать, когда обнаружите неизбежную ошибку.

  2. Разрабатывайте дизайн для двух типов читателей

    График — будь то в виде отдельного интерактивного элемента или в виде статичной визуализации, который сопровождает ваш материал - должен удовлетворять запросам двух разных типов читателей. Он должен быть легко понятным с первого взгляда, но при этом и достаточно сложным, чтобы предложить что-нибудь интересненькое людям, которые хотят копнуть глубже. Если вы делаете его интерактивным, убедитесь, что ваши читатели получат от этого что-то большее, чем просто цифру или название.

  3. Выражайте одну идею — потом упрощайте

    Вы уверены, что есть что-то одно, самое главное, что вы хотите, чтобы люди увидели? Тогда решите вопрос о том, какое общее впечатление, на ваш взгляд, должен получить читатель, и сделайте так, чтобы все остальное исчезло. Во многих случаях это означает удалить какую-то информацию даже когда интернет позволяет вам предоставить все. За исключением случаев, когда вашей основной целью является демонстрация прозрачности журналистской работы, бОльшая часть тех деталей и подробностей, которые вы вставили в вашу временную шкалу и хронологию, просто не очень важны. В статичной графике они будут смущать и отпугивать. В интерактивной графике это будет просто скучно.