Пособие по журналистике данных 1.0
Loading

Представление данных общественности

Существует много разных способов представить ваши данные общественности - начиная с публикации наборов исходных данных вместе с информационно-аналитическими материалами, и заканчивая созданием красивых визуализаций и интерактивных веб-приложений. Мы попросили ведущих журналистов, работающих с данными, обозначить подсказки и дать советы по поводу того, как представлять данные общественности.

Визуализировать или не визуализировать?

Бывают случаи, когда данные могут рассказать историю и передать суть материала лучше слов или фотографий, вот почему такие термины как «новостное приложение» и «визуализация данных» получили статус своего рода модного словечка в столь многих ньюсрумах в последнее время. Также подпитывает интерес и небывалый урожай новых инструментов и технологий (зачастую, свободно распространяемых и бесплатных), предназначенных для того, чтобы помочь даже самым продвинутым журналистам данных создать проект в области визуализированной подачи материала.

Такие инструменты как таблицы Google Fusion (Google Fusion Tables), Many Eyes, Tableau, Dipity, и другие, облегчают задачу, будь то создание карт, графиков, диаграмм, или даже полноценных и полномасштабных приложений по работе с данными, которые до того были исключительно прерогативой специалистов. В результате в условиях, когда барьер для входа в эту область ныне уменьшился до размеров дорожного полицейского, перед журналистами теперь встал вопрос не столько о том, как превратить ваш набор данных в визуализацию, сколько о том, стоит ли это делать. Плохая визуализация данных хуже во многих отношениях, чем никакой визуализации.

Арон Пилхофер, New York Times

Использование анимированной графики

С четким, жестким сценарием, четко размеченной по времени анимацией и ясными объяснениями, анимированная графика может отлично служить решению задачи оживления сложных цифр или идей, может направлять вашу аудиторию по ходу освоения ею вашего сюжета или материала. Видео-лекции Ханса Рослинга (Hans Rosling) могут служить хорошим примером того, как данные могут воплотиться в жизнь, ожить и заиграть новыми красками, чтобы рассказать основанную на цифрах историю. И вы бы не стали, или вам не следовало бы, представлять эту графику в виде статичной картинки. Там слишком много всего происходит. А когда это выстраивается и монтируется шаг за шагом, у вас остается понимание того, как и когда авторы пришли к этому показателю. С анимированной графикой и анимированными короткими роликами вы можете усилить то, что слышит ваша аудитория из озвучки, путем объясняющих все видео- и визуализаций, что дает в итоге очень мощный и запоминающийся способ создания сюжета и рассказа истории.

Лулу Пинней,BBC

Повествуя всему миру

Наш рабочий процесс обычно начинается в Excel. Это очень простой способ быстро выяснить и решить, есть ли в данных что-нибудь интересное. Если у нас появляется ощущение, что в них что-то есть, тогда мы уже идем в редакцию информационного отдела. Нам правда повезло, так как мы сидим прямо рядом с основным новостным отделом в Guardian. Потом мы смотрим, как нам стоит визуализировать эти данные или показать их на странице. Потом мы пишем пост, который сопровождает данные. Когда я пишу, у меня обычно открыта сокращенная версия таблицы рядом с текстовым редактором. Часто я провожу небольшой анализ, когда пишу, чтобы выделить и отметить наиболее интересные моменты. Потому я публикую пост и трачу некоторое время на то, чтобы написать твит о нем, при этом пишу разным людям, и в итоге удостоверяюсь, что на этот пост есть ссылки изо всех нужных мест.

Половина трафика для некоторых из наших постов идет с «Твиттера» или с «Фэйсбука». Мы весьма гордимся тем, что среднее количество времени, которое пользователи проводят в статье в Datablog, составляет 6 минут, по сравнению с одной минутой в среднем для остальной части вебсайта Guardian. Шесть минут это весьма хороший показатель, а время, проведенное пользователем на странице, является одним из ключевых индикаторов при анализе нашего трафика.

Это также помогает убедить наших коллег в ценности и полезности того, что мы делаем. Это, а также большие основанные на данных сюжеты и материалы, которые мы создали, и которые знакомы каждому в ньюсруме: COINS, Wikileaks и британские волнения. Для проекта данных по расходам COINS у нас было 5-6 спецкорреспондентов в Guardian, которые работали над тем, чтобы представить свою точку зрения на данные, когда они были обнародованы британскими властями. У нас также была команда из еще 5-6 человек, которая работала на проектом, посвященным расходам британского правительства в размере свыше 25 000 фунтов стерлингов - в эту команду входили также хорошо известные журналисты, такие как Полли Кертис (Polly Curtis). Данные Wikileaks также совершенно очевидно были очень большими - множество историй об Ираке и Афганистане. Проект по беспорядкам в Британии также был очень большим, и набрал более 550 000 «хитов» всего за два дня.

Но речь не только о краткосрочных «хитах»: эти проекты также стали надежным источником полезной информации. Мы стараемся быть тем местом, где вы можете получить качественную, осмысленную, выразительную и достоверную информацию по темам, которые мы освещаем.

Саймон Роджерс, The Guardian

Опубликование данных

Мы часто встраиваем наши данные в наш сайт при помощи визуализации, в той форме, которая дает возможность легко скачивать наборы данных. Наши читатели могут изучать данные, лежащие в основе материалов, посредством взаимодействия в рамках визуализации, или же использовать сами исходные данные иными способами. Почему это важно? Это увеличивает степень прозрачности The Seattle Times. Мы показываем читателям те же самые данные, которые мы сами использовали для того, чтобы прийти к серьезным выводам и заключениям. А кто этим пользуется? Конечно, наши критики, а также те, кто просто интересуется поднятой темой и всеми ее ответвлениями, последствиями и вариантами развития событий. Делая данные доступными, мы также можем набрать подсказок от этих самых критиков и читателей в целом - о том, что мы, возможно, могли упустить, и что нам, возможно, стоит исследовать дальше - что очень ценно в погоне за созданием журналистских материалов, которые будут иметь значение.

Шерил Филлипс (The Seattle Times)

Открытие ваших данных

Предоставлять потребителям новостей легкий доступ к данным, которые мы использовали для нашей работы - это правильно по нескольким причинам. Читатели могут удостовериться, что мы не вымучиваем данные, чтобы прийти к несправедливым, нечестным или неправильным выводам. Делать наши данные открытыми - это традиция для общественных и социальных наук, которая позволяет исследователям повторить нашу работу. Стимулирование читателей к тому, чтобы изучать данные, может дать нам подсказки, которые могут привести к появлению дополнительных историй или сюжетов на основе данных. Наконец, участвующие в процесс читатели, интересующиеся вашими данными, весьма вероятно, будут возвращаться к вам снова и снова.

Стив Дойг (Школа журналистики Уолтера Кронкайта, Университет штата Аризона)

Создавая платформу открытых данных

В La Nación публикация открытых данных является неотъемлемой составной частью нашей деятельности в области журналистики данных. В Аргентине нет закона о свободе информации, и нет национального портала данных, поэтому мы испытываем непоколебимые убеждения в необходимости предоставления нашим читателям доступа к тем данным, которые мы используем в наших сюжетах и материалах.

Поэтому мы публикуем структурированные исходные данные на нашей интегрированной платформе Junar, а также в Google Spreadsheets. Мы намеренно даем возможность и стимулируем других повторно использовать наши данные, и мы даже немного объясняем, как это сделать, при помощи документальных и видео-инструкций.

Более того, мы представляем некоторые из этих наборов данных и визуализаций в нашем блоге данных NACION (NACION Data blog). Мы делаем это с целью продвигать, буквально-таки проповедовать данные и инструменты для публикации данных в Аргентине, а также для того, чтобы показать другим, как мы собирали наши данные, как мы использовали их, и как они могут повторно их использовать.

С тех пор, как мы открыли эту платформу в феврале 2012 года, мы получили много предложений и идей по поводу работы с наборами данных, в основном, от представителей академических кругов и разных исследователей, а также от студентов университетов, которые всякий раз выражают огромную благодарность, когда мы реагируем на их запросы созданием какого-либо решения или специального набора данных. Люди также работают с нашими данными и комментируют их в Tableau, и несколько раз наши заметки и статьи становились наиболее комментируемыми и выходили в топ этой службы. В 2011 году на нашу долю пришлось 7 из топ-100 самых просматриваемых визуализаций.

Ангелика Перальта Рамос, La Nación, Аргентина

Сделать данные более человечными и понятными

По мере того, как разговоры вокруг больших объемов данных ведутся во все более широких масштабах и начинают охватывать все более широкий набор тем, одна важная часть подозрительным образом отсутствует в таких обсуждениях - это человеческий фактор. В то время как многие из нас считают данные ни к чему не причастными, пребывающими в свободном обращении цифрами, на самом деле они представляют собой результаты измерений и оценки весьма ощутимых и осязаемых фактов (зачастую вполне человеческих). Данные привязываются к реальной жизни реальных людей, и когда мы имеем дело с цифрами, мы должны учитывать те субстанции и системы реального мира, откуда они, эти данные, поступают.

Возьмем, например, данные о местоположении, которые сейчас, прямо в данный конкретный момент, собирают сотни миллионов телефонов и иных мобильных устройств. Легко думать об этих данных (цифрах, которые фиксируют широту, долготу и время), как об эдаких цифровых «выхлопных газах», своего рода побочной информации, но на самом деле они являются дистиллированными моментами нашей личной жизненной повести, представляют собой хронологически подобранные сведения о нас. И хотя они могут казаться сухими и безжизненными, если их читать в таблице, то когда мы даем возможность людям нанести данные о самих себе на карту и вновь проиграть их, они испытывают своего рода повтор памяти, что является мощным инструментом и вписывается в рамки человеческой составляющей.

В настоящий момент данные о местонахождении используются многочисленными «третьими сторонами» - разработчиками приложений, крупными брендами и рекламщиками. В то время как «вторые стороны» (телекоммуникационные компании и диспетчеры устройств) владеют данными и хранят их, «первые стороны» в этом уравнении - вы сами - не имеют ни доступа к этой информации, ни контроля над ней. В исследовательском отделе NYTimes мы запустили предварительный проект под названием «Открытые пути» (OpenPaths - openpaths.cc) - как для того, чтобы дать людям возможность изучить свои собственные локационные данные, так и для того, чтобы на опыте изучить концепцию владения данными. В конце концов, люди должны иметь возможность контролировать эти цифры, так как они так тесно связаны с их собственной жизнью.

Журналисты играют очень важную роль в обнародовании, вытаскивании, так сказать, «на свет божий», этой присущей данным человеческой природы, человеческой составляющей. Делая это, они обладают силой, позволяющей менять общественное понимание и восприятие - как данных, так и тех систем, их которых эти данные возникли.

Джер Торп, специалист по работе с данными: Научно-исследовательский отдел New York Times

Открытые данные, открытые источники, открытые новости

2012 год вполне можно назвать годом открытых новостей. Это лежит в самом центре нашей редакционной идеологической политики и является ключевым посылом нашей нынешней брендовой политики. На фоне всего этого ясно, что нам нужен открытый процесс для журналистики в области работы с данными. Этот процесс должен не только подпитываться открытыми данными, но также обеспечиваться наличием открытых инструментов для работы с ними. К концу года мы рассчитываем иметь возможность сопровождать каждую визуализацию, которую мы публикуем, доступом как к данным, которые лежат в ее основе, так и к программе, благодаря которой она была сделана и работает.

Многие из инструментов, используемых для визуализации сегодня, являются закрытыми исходниками и программными продуктами. Другие выпускаются с ограниченными лицензиями, которые запрещают использование деривативных, производных, вторичных данных. Библиотеки открытых источников, которые сейчас существуют, часто могут решить одну проблемы, но неспособны предложить более широкую методологию. Все это вместе взятое осложняет людям задачу делать свои построения на работах друг друга. Эта проблема скорее способствует сокращению разговоров и обсуждений проектов, чем увеличению и распространению их. В связи с этим мы разрабатываем набор открытых инструментов для интерактивного рассказывания историй и создания материалов - the Miso Project (@themisoproject).

Мы обсуждаем эту работу с многочисленными медийными организациями. Требуется участие всего сообщества, чтобы осознать полный потенциал программного обеспечения с открытым исходным кодом. Если нам будет сопутствовать успех, это будет способствовать появлению совершенно иной динамики среди наших читателей. Их вклад тогда отойдет от одних лишь комментариев и станет представлять собой уже дублирование и копирование нашей работы, поиск ошибок и недочетов в нашей работе или повторное использование данных неожиданными способами.

Алистер Дант, The Guardian

Добавляем ссылку для загрузки

За последние несколько лет я успел поработать с несколькими гигабайтами данных для проектов или статей, начиная от отсканированных документов в виде печатных таблиц 1960-х годов, и заканчивая полутора гигабайтами дипломатических депеш, опубликованных Wikileaks. Всегда было трудно убедить редакторов систематически публиковать данные источников в открытом и доступном формате. Пытаясь обойти эту проблему, я добавил ссылки типа «Загрузить исходные данные» в статьи, которые вели на архивы, содержащие файлы соответствующих документов Google docs. Интерес со стороны потенциальных неоднократных пользователей совпал с тем, который мы видели в случае с финансируемыми правительством программами (т.е. был очень-очень низким). Однако несколько случаев повторного использования позволили нам получить новые сведения и стимулировали разговоры о проекте, которые вполне стоят того, чтобы потратить пару лишних минут на проект!

Николас Кайзер-Бриль, Journalism++

Знать ваши масштабы

Знайте ваш масштаб, ваш охват. Существует большая разница между тем, чтобы решать проблему программирования для удовольствия, и тем, чтобы создавать программу для определенного масштабного проекта и качественной работы. Удостоверьтесь, что вы взяли в партнеры людей, которые имеют соответствующие подходящие навыки для вашего проекта. Не забудьте про дизайн. Юзабилити, удобство использования, пользовательский интерфейс и дизайн, конструкция самой презентации, самого представления данных, могут в значительной степени сказаться на успехе или неуспехе вашего проекта.

Крис Ву, Hacks/Hackers