Пособие по журналистике данных 1.0
Loading

Журналистика данных в ВВС

Рис 15. Мир в семь миллиардов. (BBC)

Термин «журналистика данных» может охватывать ряд дисциплин и используется разными способами в новостных организациях, так что может быть полезным определить, что мы подразумеваем под «журналистикой данных» у нас в ВВС. В широком смысле термин охватывает проекты, которые используют данные, чтобы сделать одно из следующего:

  • Дать возможность читателю найти информацию, которая будет для него персонально значимой.

  • Рассказать историю или осветить тему, которая будет значимой и ранее не освещенной.

  • Помочь читателю лучше понять сложный вопрос.

Эти категории могут пересекаться, частично совпадать, и в онлайн-среде могут зачастую заиграть новыми красками благодаря определенному уровню визуализации.

Сделать это личным

На сайте BBC News мы используем данные для предоставления услуг и инструментов для наших пользователей уже ощутимо больше десяти лет.

Самый подходящий и самый последовательный пример, который мы впервые опубликовали в 1999 году – это наши рейтинги школ, в которых используются данные, ежегодно публикуемые правительством. Читатели могут найти местные школы, введя почтовый индекс, и сравнить их по ряду показателей. Журналисты, специализирующиеся на вопросах образования, также работают вместе с командой этого проекта над просмотром и отбором данных для сюжетов перед публикацией.

Когда мы начали это делать, не было официального сайта, который давал бы возможность представителям общественности исследовать данные. Но сейчас Министерство образования имеет свой собственный сопоставимый сервис, и в связи с этим наша служба переключила свое внимание скорее уже на сюжеты, создаваемые на основе этих данных, чем на сами данные.

Основной задачей в этой сфере должно быть предоставление доступа к данным, к которым имеется явный интерес со стороны общественности. Свежим примером проекта, в котором мы раскрыли большой набор данных, в обычной ситуации недоступных широкой общественности, был специальный репортаж «Все смертельные случаи на всех дорогах» (Every death on every road). Мы предоставили возможность поиска по индексу, который позволял пользователям искать и находить места, где происходили все смертельные случаи на дорогах Великобритании за последнее десятилетие.

Мы визуализировали некоторые из основных цифр и фактов, взятых из данных полиции, и, чтобы придать проекту более динамичный характер и человеческое лицо, объединились с Лондонской ассоциацией скорой помощи (London Ambulance Association) и с телерадиодепартаментом BBC London, чтобы отследить аварии в столице, когда они происходили. Результаты этого исследования сообщались в режиме онлайн, а также через Твиттер посредством хэштега #crash24, кроме того, все столкновения и аварии наносились на карту сразу, как только они происходили.

Простые инструменты

Вместе с предоставлением способов для изучения больших объемов данных, мы также добились успеха в создании простых инструментов для пользователей, которые обеспечивают выделение лично значимых фрагментов информации. Эти инструменты апеллируют в первую очередь к тем, у кого мало времени, и кто не особо захочет осуществлять длительный анализ. Возможность легко поделиться «персональным» фактом – это то, что мы начали встраивать в наши проекты в качестве стандартной функции.

Непринужденным примером данного подхода является наш материал «Мир при семи миллиардах: Каков ваш номер?» (The world at 7 billion: What’s your number?The world at 7 billion: What’s your number?), опубликованный в соответствии с официальными данными о дате, в которую население планеты превысит 7 миллиардов человек. Введя дату своего рождения, пользователь мог выяснить, какой у него самого был порядковый номер, в плане глобального населения, когда он родился, и потом поделиться этим номером через Твиттер или Facebook. В приложении использовались данные, предоставленные фондом ООН в области народонаселения. Этот проект был очень популярным, и ссылка на него стала самой популярной ссылкой в Facebook в Великобритании в 2011 году.

Еще одним свежим примером является бюджетный калькулятор BВС, который дает возможность пользователям выяснить, насколько лучше или хуже им будет жить в финансовом плане с вводом в действие нового бюджета – и затем поделиться полученной цифрой. Мы скооперировались с бухгалтерско-аудиторской компанией KPMG LLP, которая предоставила нам расчеты, основанные на данных годового бюджета, и затем мы упорно потрудились над тем, чтобы создать привлекательный интерфейс, который побудит пользователей сделать предлагаемое им задание.

Добывание данных

Но где во всем в этом журналистика? Поиск сюжетов в данных – это более традиционное определение для журналистики данных. Имеется ли тут эксклюзив, закопанный в этой базе данных? Все ли цифры точны? Они доказывают или опровергают? Все это – те вопросы, которые должен задавать себе журналист, работающий с данными, или журналист, занимающийся компьютерной журналистикой. Но можно потратить очень много времени на то, чтобы перелопатить огромные массивы данных в надежде найти что-нибудь примечательное.

В этом смысле мы обнаружили, что самым продуктивным является вариант вступить в партнерские отношения с исследовательскими группами или программами, у которых есть опыт и время на то, чтобы расследовать ту или иную историю. Информационная программа ВВС под названием «Панорама» (Panorama) потратила месяцы, работая с Центром расследовательской журналистики и собирая данные о зарплатах в государственном секторе. Результатом стал телевизионный документальный фильм и онлайн-материал в виде специального репортажа «Зарплаты в госсекторе: Цифры» (Public Sector pay: The numbers), где все данные были опубликованы и визуализированы, и сопровождались анализом - область за областью, сектор за сектором.

Вместе с партнерством с журналистами, работающими в секторе расследовательской журналистики, наличие доступа к умеющим считать и разбирающимся в математике журналистам, обладающим специальными знаниями, является жизненно важным и необходимым. Когда коллега по бизнесу нашей команды проанализировал данные о сокращении расходов, озвучиваемые правительством, он пришел к выводу, что правительственное изложение этих данных заставляет их звучать более весомо и выглядеть более значимыми и более масштабными, чем они есть на самом деле. Результатом стал эксклюзивный материал, «Извлекая смысл из данных» (Making sense of the data), дополнением к которому служила четкая и ясная визуализация, которая даже получила награду Королвеского статистического общества.

Понимание проблемы

Но журналистике данных не обязательно нужно быть эксклюзивом, который не заметил никто другой. Работа группы по визуализации данных заключается в том, чтобы объединить отличный дизайн с четким редакционным повествованием – чтобы дать пользователю убедительный и аргументированный опыт. Создание визуализационных решений на основе правильных данных может использоваться для того, чтобы дать людям лучшее понимание проблемы или сюжета, и мы часто используем этот подход в процессе создания наших сюжетов на ВВС. Одним из методов, используемых, например, в нашем проекте по отслеживанию количества подающих заявления на пособия по безработице (UK claimant count tracker), стало составление карты, данные на которой время от времени меняются, чтобы дать пользователю четкое представление о происходящих переменах.

Проект в области данных под названием «Сеть долгов еврозоны» (Eurozone debt web) исследует запутанную паутину межгосударственных долговых отношений. Этот проект помогает объяснить сложный вопрос визуально воспринимаемым способом, с использованием цветов и пропорциональных стрелок вместе с ясным и понятным текстом. Важным соображением является задача побудить пользователя исследовать проект, или следовать теме повествования, а также задача обеспечить то, чтобы он не чувствовал себя перегруженным цифрами.

Описание команды

Команда, которая занимается производством продуктов из области журналистики данных для сайта BBC News, состоит примерно из двадцати журналистов, дизайнеров и разработчиков.

Наряду с проектами в области данных и визуализациями, команда делает всю инфографику и интерактивные мультимедиа-решения на новостном вебсайте. Все вместе это образует набор сюжетной техники, который мы стали называть «визуальной журналистикой». У нас нет людей, которых отдельно идентифицируют как «журналистов данных», но весь редакционный персонал команды должен уметь пользоваться базовыми табличными приложениями, такими как Excel и Google Docs, для анализа данных.

Главным и ключевым для любых проектов в области данных являются технические навыки и советы наших разработчиков, а также навыки наших дизайнеров в области визуализации. И хотя все мы либо журналисты, либо дизайнеры, либо разработчики «в первую очередь», мы продолжаем упорно трудиться над увеличением степени нашего понимания и умения ориентироваться в профессиональных областях другого.

Ключевыми продуктами для исследования данных являются Excel, Google Docs и Fusion Tables. Команда также использовала, но в меньшей степени, базы данных MySQL и Access, и Solr для обработки бОльших массивов данных, а также пользовалась RDF и SPARQL для того, чтобы начать искать способы, которыми мы можем моделировать события с использованием технологий Linked Data. Разработчики также использовали и используют языки программирования по своему вкусу, будь то ActionScript, Python или Perl для сверки, разбора и, возможно, опровержения наборов данных, над которыми мы работаем. Perl используется также для решения некоторых издательско-публикационных задач.

Для изучения и визуализации географических данных мы используем Google, Bing Maps и Google Earth, а также сервис ArcMAP от Esri.

Для графиков мы используем приложение Adobe Suite, включая Adobe After Effects, Adobe Illustrator, Adobe Photoshop и Adobe Flash, хотя мы редко публикуем флэш-файлы сейчас на сайте, так как JavaScript, в частности, JQuery и другие библиотеки JavaScript, такие как Highcharts, Raphael и D3, все больше отвечают нашим требованиям в области визуализации данных.

Белла Харрел и Эндрю Леймдорфер, BBС