Пособие по журналистике данных 1.0
Loading

Краудсорсинг данных на сервисе guardian datablog

Краудсорсинг, согласно Википедии — это «распределенный процесс решения производственных задач, который предусматривает передачу этих задач для решения широкой общественности». Далее предлагаем вам информацию, полученную в ходе интервью, взятого у Саймона Роджерса, на тему о том, как сервис Datablog газеты Guardian использовал краудсорсинг для освещения скандала, связанного с расходами членов парламента, проблемы употребления наркотиков и темы документов Сары Пэйлин.

Рис 63. A redacted copy of Stephen Pound’s incidental expenses (The Guardian)

Может случиться так, что у вас окажется огромное количество файлов, статистических документов и отчетов, которые просто невозможно обработать в одиночку. Или имеющиеся у вас материалы не открываются или имеют не тот формат, и вы ничего не можете с этим поделать. В таких ситуациях вам может помочь краудсорсинг.

У Guardian есть очень много читателей, очень много пар глаз. Если у нас есть интересный проект, по которому нам необходима помощь, то мы можем за ней обратиться. Именно это мы и сделали в деле о расходах членов парламента. У нас было 45 000 документов и очень мало времени. Наилучшим вариантом было привлечение к данной задаче наших читателей.

В результате мы получили огромное количество материалов по этому проекту. Статей было больше, чем данных. Проект оказался очень успешным с точки зрения трафика. Он очень понравился читателям.

В настоящее время мы вместе с ресурсом MixMag изучаем проблему употребления наркотиков, что также приносит феноменальные результаты. Этот проект по количеству принявших в нем участие людей превосходит даже исследование преступности в Великобритании, что само по себе просто замечательно.

Объединяет эти проекты то, что они посвящены вопросам, которые действительно волнуют людей, и поэтому люди действительно готовы тратить на них время. Краудсорсинг в значительной мере зависит от помощи одержимых людей. В проекте по расходам парламентариям был огромный прирост трафика вначале, который потом сошел на нет. Однако до сих пор люди настойчиво просматривают каждую страницу в поисках фактов и материалов для статей. Один человек просмотрел 30 000 страниц материалов. Они обладают теперь огромной информацией.

Также мы прибегли к краудсорсингу в проекте с бумагами Сары Пэйлин. И читатели снова оказали нам большую помощь в поиске материалов для статей.

С точки зрения сбора информации для статей краудсорсинг нам очень помог. Читателям это нравится, и Guardian «хорошо выглядит» в их глазах. Что же касается генерирования данных, то в этой области не так активно пользовались краудсорсингом.

Некоторые из наших краудсорсинговых проектов, показавших хорошие результаты, больше походили на старые добрые опросы. Когда вы спрашиваете людей об их опыте, об их жизни, о том, чего они добились, вы получаете реальные данные, т. к. люди не склонны их приукрашивать. Они расскажут вам то, как у них обстоят дела на самом деле. Если же вы просите людей проделать за вас вашу работу, то вы должны найти таких людей, которые предоставят вам данные, которым вы сможете доверять.

Что касается надежности данных, то, я считаю, очень хороший подход применяет проект Old Weather Они предлагают обрабатывать каждый элемент данных десяти людям, что позволяет обеспечить требуемую точность. В деле о расходах членов парламента мы пытались минимизировать риск того, что они отредактируют свои собственные отчеты в сети, чтобы выглядеть лучше. Однако обеспечить постоянную защиту от этого невозможно. Вы можете только искать определенные URL-адреса или смотреть, совершаются ли исправления из района Лондона SW1. Это довольно ненадежный способ. Данным, которые мы получали, не всегда можно было доверять. Несмотря на то, что у нас получились замечательные материалы, мы не получали в ходе проекта какие-то конкретные цифры, которые мы могли бы использовать.

Если бы я был должен дать совет журналистам, работающим в сфере данных, которые хотят использовать краудсорсинг для сбора данных, я бы рекомендовал им выбрать тему, которая действительно волнует людей и которая будет продолжать волновать их даже после того, как она сойдет с первых страниц газет. Так же можно устроить что-то вроде игры — это тоже хорошо помогает привлекать людей. Когда мы занимались проектом о расходах во второй раз, мы сделали его похожим на игру, в которой люди получали индивидуальные задания. То, что мы давали людям конкретные задачи, действительно помогло нам. Ведь когда вы просто даете людям горы информации и говорите им: «давайте, обработайте ее», то вы ставите перед ними трудную и в какой-то мере неблагодарную задачу. И поэтому, я считаю, очень важно превратить эту работу в развлечение или игру.

Интервью Саймона Роджерса, журналиста Guardian, Марианне Баучарт, блог «Data Journalism»