10 и 11 ноября в Международном мультимедийном пресс-центре РИА Новости в Москве прошел московский этап международного хакатона Editors Lab по работе с большими данными — конкурса, на котором команды журналистов, программистов и дизайнеров соревновались в создании специализированных приложений для анализа и визуализации информации.
В интервью корреспонденту РИА Новости руководитель направления терминальных приложений МТС Дмитрий Мартемьянов, входивший в состав жюри московского этапа хакатона, рассказал о своих впечатлениях от соревнований, о наиболее интересных проектах, представленных участниками, а также о том, как оператор может использовать большие массивы данных для развития своей сети и разработки пользовательских сервисов.
— Какие общие впечатления остались у вас от московского этапа Editors Lab?
— Для меня это было очень интересное мероприятие, у которого пока нестандартный для российской действительности формат. Я знаю, что у нас уже проводятся различные хакатоны среди разработчиков, но такой был в первый раз. Все было организовано на очень высоком уровне, а мастер-классы, прошедшие в рамках соревнования, оказались очень интересными и, думаю, принесли немалую пользу участникам.
В процессе выбора команды-победителя мы с членами жюри обсудили общий уровень представленных работ и сошлись во мнении, что все проекты отличались высоким качеством исполнения. Если учесть, что достаточно много команд, включая будущих победителей, в последний момент поменяли тему проекта и, по сути, создали его с нуля за два дня, уровень всех участников был очень высоким. Я общался с организаторами соревнования, которые уже проводили хакатоны во многих странах, и они сказали, что московский этап был одним из самых успешных по качеству представленных работ.
— Какие из представленных проектов вам особенно запомнились?
— По поводу выбора победителя у жюри разногласий не было — команда журнала "Большой город" была единственной, которую все четверо судей назвали в числе лучших. Это была действительно заслуженная победа. Если говорить о моих личных впечатлениях, то мне очень понравилась команда из агентства Татар-информ. Они сделали проект хотя и регионального уровня, о местных детских садах, но обладающий очень большим потенциалом и интересный для аудитории. Я сразу увидел, как можно использовать его на практике прямо в том виде, в котором его представила команда. Особенно понравилось в этом проекте то, что команда Татар-информ взяла за основу базу, созданную самими пользователями на открытом сайте, а не какие-либо официальные статистические данные, и смогла довольно привлекательно и наглядно ее визуализировать. Понятно, что некоторая доработка проекту все-таки нужна: в той базе, которую они взяли для проекта, очень много актуального исходного материала, который можно обрабатывать для получения интересной информации и представлять в простом и удобном для использования виде. Также мне очень понравилась команда компании "Меркатор" — они показали, как можно красиво представить информацию визуально, и команда Esquire, которая подготовила хорошую работу со статистическими данными и очень логично представила результат их обработки.
— Какая ситуация складывается сейчас в России с проектами, основанными на больших данных?
— К сожалению, должен констатировать, что ситуация далека от идеальной. Во многом это обусловлено тем, что в кризисные перестроечные времена сбору статистической информации придавали небольшое значение, и за это время у нас образовался некий "провал" в информации. Но сейчас все начинают понимать ценность больших данных и важность выводов, которые можно сделать на их основе. Работа с большими данными в России активно развивается, и люди понимают необходимость собирать и обрабатывать информацию. Анализ при этом очень важен — нет никакого смысла в большом наборе данных, которые накапливаются в неудобном для использования табличном виде. Безусловно, нужно тщательно обрабатывать такие массивы, потому что даже из одной базы можно вытащить достаточно много аналитической информации, по-разному обрабатывая одни и те же данные. Можно даже сделать выводы в абсолютно разных областях, тем более если совместить различные базы данных, как это сделали на хакатоне многие участники, в частности, победители — "Большой город". Они совместили официальную статистическую базу данных по районам Москвы с базой "чекинов" из сети "ВКонтакте" и наглядно показали, что официальные границы районов не совпадают с "человеческими" границами — оказалось, что перемещение жителей подчиняется совершенно другим законам. Это наглядный пример того, что совмещая разные базы данных, можно вытащить очень интересную информацию.
Сейчас ситуация с использованием больших данных становится гораздо лучше и на уровне отдельных компаний, и на государственном уровне. Так, хотелось бы особо отметить проект "Открытая Москва", предоставляющий много данных о городской среде, из которых можно сделать много интересных выводов. Сейчас это направление активно развивается, и хотя, конечно, мы пока еще отстаем от стран Европы и США, но, на мой взгляд, быстро этот разрыв сокращаем.
— А как конкретно МТС использует большие данные в продуктах для пользователей?
— Мы запустили в сентябре совместный проект с компанией "Яндекс": теперь любой пользователь "Яндекс.Карт", который является абонентом МТС и пользуется Android-смартфоном, может прямо из приложения отправить отзыв о качестве связи в точке, где он находится, и оставить комментарий. Вся эта информация добавляется на нашу карту вместе с координатами пользователя — так как "Яндекс.Карты" часто используется совместно с GPS, то мы получаем достаточно точное позиционирование. Мы уже увидели высокий интерес пользователей к этому проекту и начали получать большое количество отзывов в этой системе, что позволило с первых дней работы выделить участки, информация о которых сразу передается в департамент управления сетью для организации оптимального покрытия. А после проведения работ мы отправляем всем абонентам, помогавшим нам найти точку, где связь нужно улучшить, информацию о проведенных работах.
Также мы планируем добавить к этой карте некоторые "позитивные" данные о местах с хорошим приемом сигнала и возможность отслеживать динамику улучшения сети в целом. Хочу отметить, что мы договорились с компанией "Яндекс" не на эксклюзивной основе, и получается, что у них есть готовое решение, которое они могут представить другим операторам. Мы надеемся, что они поддержат этот проект.
У нас есть и другие проекты, как для массового рынка, так и для бизнеса, но я пока не готов назвать их конкретно. Такие проекты в основном интересны бизнес-пользователям. Так, мы можем предоставлять интересную базу данных по потребительскому поведению и подсказать, как можно обслуживать клиентов и какие услуги было бы лучше им предложить. Вообще, в отношении больших данных достаточно сложно говорить о каких-то конкретных услугах, потому что они, как правило, основываются на какой-то выборке данных, а на основе именно больших данных лучше строить не услуги, а стратегии и большие проекты.
— Готова ли компания МТС предоставлять данные для сторонних проектов?
— Мы готовы предоставлять какие-то данные в открытый доступ, хотя, понятно, что далеко не все, так как большой процент от собираемых нами данных является конфиденциальной коммерческой информацией. Но мы готовы делиться даже частью такой информации, хотя это больше применимо к работе с бизнесом или государством. Отдельные типы данных мы готовы открывать и публично, как квартальные отчеты. Возможно, стоит подумать над тем, чтобы стандартизировать и упростить обработку такой информации. Это в конечном итоге предоставит разработчикам, работающим с исходными данными, гораздо больше возможностей по созданию проектов, доступных широкой аудитории. Чем стандартнее форматы данных, тем больше аналитики и информации может быть доступно конечному пользователю.
— Есть ли какой-то прогресс в разработке таких стандартов для данных?
— Я не буду со стопроцентной уверенностью говорить о других отраслях, но в телекоммуникационной индустрии вопросы стандартизации поднимаются достаточно давно и даже на международном уровне. Существует GSM Association (GSMA), которая объединяет всех мировых операторов и, в частности, разрабатывает механизмы получения различных данных от них. Это, например, стандартизация обращений по сетевым услугам оператора через единый интерфейс, с помощью которого разработчики могут встраивать в свои приложения или сервисы инструменты, позволяющие работать со всеми операторами, поддерживающими этот стандартизированный протокол. Для телекоммуникационной отрасли вопросы стандартов достаточно актуальны, и мы, естественно, занимаемся такими проектами. На этом рынке в идеале должен быть единый стандарт данных.
— А как сами операторы используют накопленные объемы данных?
— Четкой привязки сервисов операторов к большим данным нет, здесь, скорее, речь идет о привязке к ним стратегии развития сети и наших платформ. Например, мы можем предсказать на основе некоторой сегментации поведение пользователей: какими сервисами они будут пользоваться, сколько генерировать трафика и многое другое. Соответственно, это сильно влияет на планирование сети, в частности, нашей сети четвертого поколения на основе технологии LTE, развитие которой идет с учетом такой информации. У нас сейчас нет прямых сервисов, функционирование которых основывалось бы на больших данных, но они являются своеобразной базой для всей стратегии планирования развития компании. С помощью больших данных мы решаем вопросы развития платформ и сети, анализируем услуги, которые нам нужно запускать, и мощности, которые нам нужно наращивать, и также многое другое. По сути, большие данные лежат в основе развития компании.
— Какие направления наиболее перспективны для проектов, основанных на больших данных?
— В последнее время идет много разговоров о роли операторов на современном рынке, так как возникает множество услуг, заменяющих их функциональность: это и голосовые звонки через мобильный интернет, без использования голосовой емкости оператора, и предоставление мультимедийных сервисов на этой же основе. Можно сказать, что операторы сейчас становятся "трубой" для оказания сервисов. Такая ситуация, естественно, не очень интересна самим операторам, поэтому мы ориентируемся на концепцию так называемой smart pipe — "умной трубы", согласно которой оператор старается предложить свои аналоги сервисам, которые сейчас работают, используя его мощности, но не используют его платформу. Ситуация складывается так, что оператор всегда может предложить немного больше, чем сторонние разработчики, так как он полностью владеет своей сетью и имеет множество технологических платформ. Мы сейчас идем в сторону мобильного интернета, предоставления операторских сервисов на основе ip-сетей и ориентируемся на стратегию стимулирования потребления мобильных данных — привлечение новых пользователей мобильного интернета и стимулирование его использования у уже существующих.