МОСКВА, 10 янв – РИА Новости. Система искусственного интеллекта проанализировала последние 150 лет истории Великобритании по нескольким десяткам городских газет, уловив все крупные исторические тренды и выяснив, когда футбол стал важнее политики, говорится в статье, опубликованной в журнале Proceedings of the National Academy of Sciences.
"Мы показали, что вычислительные методы могут раскрыть важную связь исторических событий и культурных трендов с содержанием большого массива текстов за определенный исторический период. С другой стороны, не все можно автоматизировать – то, насколько важными были эти связи для человечества, может выяснить только человек, и эта часть истории никогда не станет вотчиной машин", — заявил Том Лэнсдолл-Уэлфейр (Tom Landsall-Welfare) из Бристольского университета.
До начала 20 века печатная пресса была фактически единственным источником информации для большинства обывателей, однако ее роль в формировании общественного мнения и политики оставалась почти неизученной. Одна из причин — объем печатных изданий: "ручной" анализ даже нескольких десятков газет за полвека или век потребует нескольких лет, если не десятилетий непрерывной работы.
Лэнсдолл-Уэлфейр и его коллеги решили восполнить этот пробел, воспользовавшись двумя продуктами современной цивилизации – нейросетями, которые применяются для анализа баз данных и больших массивов текстов в лингвистике, и электронным архивом газет, который подготавливается частной генеалогической компанией findmypast.
Обширный архив газет findmypast помог ученым проанализировать свыше сотни местных газет и прочих периодических изданий, выходивших на территории Британии с 1800 по 1950 год. В общей сложности за это время их корреспонденты и редакторы подготовили и опубликовали примерно 35 миллионов статей и других текстов, которые содержат около 29 миллиардов слов. Это, по оценкам ученых, около 14% общего объема информации в прессе за весь указанный период.
Для анализа ученые создали систему искусственного интеллекта, которая "читала" газеты, искала в них различные ключевые слова, оценивала частоту их употребления, важность и другие параметры, интересные для историков и культурологов. Это позволило системе ИИ выделить важнейшие и самые резонансные события и раскрыть множество закономерностей, в том числе неочевидных, вытекающих из общей канвы той информации, которая публиковалась газетами в течение полутора веков.
К примеру, 1898 год стал своеобразным историческим водоразделом, при пересечении которого электричество вытеснило пар в сознании британцев. Поезда стали популярнее лошадей спустя еще четыре года. Кроме того, ИИ раскрыл четыре финансовых кризиса 19 века, произошедших в середине 20-х, 40-х, 50-х и 60-х годов.
С точки зрения социальной жизни, крупнейшие изменения произошли на рубеже веков. Начиная примерно с 1890-х годов политика стала стремительно терять в популярности, вытесняясь театром, кино, эстрадой, футболом и другими видами спорта. Перемены коснулись и национальной идентичности: в начале 20 века понятие "Англия" было постепенно вытеснено из жизни "Британией". До этого жители королевства в целом считали себя "англичанами", а не "британцами".
Лэнсдолл-Уэлфейр планирует продолжить анализ газетных данных, перейдя от более общих к более частным закономерностям – в частности, есть замысел вычислить рейтинги политиков, ученых и деятелей культуры. К примеру, уже известно, что лорд Пальмерстон, британский премьер в 1860-х годах, выдвинувший идеи "реальной политики", был более популярен в прессе, чем его главный критик Бенджамин Дизраэли, а политики в целом были более известны и воспринимались более негативно, чем ученые или деятели культуры.