В субботу 4 декабря 2016 года швейцарский журнал Das Magazin опубликовал расследование[1] о том, как технологии персонализированной рекламы в сети Facebook повлияли на итоги выборов в США и референдума о выходе Великобритании из ЕС. Как отмечает[2] немецкий Spiegel, многие журналисты уже стали называть расследование «текстом года». В расследовании есть все: и новейшие технологии; и универсальное оружие, которое попало из хороших рук в плохие; и ежедневная слежка за каждым из нас; и таинственные заказчики; и превращение из нищего в принца (и наоборот). The Insider 06.12.2016 опубликовал полный перевод текста с немецкого языка.
В половине девятого утра 9 ноября Михал Козинский проснулся в цюрихском отеле Sunnehus. 34-летний ученый приехал, чтобы выступить в Федеральной высшей технической школе (ETH) с докладом на конференции об опасности Big Data и так называемой «цифровой революции». С подобными лекциями Михал Козинский разъезжает по всему миру, ведь он является ведущим экспертом в психометрии — разделе психологии, основанном на анализе данных. Включив тем утром телевизор он понял: бомба разорвалась. Дональд Трамп избран президентом США, несмотря на все прогнозы социологов.
Михал Козинский долго смотрит новости о триумфе Трампа, о результатах голосования по разным штатам. Он подозревает, что произошедшее как-то связано с его научными разработками. Козинский вздыхает и выключает телевизор.
В тот же день доселе малоизвестная лондонская фирма рассылает пресс-релиз следующего содержания: «Мы поражены тем, что наш революционный подход к основанным на данных коммуникациям внес такой существенный вклад в победу Дональда Трампа». Пресс-релиз подписан неким Александром Джеймсом Эшбернером Никсом. Ему 41 год, он британец и возглавляет компанию Cambridge Analytica. Никс всегда носит костюм, модные роговые очки, а свои светлые волнистые волосы обычно зачесывает назад.
Задумчивый Козинский, прилизанный Никс и широко улыбающийся Дональд Трамп — первый сделал цифровую революцию возможной, второй осуществил ее, последний стал благодаря ей победителем.
Насколько опасна Big Data?
Сейчас каждый, кто не жил на Луне последние пять лет, знаком с термином Big Data. Этот термин значит и то, что все, что мы делаем — в интернете или «офлайн» — оставляет цифровой след. Покупка по кредитке, запрос в Google, прогулка со смартфоном в кармане, каждый лайк в соцсети: все это сохраняется. Долгое время никто не мог понять, для чего хорошего могли бы пригодиться эти данные — кроме тех случаев, когда в ленте Facebook всплывает реклама средств от гипертонии, потому что недавно мы искали в Google «как понизить давление». Непонятно было и то, чем же является Big Data для человечества — большой опасностью или большим достижением? Но с 9 ноября мы знаем на это ответ. Ведь и за предвыборной кампанией Дональда Трампа в интернете, и за кампанией в поддержку Brexit стоит одна и та же компания, исследующая Big Data: Cambridge Analytica и ее директор Александр Никс. Тот, кто хочет понять природу этих голосований (и природу того, что ожидает Европу в ближайшие месяцы), должен начать с примечательного события, произошедшего в 2014 году в британском Кембриджском университете. А именно, на кафедре психометрии Козинского.
Психометрия, которую иногда зовут психографией, представляет собой попытку измерить человеческую личность. В современной психологии стандартом является так называемый «метод океана» (по буквам OCEAN, анаграмму пяти измерений на английском языке). В 1980-е годы два психолога доказали, что каждая черта характера может быть измерена при помощи пяти измерений. Это так называемая «большая пятерка»: открытость (насколько вы готовы к новому), добросовестность (насколько вы перфекционист), экстраверсия (как вы относитесь к социуму), доброжелательность (насколько вы дружелюбны и готовы к сотрудничеству) и нейротизм (насколько легко вас вывести из себя) На основе этих измерений можно точно понимать, с каким человеком имеешь дело, в чем его желания и страхи, наконец, как он себя может вести. Проблема была в сборе данных: чтобы что-то понять о человеке, от него требовалось заполнить огромный опросник. Но потом появился интернет, затем Facebook, затем Козинский.
В 2008 году студент из Варшавы Михал Козинский начал новую жизнь: он поступил в престижный английский Кембридж, в Центр психометрии, лабораторию Кэвендиш, самую первую лабораторию по психометрии в мире. Со своими однокурсниками он придумал и запустил приложение для Facebook под названием MyPersonality. Пользователю предлагалось ответить на огромный список вопросов («легко ли вас вывести из себя в состоянии стресса? Есть ли у вас склонность критиковать окружающих?»), получив затем свой «профиль личности», а создатели приложения получали бесценные личные данные. Вместо ожидавшихся данных по дюжине однокурсников создатели получили информацию по сотням, тысячам, а затем и миллионам людей. Два докторанта собрали тем самым крупнейший «урожай» данных в истории психологических исследований.
Процесс, который Михал Козинский сотоварищи разработал за последующие несколько лет, достаточно прост. Во-первых, тестируемый получает список вопросов, онлайн-тест. Из ответов на него ученые вычисляют личные ценности испытуемого. Далее, Козинский с командой изучают действия испытуемого: лайки и репосты в Facebook, а также его пол, возраст и место жительства. Так исследователи получают связи. Из простого анализа данных в сети могут получится необычные выводы. Например, если мужчина подписан на страничку бренда косметики MAC, он с высокой вероятностью является геем. Наоборот, сильный показатель гетеросексуальности — если человек поставил лайк хип-хоп группе Wu-Tang Clan из Нью-Йорка. Поклонник Леди Гаги с высокой долей вероятности экстраверт, а человек, ставящий «нравится» философским постам — интроверт.
Михал Козинский и его коллеги беспрестанно совершенствовали свою модель. В 2012 году Козинский доказал, что анализа 68 лайков в Facebook достаточно, чтобы определить цвет кожи испытуемого (с 95% вероятностью), его гомосексуальность (88% вероятности) и приверженность Демократической или Республиканской партии США (85% вероятности). Но процесс идет дальше: интеллектуальное развитие, религиозные предпочтения, пристрастие к алкоголю, курению или наркотикам. Данные даже позволяли узнать, развелись ли родители испытуемого до его совершеннолетия или нет. Модель оказалась настолько хороша, что стало возможным предугадывать ответы испытуемого на определенные вопросы. Опьяненный успехом, Михал Козинский продолжал: скоро модель смогла лучше узнавать личность после десяти изученных лайков, нежели его коллеги по работе. После 70 лайков — лучше, чем друг. После 150 лайков — лучше, чем родители. После 300 лайков — лучше, чем партнер. С еще большим количеством изученных действий можно было бы узнать о человеке лучше, чем он сам. В день, когда Козинский опубликовал статью о своей модели, он получил два звонка: жалобу и предложение работы. Оба звонка были из компании Facebook.
Михал Козински: не big data побеждает на выборах, а сами кандидаты
До ноябрьских выборов президента США имя доцента кафедры организационного поведения Стэнфордской высшей школы бизнеса Михала Козински было известно разве что специалистам в области big data (больших данных). Группа ученых под руководством выпускника Кембриджского университета установила, что личность человека можно досконально изучить по тому, как он ведет себя в соцсетях.
После победы Дональда Трампа о методе Козински внезапно заговорили. Утверждалось, что именно он лег в основу успешной кампании республиканца, а до этого предопределил судьбу референдума о Brexit. В интервью ТАСС 34-летний уроженец Польши рассказал о своем методе, преимуществах и рисках сбора big data, открестился от участия в политических кампаниях и признал, что даже в век высоких технологий побеждают не они, а сам кандидат.
Только для друзей
Теперь на Facebook можно отмечать свои посты как открытые и приватные, «подзамочные»: во втором случае просматривать их могут лишь определенный круг друзей. Но для сборщиков данных и это не проблема. Если Михал Козинский всегда запрашивал соглашения пользователей Facebook, современные тесты требуют доступа к персональным данным как обязательного условия для их прохождения.
Но речь не только об отметках «нравится» в Facebook: Михал Козинский и команда могут оценивать людей по Большой пятерке критериев исходя из их юзерпика, фотографии в соцсетях. Или даже по числу друзей: хороший показатель экстраверсии! Но мы также сдаем личные данные, когда находимся не в сети. Датчик движения в смартфоне показывает, размахиваем ли мы рукой с ним, как далеко ездим (коррелирует с эмоциональной нестабильностью). Как замечает Козинский, смартфон — это огромный психологический опросник, который мы вольно или невольно заполняем. Что особенно важно, это работает и в обратную сторону: можно не только создавать из данных психологический портрет, вы можете искать среди этих портретов нужные. Например, обеспокоенные папаши, озлобленные интроверты, не определившиеся с выбором сторонники демократов. По сути, Козинский изобрел поисковую систему по людям.
Все явственнее Козинский понимал и потенциал, и опасность своей работы.
Всемирная сеть для него всегда казалась даром небес. Всегда хочется «вернуться», «поделиться». Это дух нового поколения, начало новой эпохи без физических границ. Но что случится, думал Козинский, если кто-то решит воспользоваться этой поисковой системой по людям, чтобы ими манипулировать? Он начинает ставить предупреждения на всех своих научных публикациях. Предупреждения о том, что его методы «могут нести угрозу благополучию, свободе или даже жизни людей». Но никто, кажется, не понимал, к чему он ведет.
Примерно в это время, в начале 2014 года, к Козинскому обратился молодой ассистент профессора по имени Александр Коган. У него был запрос от некой фирмы, заинтересованной в методе Козинского. Предложение состояло в том, чтобы проанализировать путем психометрии 10 млн американских пользователей Facebook. С какой целью, собеседник не сказал из соображений конфиденциальности. Козинский сначала согласился, ведь речь идет о больших суммах в пользу его института, но потом начал медлить с согласием. В итоге, он выжал из Когана название фирмы: SCL, Strategic Communications Laboratories («Лаборатории стратегических коммуникаций»). Козинский погуглил название компании. «Мы являемся глобальной компанией по управлению предвыборными кампаниями», — гласил сайт фирмы, предлагая маркетинг на основе психологии и логики. Фокус на влиянии на исход выборов. Козинский недоуменно щелкал по страничкам сайта, раздумывая, чем же может заниматься эта фирма в США.
|
Александр Коган |
Чего Козинский на тот момент еще не знал: за SCL стоит сложная корпоративная система, завязанная на «налоговых гаванях»: позднее это было показано в «Панамских документах» и разоблачениях Wikileaks. Часть этой системы ответственна за кризисы в развивающихся странах, другая помогала НАТО разрабатывать методы психологической манипуляции гражданами Афганистана. Одна из дочерних компаний SCL — та самая Cambridge Analytica, зловещая маленькая компания, организовавшая интернет-кампании в поддержку Brexit и Трампа.
Козинский ничего об этом не знает, но подозревает неладное. Проводив изучение, он узнал, что Александр Коган создал тайную компанию, которая ведет дела с SCL. Из документа, который есть в распоряжении Das Magazin, следует, что SCL получила данные о методе Козинского именно из рук Когана. Внезапно Козинского осенило, что Коган мог скопировать или выстроить заново его систему, чтобы затем продать ее политтехнологам из SCL. Ученый незамедлительно разрывает связь с Коганом и информирует о ситуации своего институтского начальника. Внутри института зреет конфликт, учреждение опасается за свою репутацию. Коган переехал в Сингапур, женился и начал именовать себя доктором Спектром. Козинский переехал в Штаты, начав работать в Стэнфорде.
Больше года все идет спокойно, но в ноябре 2015 года лидер радикальных сторонников Brexit Найджел Фарадж объявил[3], что его сайт подключает к работе со своей интернет-кампанией некую компанию, специализирующуюся на Big Data, а именно, Cambridge Analytica. Ключевая компетенция фирмы: политический маркетинг нового типа — так называемый «микротаргетинг» — основанный на «методе океана».
Козинский начинает получать множество писем — учитывая слова «Кембридж», «океан» и «аналитика», многие думают, что он как-то с этим связан. Однако только тогда он сам узнает о существовании такой компании. С ужасом он просматривает сайт фирмы. Кошмар стал былью: его методология используется в большой политической игре.
В июле 2016 году, уже после референдума по Brexit, на его голову начинают обрушиваться проклятия. Дескать, посмотрите, что вы сделали! Каждый раз Козинскому приходится оправдываться и доказывать, что к той фирме он не имеет никакого отношения.
Вначале Brexit, затем Трамп
Прошло десять месяцев. На календаре 19 сентября 2016 года, избирательная кампания в США в самом разгаре. Зал нью-йоркского отеля Grand Hyatt, выполненный в темно-синих тонах, наполняют гитарные риффы: играет песня Bad Moon Rising группы Creedence Clearwater Revival. Проходит ежегодный саммит Concordia, мировой экономический форум в миниатюре. Приглашены сильные мира сего, даже действующий президент Швейцарии Йоханн Шнайдер-Амманн. «Прошу приветствовать Александра Никса, директора Cambridge Analytica», — раздается приятный женский голос. На сцену поднимается долговязый мужчина в темном костюме. В зале царит тишина. Многие уже знают, что перед ними новый digital-специалист Дональда Трампа. «Скоро вы будете называть меня Мистер Brexit», — таинственно написал Дональд Трамп в своем Twitter несколькими неделями ранее. Действительно, политологи уже писали тогда о сходстве программ у Трампа и у сторонников выхода Великобритании из ЕС. И лишь немногие знали о связи Трампа с малоизвестной Cambridge Analytica.
|
Директор Cambridge Analytica Александр Никс |
До тех пор digital-кампания Трампа состояла более-менее из одного человека: Брэда Парскейла. Маркетинговый энтузиаст и основатель одного провалившегося стартапа, он создал для Трампа простенький веб-сайт за $1500. 70-летнего Трампа едва ли можно назвать человеком цифровой эпохи: на его рабочем столе даже компьютера нет. Как однажды поведала его персональная ассистентка, нет даже такого явления, как электронное письмо от Трампа. Сама ассистентка приучила его к смартфону — с которого он с тех пор льет потоки мыслей в Twitter.
Хиллари Клинтон, напротив, опиралась на наследие Барака Обамы как первого «президента соцсетей». У нее были адресные листы Демократической партии, миллионы подписчиков, поддержка Google и Dreamworks. Когда в июне 2016 года Дональд Трамп нанял Cambridge Analytica, многие в Вашингтоне скорчили мину. Иностранные чуваки в костюмах, которые ничего в этой стране не понимают? Серьезно?
«Это честь для меня, уважаемые дамы и господа, рассказывать вам сейчас о силе Big Data и психометрии в избирательной кампании», — говорил на саммите Никс. За его спиной в тот момент появился слайд с логотипом его фирмы: изображение мозга, составленное из сетей, подобно карте. «Еще пару месяцев назад Тед Круз был одним из наименее одобряемых кандидатов, — говорил блондин с английским акцентом, да таким, что присутствовавшие американцы ощущали себя подобно швейцарцам, которые слышат литературный немецкий. — Всего 40% электората знали его имя». Все присутствовавшие помнили историю стремительного взлета сенатора-консерватора Круза, едва ли не самое необъяснимое событие предвыборной гонки. Последний из серьезных оппонентов Трампа внутри Республиканской партии буквально выскочил из ниоткуда. «Ну и как же так произошло?» — вопрошал Никс. В конце 2014 года Cambridge Analytica вошла в предвыборную кампанию в США именно как советник Теда Круза, которого финансировал миллиардер Роберт Мерсер. До тех пор, утверждал Никс, предвыборные кампании велись по демографическим критериям: «Глупейшая идея, если всерьез об этом подумать: все женщины получают одинаковый месседж, потому что они одного пола, все афроамериканцы получают другой посыл, исходя из их расы». Таким дилетантским способом (и тут даже Никсу можно ничего не добавлять) вела кампанию команда Клинтон: разделить общество на формально гомогенные группы, подсказанные социологами. Теми самыми, что до самого конца отдавали ей победу.
|
Cambridge Analytica утверждает, что Тед Круз обязан ей своим успехом |
И тут Александр Никс щелкает на другой слайд: пять лиц, каждое соответствует определенному профилю личности, Большая пятерка измерений. «Мы в Cambridge Analytica разработали модель, которая позволит высчитать личность каждого совершеннолетнего гражданина США», — продолжает Никс. В зале полная тишина. Маркетинговый успех Cambridge Analytica основан на трех китах. Это психологический поведенческий анализ, основанный на «модели океана», изучение Big Data и таргетированная реклама. Последнее означает персонализированную рекламу, а также такую рекламу, которая максимально близко подстраивается под характер отдельного потребителя.
Александр Никс искренне объясняет, как его компания этим занимается (лекция доступна[4] на YouTube). Его фирма закупает персональные данные из всех возможных источников: кадастровые списки, бонусные программы, телефонные справочники, клубные карты, газетные подписки, медицинские данные. В США возможно купить почти любые персональные данные. Если вы хотите узнать, допустим, где живут женщины-еврейки, можно спокойно купить базу данных. Затем Cambridge Analytica скрещивает эти данные со списками зарегистрированных сторонников Республиканской партии и данными по лайкам-репостам в Facebook — вот и получается личный профиль по «методу океана». Из цифровых данных вдруг возникают люди со страхами, стремлениями и интересами — и с адресами проживания.
Процедура идентична разработанной Козинским модели. Cambridge Analytica также использует IQ-тесты и прочие небольшие приложения, чтобы получать осмысленные лайки от пользователей Facebook. И компания Никса делает то, от чего предостерегал Козинский: «У нас есть психограммы всех совершеннолетних американцев, это 220 млн человек. Наш контрольный центр выглядит так, прошу внимания», — говорит Александр Никс, щелкая слайды. Появляется карта Айовы, где Тед Круз собрал[5] неожиданно большое число голосов на праймериз. На карте видны сотни тысяч маленьких точек: красные и синие, по партийным цветам. Никс выстраивает критерии. Республиканцы — и синие точки исчезают. Еще не определились с выбором — точек становится меньше. Мужчины — еще меньше, и так далее. В итоге, появляется имя одного человека: с возрастом, адресом, интересами, политическими предпочтениями. Но как Cambridge Analytica обрабатывает отдельных людей своим месседжем?
В другой презентации Никс рассказал, как на примере закона о свободном распространении оружия: «Для боязливых людей с высоким уровнем нейротизма мы представляем оружие как источник безопасности. Вот, на левой картинке изображена рука взломщика, который разбивает окно. А на правой картинке мы видим мужчину с сыном, которые идут по полю с винтовками навстречу закату. Очевидно, утиная охота. Эта картинка для богатых консерваторов-экстравертов».
Как удержать электорат Клинтон от голосования
Противоречивая натура Дональда Трампа, его беспринципность и исходящая из этого целая прорва различных сообщений внезапно сыграла ему на руку: для каждого отдельного избирателя свой месседж. «Трамп действует как идеальный оппортунистский алгоритм, который опирается лишь на реакцию публики», — отмечала в августе математик Кэти О’Нил. В день третьих дебатов между Трампом и Клинтон команда Трампа отправила в соцсети (преимущественно, Facebook) свыше 175 тыс. различных вариаций посланий. Они различались лишь в мельчайших деталях, чтобы максимально точно психологически подстроиться под конкретных получателей информации: заголовки и подзаголовки, фоновые цвета, использование фото или видео в посте. Филигранность исполнения позволяет сообщениям находить отклик у мельчайших групп населения, пояснил Das Magazin сам Никс: «Таким способом мы можем дотянуться до нужных деревень, кварталов или домов, даже до конкретных людей». В квартале Маленький Гаити в Майами была запущена информация об отказе Фонда Клинтон участвовать в ликвидации последствий землетрясения в Гаити — чтобы разубедить жителей отдавать свои голоса Клинтон. Это было еще одной целью: удержать электорат Клинтон (например, сомневающихся леваков, афроамериканцев и молодых девушек) от урны для голосования, «подавлять» их выбор, по выражению одного из сотрудников Трампа. Использовались и так называемые «темные посты» Facebook: платные объявления посреди ленты новостей, которые могли попадаться только определенным группам лиц. Например, афроамериканцам показывали посты с видео, на котором Клинтон сравнивала чернокожих мужчин с хищниками.
|
Хиллари Клинтон оказалась одной из жертв антирекламы Cambridge Analytica |
«Мои дети не смогут больше объяснить, что значит рекламный плакат с одинаковым сообщением для всех и каждого», — завершает Никс свое выступление на саммите Concordia, благодарит за внимание и спускается со сцены.
Насколько американское общество в данную конкретную минуту обрабатывается специалистами Трампа, сказать трудно, ведь они крайне редко атакуют на центральных телеканалах, а чаще всего используют социальные сети и цифровое ТВ. И пока команда Клинтон, работавшая по лекалам социологов, пребывает в летаргии, в Сан-Антонио, где располагается «цифровой штаб» Трампа, возникает, по словам корреспондента Bloomberg Саши Иссенберга, «вторая штаб-квартира». Всего дюжина сотрудников Cambridge Analytica получила от Трампа в июле $100 тыс., в августе еще $250 тыс., в сентябре еще $5 млн. По подсчетам Никса, общая сумма оплаты услуг составила $15 млн.
Но и проводимые мероприятия тоже радикальны: с июля 2016 года волонтеры кампании Трампа получили приложение, которое подсказывает политические предпочтения и личностные типы жителей того или иного дома. Соответственно, волонтеры-агитаторы модифицировали свой разговор с жителями исходя из этих данных. Обратную реакцию волонтеры записывали в это же приложение — и данные отправлялись прямиком в аналитический центр Cambridge Analytica.
Фирма выделяет у американских граждан 32 психотипа, сконцентрировавшись лишь на 17 штатах. И как Козинский выяснил, что мужчины-поклонники косметики MAC скорее всего являются гомосексуалами, в Cambridge Analytica доказали, что приверженцы американского автопрома однозначно являются потенциальными сторонниками Трампа. Помимо прочего, подобные открытия помогли самому Трампу понять, какие послания где лучше всего применять. Решение предвыборного штаба сконцентрироваться в последние недели на Мичигане и Висконсине было принято на основе анализа данных. Кандидат стал моделью применения системы.
Чем занимается Cambridge Analytica в Европе?
Но насколько велико было влияние психометрии на результат выборов? Cambridge Analytica не спешит предъявлять доказательства успешности своей кампании. Вполне возможно, что это вообще вопрос без ответа. Хотя вот, есть один факт: благодаря поддержке Cambridge Analytica Тед Круз превратился из ничего в серьезнейшего конкурента Трампа на праймериз. Вот рост голосов сельских жителей. Вот сокращение электоральной активности афроамериканцев. Даже тот факт, что Трамп потратил на проект так мало денег, может говорить об эффективности персонализированного продвижения. И даже то, что он пустил три четверти рекламного бюджета в цифровую сферу. Facebook превратился в совершенное оружие и лучшего помощника на выборах, как написал в Twitter один из сподвижников Трампа. К слову, в Германии антиэлитарная «Альтернатива для Германии» имеет в Facebook больше подписчиков, чем ведущие партии ХДС и СДПГ вместе взятые.
Кроме того, ни в коей мере нельзя утверждать, что социологи, статистики, проиграли выборы, потому что сильно ошиблись со своими прогнозами. Верно обратное: статистики выиграли, но лишь те, что использовали новейшие методы. Шутка истории: Трамп постоянно критиковал эту науку, но выиграл во многом благодаря ей.
Второй победитель — компания Cambridge Analytica. Издатель главного консервативного рупора Breitbart Стив Бэннон входит также в совет директоров этой фирмы. Недавно он был назначен старшим стратегом в команде Трампа. Марион Марешаль Ле Пен, активистка французского «Национального фронта» и племянница лидера партии, уже радостно сообщила о сотрудничестве с компанией, на внутреннем корпоративном видео которой изображено совещание по теме «Италия». По словам Никса, сейчас им заинтересованы клиенты со всего мира. Уже были запросы на сотрудничество из Швейцарии и Германии.
|
Мари Ле Пен хочет стать следующим клиентом Cambridge Analytica |
Все это наблюдает и Козинский из своего кабинета в Стэнфорде. После выборов в США в университете все стоит вверх дном. На развитие событий Козинский отвечаем самым острым оружием из доступных исследователю: научным анализом. Вместе со своей коллегой Сандрой Матц он провел серию тестов, результаты которых скоро будут опубликованы. Некоторые из этих выводов, которыми ученый поделился с Das Magazin, шокируют. Например, психологическое таргетирование, подобно тому, что использовали в Cambridge Analytica, повышает число кликов на рекламе в Facebook на 60%. Вероятность же того, что после просмотра персонализированной рекламы люди перейдут к действиям (купят ту или иную вещь или проголосуют за нужного кандидата) возрастает на 1400%.
Теперь мир перевернулся: Brexit состоялся, в Америке скоро будет править Дональд Трамп. Все это началось с человека, который хотел предупредить нас об опасности. Сейчас он снова получает кучу жалоб на рабочую почту. «Нет, — говорит Михал Козинский. — Тут нет моей вины. Это не я соорудил бомбу, я лишь показал, что они существуют».
Оригинал: theins.ru – "Расследование Das Magazin: как Big Data и пара ученых обеспечили победу Трампу и Brexit | The Insider"
(06.12.2016, 01:54 (27.12.2016, 23:42))
Михал Козински: не big data побеждает на выборах, а сами кандидаты
tass.ru/opinions/interviews/3885594
(19 декабря 2016, 15:00)
В интервью ТАСС 34-летний уроженец Польши рассказал о своем методе, преимуществах и рисках сбора big data, открестился от участия в политических кампаниях и признал, что даже в век высоких технологий побеждают не они, а сам кандидат.
— Ocean, или Big Five ("Большая пятерка", модель определения личности человека на основании его пяти черт: экстраверсии, доброжелательности, добросовестности, нейротизма и открытости опыту. — Прим. ТАСС), давно существующая модель. Что именно нового вы привнесли в нее при создании своей методологии?
— Мой метод показывает, что вы можете использовать "цифровые следы" для того, чтобы раскрыть психологические особенности человека. Было много сомнений, реалистично ли это, получится ли воспроизвести эффективность тщательно разработанных опросников, возможно ли по поведению человека в Сети, его "цифровым следам" определить его личность, психологические черты.
Такой подход подвергался критике со стороны психологического сообщества. Адепты классической психологии утверждали, что люди, проходя традиционные тесты, думают о своем поведении и стараются ответить честно. В то время как, находясь в интернете, они совершают случайные действия, проанализировав которые, мы не всегда получим объективную картину.
Мои исследования показали, что это не так. Вы можете взять за основу "цифровые следы", потому что, даже когда люди думают, что все это — бессистемные вещи, это неверно. Поведение в Сети наглядно говорит об их личности.
— Чем вам не подходят традиционные опросники?
— Раньше мы оценивали человека при помощи личностных опросников, например MBTI (Майерс — Бриггс), а также при помощи тестов на интеллект, опросников, измеряющих уровень счастья, депрессии и так далее. Ocean — это еще один подход к типологии личности.
Во-первых, в опросниках есть определенные недостатки — заполняя их, очень просто солгать. Люди обычно хотят казаться лучше. Так, например, интроверту в такой стране, как США, где социальность приветствуется, будет удобнее выдать себя за экстраверта.
Во-вторых, люди могут быть неискренними, сами не отдавая себе в этом отчет. "Вы дружелюбный человек?". Ответ: "Да". "Вам нравится оттягиваться дома?" Ответ: "Да". На самом деле людям нравится говорить "да". Ну а теперь представьте, что это — опросник при устройстве на работу или на сайте знакомств. Ждать искренности от людей тут не приходится, и оказывается, что работу получает тот, кто больше других солгал. Ну и к тому же эти тесты очень дорогие и требуют много времени на обработку.
— И как помогут в этом деле "цифровые следы"?
— Я со своими коллегами пришел к выводу, что вместо того, чтобы задавать людям вопросы, достаточно просто посмотреть на их действия в Сети, чтобы получить ту же самую информацию. Вместо того, чтобы спросить: "Ты часто ходишь на вечеринки?", можно зайти на страничку в Facebook, и "цифровые следы" расскажут обо всем. Ими могут быть фото с вечеринок, приглашения на тусовки. Или, например, вместо того, чтобы спрашивать, нравится ли человеку читать, изучите, прочитывает ли он книги в интернете, покупает ли он их, обсуждает? Таким образом сегодня вы получаете возможность узнать о психологических чертах характера человека даже без его ведома.
— В рамках исследования вы опросили более 6 млн добровольцев, изучили их поведение в Сети. К каким выводам вы пришли?
— Мы пытались понять, как много можем узнать о человеке через призму его "цифровых следов", но более конкретно в рамках этого проекта — понять, можем ли мы таким образом оценить черты его личности, уровень интеллекта, политические пристрастия, сексуальную ориентацию и другие особенности. Конечно, вам не надо быть ученым, чтобы узнать, что человек республиканец, если он заходит на сайты Республиканской партии и ее политиков. Не надо быть гением, чтобы определить ориентацию человека, если он постоянно заходит на гей-сайты и читает соответствующие журналы.
Но при помощи компьютера можно свести воедино все детали — какую музыку слушает человек, какие книги читает, чему и кому он поставил "лайк". Все дело в том, насколько сильными будут получаемые сигналы. Если я скажу, что мне нравится Барак Обама, то можно будет сделать вывод, что я либерал и демократ. Если я скажу, что мне нравится определенная модель велосипеда, то вывод о моих политических пристрастиях не будет столь очевиден. Компьютеры же могут анализировать эту информацию. И внезапно самые малозначительные детали могут привести к очень верным выводам.
— Тут мы непосредственно подходим к понятию big data. Не могли бы вы рассказать о нем поподробнее?
— Для меня это такой объем данных, который человеку сложно обработать без помощи специализированной техники. И что интересно, любой объем информации может быть одновременно и большим, и маленьким. Все зависит от того, как на это посмотреть. Давайте возьмем, к примеру, фото на профиле в Facebook. На первый взгляд, информации более чем достаточно — мы можем понять, что за человек изображен, его пол, цвет кожи. Но, если взять ту же фотографию, но в очень большом разрешении, скажем, в размере 1 гигабайт, она сама по себе может стать big data. Вы сможете как под микроскопом разглядеть все детали кожи, а лицо превратится в карту большого разрешения, которую люди не смогут проанализировать так же, как это сделают машины. Если нужно сосчитать волосы на голове человека, то компьютер сделает это за секунды, а вот человеку придется непросто.
Конечно, мозг человека — в высшей степени специализированный компьютер, одна из функций которого — интерпретировать лица. Но, как свидетельствуют научные разработки, оптический нерв недостаточно широк, чтобы передать информацию обо всем, что мы видим. Таким образом, ваш глаз получает большое количество информации из окружающей среды, после чего она идет через зрительный нерв, но делает это в сжатом виде. Из-за этого много информации теряется. Мозгу предстоит расшифровать эти данные, превратив их в цельную картину.
Один пример того, как работает эта сложная машина, которой является наш мозг, — расшифровка эмоций человека по малейшим деталям: движению губ, глаз. Еще несколько лет назад компьютеры были не в состоянии этого сделать. Им не хватало вычислительных возможностей. За эти годы они прошли эволюцию, на которую человеку понадобились миллионы лет. Сегодня они способны считывать человеческие эмоции с такой же точностью, как и люди.
— Насколько высока точность вашего метода?
— Мой любимый пример — "лайки" в Facebook, потому что все их ставят, ведь у огромного числа людей есть аккаунты в этой социальной сети. Мы строим модели, основанные на языке, на анализе посещаемых интернет-сайтов, истории поисков. Один мой знакомый построил модель, основанную на том, что вы купили при помощи своей кредитной карты. Мы стараемся предсказать широкий спектр результатов: от сексуальной ориентации, политических пристрастий и религии до уровня интеллекта, употребления наркотиков, семейного статуса. Точность очень высока. Так, например, цвет кожи, пол, сексуальную ориентацию можно определить с точностью около 90%.
Для того, чтобы понять человека настолько же хорошо, как и его коллеги по работе, достаточно проанализировать 10 "лайков"; а чтобы узнать его так же хорошо, как муж или жена, нужно около 230–240 "лайков". В среднем же "в багаже" у любого пользователя соцсети есть не менее 300 нажатий на кнопку "нравится".
— А много ли среди опрошенных вами было пользователей из России?
— Из-за того, что мы задавали вопросы на английском языке, нашим исследованием в основном были охвачены англоязычные пользователи. К тому же я не могу свободно говорить по-русски, поэтому изучить российских пользователей мне не так просто. Но если российские ученые хотят изучить данные, относящиеся к пользователям из России, я открыт для сотрудничества. В нашу коллаборацию входят более 200 ученых со всего света. Они работают с собранными нами данными, и было бы здорово, если бы российские ученые также работали с нами.
— Вы разделяете точку зрения, которую иногда можно услышать, что люди сами себе создают монстра в виде социальных сетей? С одной стороны, люди живут в параллельной реальности, а с другой — ими так просто манипулировать, и их каждый шаг, каждый клик мышкой контролируется.
— Я абсолютно не разделяю эту идею. Я думаю, что мир стал намного лучше, он стал более счастливым местом благодаря цифровым средствам коммуникации и социальным сетям. Конечно, как в случае с любыми технологиями, есть связанные с ними риски, но есть и громадные преимущества. Это и возросшая взаимосвязь между людьми, и доступ к информации, и возможность общаться без контроля правительства. Потому что, даже если правительство установит контроль над одним из этих каналов, существуют другие каналы, на которые вы можете переключиться. В целом, я думаю, что преимущества с лихвой превосходят риски.
— Но риски все же есть. Не могли бы вы подробнее остановиться на них?
— Эти технологии исследуют личные привычки или выявляют интимные подробности, например сексуальную ориентацию, для большой группы людей при том, что те даже не отдают себе в этом отчет. Иногда это может представлять для них непосредственную угрозу. Если вы живете в Саудовской Аравии, где за принадлежность к сексуальным меньшинствам вас может ждать смертная казнь, то становится уже совсем не смешно, что вашу сексуальную ориентацию можно определить по вашим "лайкам".
Но эффекты от применения технологии могут быть и менее радикальными. Если я могу оценить вашу личность без вашего ведома, на основании оценки ваших "цифровых следов", то я могу адаптировать мои маркетинговые предложения таким образом, чтобы они были убедительными.
— Кстати, про маркетинговые предложения. Недавно я искал фотоаппарат в интернете, и теперь каждый раз, когда я вхожу в браузер, у меня выскакивает реклама этой самой модели фотоаппарата. Конечно, кто-то может быть счастлив от этого, но есть люди, которые чувствуют, что социальные сети преследуют их.
— Ну, если вы чувствуете, что вас преследуют, тогда вам просто не надо пользоваться ими. На мой взгляд, просто стыдно не использовать социальные сети, потому что вы теряете замечательный инструмент, который позволяет вам быть на связи с людьми. В итоге они потеряют доступ к вам, с вами будет сложнее связаться.
К тому же, если вам не нравится реклама в Facebook, вы можете просто перестать им пользоваться или установить фильтр AdBlock. Я бы не стал употреблять слово "преследовать", потому что, на мой взгляд, это слишком сильное определение.
В конце концов, вы должны отдавать себе отчет в том, что с вас не берут деньги за пользование Facebook, поэтому просмотр время от времени рекламы — это своеобразный способ поддержки развития этой платформы.
— Для того, чтобы быть более эффективными в создании психологического портрета, компании покупают данные пользователя, например, его кредитную историю. И этот рынок баз данных существует очень давно. Но тогда встает вопрос этики. Пользуясь кредитной картой, я хотел бы верить, что моя личная информация защищена.
— Вы когда-нибудь справлялись у компании, которая выдала вам кредитную карту, как она использует вашу информацию? Если бы людей это волновало, они или не пользовались бы кредитными картами, или компании не делали бы этого. Но поскольку людям все равно, то компании продолжают этим заниматься.
— Все из-за того, что никто не читает внимательно контракты?
— Есть кредитные карты для всех типов населения — для тех, кто путешествует, кто совершает покупки, кто любит заниматься дайвингом и так далее. Вы когда-нибудь видели кредитную карту, в рекламе к которой было указано, что выпустившая ее компания никогда ни с кем не поделится информацией о вас? Такого продукта на рынке нет. И лишь по одной причине — людям все равно. В этом вся проблема. Не в том, что это обслуживающие кредитные карты — компании. Вся проблема в пользователях.
— Если мы говорим про таргетирование (целевое прогнозирование) данных, когда в Сети люди получают определенную информацию, исходя из их предпочтений, их профиля, нет ли угрозы, что выдача определенной информации соответствующим группам усилит разделение на эти группы, создаст определенную кастовость в интернете?
— Если вы имеете в виду идею существования "информационных пузырей" (известная также под названием "Пузырь фильтров", Filter bubble. — Прим. ТАСС), то я в нее не верю. Я думаю, что сейчас это модная тема и люди много говорят о ней, однако я не вижу никакого подтверждения этому. Человечество всегда существовало в условиях ограниченного доступа к информации. Всегда. Если бы вы родились сто лет назад в небольшом городке, у вас была одна библиотека, один священник и ваша община. Этим ограничивался бы ваш доступ к информации. У вас не было возможности избежать этого, да к тому же люди особенно и не пытались совершить этот "побег".
Сегодня в мире от всего объема знаний, собранного человечеством, вас отделяет всего лишь один клик. Люди говорят: "Я иду в Facebook, а мне показывают новости, отражающие лишь одну политическую точку зрения". Я считаю, что это не Facebook создает вокруг вас этот "пузырь". Если вы заинтересованы всего в одном типе сообщений, Facebook распознает это и начнет готовить информацию, исходя из ваших вкусов.
Так что не стоит обвинять Facebook в том, что он не рассказывает вам о вещах, которые находятся вне вашего "пузыря". Просто, когда вы их сами игнорируете, система распознает это. Поэтому и Facebook, и другие рекомендательные системы будут показывать вам контент, исходя из ваших предпочтений и ожиданий.
— То есть вы считаете, что в конце концов, вне зависимости от того, какие технологии будут существовать в будущем, последнее слово всегда останется за человеком?
— Это сильное преувеличение. Я на самом деле не уверен в этом. Я думаю, что некоторые технологии, бесспорно, будут влиять на нас таким образом, что мы не будем полностью их контролировать. Тут у меня нет сомнений.
Но, я повторюсь, я не верю в "информационные пузыри". У людей сегодня есть восхитительный доступ к информации в таком объеме, который было невозможно ожидать раньше. Если бы вы родились в прошлом, в поселке с консервативными настроениями, вы даже не знали бы о существовании либеральных идей. С другой стороны, если бы вы родились в либеральном обществе, вы вообще никогда не услышали бы о противоположной точке зрения.
В прошлом были огромные "пузыри". Сегодня — и этот феномен очень хорошо известен в психологии — людям нравится получать информацию, которая подтверждает их точку зрения. Они не желают знакомиться с точкой зрения, противоречащей их подходам и взглядам. Почему? Потому что сложно читать то, что бросает вам вызов. Поэтому люди и не идут по этому пути.
Но сегодня вы входите в интернет, в том же Facebook собирается такое количество разных людей, есть газеты левых и правых взглядов, вы получаете легкий доступ к разносторонней информации. Людям, которые говорят, что они находятся в "информационных пузырях", можно сказать: вы всегда были в них, просто сейчас вы обратили на это внимание. От самого факта осознания этого "пузырь" сильно уменьшился, потому что сегодня у людей есть возможность выбраться за его пределы — обратиться в Wikipedia, зайти на сайт газеты или СМИ, отражающий иные точки зрения, и проверить информацию.
— В последнее время появилось несколько публикаций в СМИ о том, что ваше исследование было с успехом использовано для влияния на избирателей некоторыми политическими силами или приверженцами определенной политической идеи, например сторонниками Brexit или Дональда Трампа. Так, сообщалось, что среди фирм, показавших хорошие результаты на организации предвыборных кампаний, была Cambridge Analytica. Насколько, с вашей точки зрения, это возможно?
— Я не думаю, что мои исследования были взяты за основу. В то же время они показывали, что это возможно и что к этому нужно относиться с осторожностью. Похоже, что то, о чем я предупреждал, сейчас происходит в общественной сфере. Я уверен, что компании занимались процессами целевого прогнозирования и индивидуализации (например, рекламы, выдачи информации, подсказок при поиске в браузере. — Прим. ТАСС) в течение долгого времени. Но сами по себе эти процессы никуда не приведут. Здорово, что вы получаете рекламу и ту информацию, которая важна для вас. Но совсем не здорово, что теперь целевое прогнозирование и индивидуализация могут применяться для того, чтобы вы получали информацию без вашего на то согласия и ведома.
Возвращаясь к вопросу влияния на политические процессы, я не думаю, что на самом деле это сыграло решающую роль. Не big data побеждает на выборах, а сами кандидаты. Утверждения, что big data ответственны за победу Дональда Трампа, — это лишь попытка увести внимание от того факта, что демократы не сумели слушать других (избирателей) и привлечь их на свою сторону. Я убежден, что технологии не оказали какого-то существенного влияния на избрание Дональда Трампа.
Конечно, Cambridge Analytica и другие компании будут утверждать, что их подходы очень хорошо сработали, но, во-первых, мы не знаем этого наверняка, а во-вторых, не уверен, что они сами знают это наверняка. Оценить успех кампаний подобного типа очень сложно.
— Мы вступаем в эпоху очень важных выборов в Европе — в Германии, во Франции. Как вы только что сказали, выборы выигрывают политики, а не технологии. Но в то же время ожидаете ли вы использования методов, аналогичных Big Five, для получения преимущества в этих кампаниях?
— Я уверен, что это произойдет и что политики будут пользоваться подобными технологиями для увеличения их эффективности. Я в этом даже не сомневаюсь.
— Последние дни мы видим большое количество новостей, в которых сообщается о том, что Россия якобы повлияла на результаты американских выборов. Насколько реальной вы считаете такую возможность? Возможно ли это технически?
— Технически хакеры, конечно, могут взломать электронные системы, базы данных, это не является теоретически невозможным. Но я не думаю, что такое могло произойти. Я уверен, что руководители киберобороны Соединенных Штатов осведомлены о подобных угрозах и работают над тем, чтобы их минимизировать.
— Я понимаю, что исследование социальных сетей — это часть вашей работы. А в личной жизни вы их используете?
— Конечно, я очень много ими пользуюсь. Они позволяют мне быть в контакте с друзьями и семьей, иметь доступ к развлечениям, информации. Все это делает мир намного лучше.
Беседовал Илья Дмитрячев
Ссылки
|