Сет Стивенс-Давидовиц пришел к изучению больших данных, исследуя расизм в современном обществе для публикации статей в New York Times. Впоследствии круг его интересов расширился, и он обнаружил, что большие данные, которыми полон Интернет, могут дать совершенно неожиданную картину в самых разных сферах, о чем нечего было и мечтать двадцать лет назад. Тогда источниками данных служили социологические опросы, анкетирование, интервьюирование и прочие методы фиксации общественного мнения.
Сначала Стивенс-Давидовиц изучал запросы пользователей Google. Затем он начал изучать обращение к Википедии, профили соцсетей и даже порнографические сайты. Помимо этого, он интервьюировал ученых, журналистов и предпринимателей, питающих такой же интерес к изучению больших данных.
Автор пришел к выводу, что наши поисковые запросы говорят о нас намного больше, чем мы можем представить. То, как мы ищем цитаты, вещи, анекдоты, людей, книги или фильмы, рассказывают о наших тайных желаниях и предпочтениях, о которых мы часто не решаемся говорить вслух ни с кем – кроме Google. Набирая в поисковой строке «Мой отец меня бьет» или «Я пью», мы признаемся ему в том, чего не хотели бы открыть никому. Из этих запросов, по мнению автора, и складываются настоящие большие данные.
Все это прекрасно, но, казалось бы, причем тут ложь? Для сравнения Стивенс-Давидовиц приводит данные опроса о сексуальной жизни. Женщины говорят, что занимаются сексом примерно 55 раз в год. Исходя из данных о количестве защищённых половых контактов ученые вычислили, что они используют 1,1 млрд презервативов в год. Мужчины утверждают, что за год используют в среднем 1,6 млрд презервативов. Между тем цифры должны быть одинаковыми, так кто из них говорит правду? Информационно-измерительная компания Nielsen, отслеживающая потребительское поведение, фиксирует, что за год продается чуть меньше 600 млн презервативов. Так что лгут и мужчины, и женщины, сильно преувеличивая присутствие секса в своей жизни.
В толерантной и политкорректной Америке, как предполагают многие аналитики, давно покончено с расизмом. Но изучение запросов в Google дает другую картину. Стивенс-Давидовиц понял это, когда набрал в поисковой строке слово «ниггер», оскорбительное и неприемлемое в личном общении. Он ожидал, что объем поиска будет совсем небольшим. К своему удивлению, он обнаружил, что запрос делается настолько же часто, как слова «мигрень» или «экономист». Ищут анекдоты про афроамериканцев, но доля таких запросов небольшая. Другие набирают «тупые ниггеры» или «Я ненавижу ниггеров». Миллионы этих расистских запросов повторяются каждый год.
Когда Обама стал президентом США, СМИ комментировали это как историческое событие и восхваляли первого чернокожего президента. Но при этом примерно один из ста поисковых запросов включал «Обама Ку-клукс-клан» или «Обама ниггер». В ночь выборов регистрация на белом националистическом сайте, популярном в США, в десять раз превысила норму. В некоторых штатах было больше запросов «негр-президент», чем «первый черный президент».
Поиск в Google дал неожиданную карту расизма, распределенного по штатам. Традиционно расистские настроения были сильны в южных штатах, еще со времен войны Севера и Юга, противников и сторонников рабства. Поисковые запросы выявили, что демократический современный Север почти не отличается от консервативного республиканского Юга. Именно это обстоятельство, как считает автор, помогло политическому успеху Трампа, утверждавшего в Твиттере, что черные американцы ответственны за большинство убийств белых американцев.