Прослушивают ли соцсети наши разговоры? Вряд ли. Доказываем на примерах
Пару лет назад все обратили внимание на то, что алгоритмы Facebook и Instagram начали выдавать рекламу продуктов, которые пользователи не гуглили, не затрагивали в переписках, а только обсуждали с друзьями. С тех пор все отчаянно пытаются разобраться, правда ли наши смартфоны могут подслушивать разговоры и таргетировать рекламу по ключевым словам? Дарья Федоринова решила не отставать и тоже провела небольшое расследование.

История о «прослушке» смартфонами, пожалуй, есть у каждого — я не исключение. Пару лет назад, когда разговоры о прослушке только набирали обороты, подруга поставила брекеты, и мы обсуждали выравнивание зубов и идеальные улыбки. Я сказала, что, возможно, мне тоже стоило бы задуматься об исправлении прикуса, но брекеты ставить я бы не хотела. Поэтому обсуждали и альтернативные ортодонтические методы. Буквально на следующий день я увидела в Instagram рекламу лайнеров — способ исправления зубов без брекетов. Все дальнейшие объявления на тему объяснить просто — на первое увиденное я кликнула, чтобы посмотреть, во сколько же это может обойтись.
Тут я задумалась — до этого никогда не гуглила ничего по этому вопросу, только обсудила эту возможность с подругой. Первая мысль — телефон подслушивает. Вторая мысль — алгоритмы соцсетей проанализировали мои фотографии и выявили те самые недостатки прикуса. Слишком точное совпадение по времени…
Эксперименты на Западе
Одним из первых, кто привлек к этому внимание широкой общественности, был разработчик Дамиан Диез. Он провел эксперимент: вместе с семьей Дамиан пошел в поход в горы, где плохо ловил 3G, его телефон был в режиме экономии энергии. Они с двоюродным братом буквально пять минут от всего времени восхождения на гору обсуждали Bluetooth-микропроектор. При этом Дамиан слышал о его существовании впервые и уверен, что никогда не гуглил ничего подобного.
На следующий день в инстаграме его ждала реклама того самого проектора. Как разработчик, знающий принципы и алгоритмы функционирования iOS и соцсетей, он задался вопросом, как такое возможно, и пришел к выводу, что смартфон прослушивал разговор. Вслед за ним весь мир начал делиться своими загадочными историями слишком точной рекламы. При этом Facebook официально отрицает использование данных с микрофона для таргетинга рекламы.
Аргументы против
Против версии про смартфоны-шпионы говорит немало пунктов. Во-первых, представляете себе, сколько места понадобилось бы для хранения всех разговоров пользователей? The Wired подсчитал, что только для того, чтобы записать разговоры 150 миллионов юзеров в США за один день, Facebook пришлось бы выделить около 20 петабайт. При этом всего соцсеть хранит данных примерно на 300 петабайт с ежедневным приростом в 600 терабайт.
Во-вторых, такая утечка данных была бы заметна — в протоколе смартфона отображалась бы передача данных, но пока этого никому обнаружить не удалось.
В-третьих, прослушка и передача такого объема данных — не самый технически простой процесс. Она бы нагрузила процессор настолько, что это точно сказалось бы как на скорости работы смартфона, так и на времени его функционирования без подзарядки.
Более того, записанный материал пришлось бы частично хранить в памяти телефона, тогда как место, занимаемое приложениями в памяти, ясно говорит о том, что вряд ли там хранится что-то кроме загруженных переписок и фото друзей. И, наконец, стоимость рекламы в Facebook не так высока, а нарушение норм международного права в случае прослушки колоссально. Это делает риски как минимум неоправданными для детищ Цукерберга и Джобса.
Подтверждает несостоятельность теории прослушки и эксперимент, который провели сотрудники «Афиша Daily» около года назад. Журналисты попробовали говорить при своих телефонах о продуктах, которые в реальной жизни их не интересуют, и не получили почти ни одного «необъяснимого» рекламного сообщения на тему. Но если они обсуждали какие-то товары и услуги «искренне», алгоритмы срабатывали. Логично, что искренний интерес, скорее всего, подкреплен не только разговорами, но и какими-то нашими действиями и действиями друзей и близких в сети (да-да, Facebook в курсе того, с кем мы дружим, с кем видимся, даже если они не зарегистрированы в соцсети).
Как все работает на самом деле
Давайте попробуем решить эту задачу, приняв за аксиому отсутствие прослушки, и попытаемся понять, как еще Facebook может вычислять, что нам интересно, и какие данные он может для этого использовать.
Начнем с моей истории про лайнеры. Почему Instagram не обязательно было слушать мои разговоры, чтобы подсунуть релевантную рекламу? Алгоритм обработки данных мог быть следующим. Соцсети, конечно, в курсе, что подруга мне близка. Об этом говорит количество переписок. На основе cookies ее браузера Facebook без труда вычислил, что она установила брекеты (наверняка подруга уточняла в гугле, что можно есть, а что нельзя, как теперь правильно чистить зубы и так далее).
Затем, по геолокации можно понять, что мы были вместе, а значит обсуждали это событие (согласитесь, трудно не поделиться такой новостью). И, наконец, я молодая девушка, живущая в большом городе — точное попадание в ЦА индустрии красоты. Вуаля! Алгоритм хоть и не очень простой, но проще прослушки, плюс сбор этих данных Цукерберг не отрицает. Так, например, Facebook признал, что использует данные о просмотренных пользователем сериалах Netflix при составлении лент друзей.
Разберем загадочную историю Дамиана Диеза про Bluetooth-микропроектор. В своей истории он акцентирует внимание на том, что в походе был с самыми близкими людьми — с семьей, и на том, что он сам не знал о существовании какого-то конкретного проектора. Просто подумал, что было бы здорово показать видео из похода тем, кто с ними не пошел.
А кузен знал конкретный продукт. Скорее всего, узнал он о нем из интернета, и, раз точно вспомнил бренд, наверняка это произошло недавно. И вот данные двоюродного брата (мы помним, что Facebook в курсе, с кем мы близки) начинают оказывать влияние на рекламные алгоритмы в ленте самого Дамиана. Плюс по геолокации соцсети видят, что семья находится в горах — значит, они вернутся оттуда с массой фото и видео, которые захотят показать друзьям. А может даже в процессе подъема они успели выложить пару сторис. Конечно, это только догадка, но ее вполне можно считать альтернативой теории заговора.
При этом Facebook вовсю пытается продемонстрировать прозрачность своих алгоритмов. Так, в настройках, во вкладке «Ваша информация на Facebook» вы можете скачать все данные о себе, которые хранит соцсеть — от личных переписок до вашего местоположения в определенное время. Такую же функцию недавно ввели и разработчики «Вконтакте», но рекламные алгоритмы этой сети не так хорошо развиты, поэтому пока они нам менее интересны.
Не стоит забывать и о том, что человеческому мозгу присуща так называемая апофения — построение закономерностей на основе случайных, никак не связанных между собой данных. И, конечно, алгоритмы соцсетей могут ошибаться. Представляю вашему вниманию скриншот продукта, который, как посчитал Facebook, мне просто необходим.