• En
    Тренды

    Речевые технологии: все, что нужно знать о голосовом интернете

    Голосовые чат-боты, голосовые интерфейсы, голосовой поиск, виртуальный ассистент, подкасты и аудиосообщения, в конце концов, — голосовой контент сейчас составляет нешуточную конкуренцию текстовому и наступает на пятки видеоконтенту, а государство и бизнес повсеместно интегрируют речевые технологии. Screenlifer попытался разобраться в том, как устроен голосовой интернет и почему за ним будущее.

    Наступает третья голосовая волна

    Первой голосовой волной было радио, второй — подкасты,  третья — это аудиотехнологии, затрагивающие все сферы нашей жизни: мобильные приложения, интерфейсы и социальные сети. Лонгриды, графические изображения и видеоролики при этом никто не отменяет, но от текста и визуального контента мир все активнее стремится к контенту голосовому. 

    В государственные структуры и коммерческие организации голосовые технологии внедряются одними из первых. Управление голосом и распознавание голоса — в списке ключевых развивающихся технологий наряду с распознаванием эмоций и биометрической идентификацией. 

    Голосовые интерфейсы давно проникли в наши смартфоны, машины и дома. Миллиарды людей пользуются голосовыми помощниками для поиска, покупок и решают с их помощью бытовые вопросы. Кстати, на изоляции люди прибегают к услугам ассистентов чаще обычного, а список запросов за время пандемии расширился.

    Разработчик голосовых приложений для Amazon и Google Voxly Digital выяснил, что во время пандемии люди просят помощников развлечь и поддержать их, а также рассказать о том, что происходит в мире. Трое из пяти пользователей говорят, что голосовые помощники помогают им преодолеть изоляцию. 

    Подкасты тоже переживают волну популярности — сейчас в мире существует больше 800 000 подкастов. В России подкастеры наконец вошли в моду в 2019 году, аудитория подкастов в стране удвоилась — теперь это 5 млн человек. Подкасты в России часто исследуют темы, несвойственные традиционным СМИ, — феминизм, финансовая грамотность, экология и особенно актуальное сегодня ментальное здоровье. 

    В голосовой формат переходят и дейтинговые приложения, одно из самых известных на сегодняшний день, Wakie, позволяет знакомиться в режиме телефонного разговора. 

    Знакомый многим Tinder в ближайшее время планирует запустить в своем приложении видео-чаты. Сейчас истосковавшиеся по новым знакомствам пользователи используют для свиданий Zoom или звонки по FaceTime. 

    Спор о плюсах и минусах голосовых сообщений длится давно. И вопреки всему хейту пользователей Facebook, эта технология остается одной из самых востребованных для общения. Ее фанаты говорят, что аудиосообщения — это как телефонный звонок без каких-либо обязательств и микроподкаст от друзей одновременно. А многие миллениалы, напротив, содрогаются от настоящих звонков и предпочитают получать текстовые сообщения. 

    На основе голосовых сообщений построены многие новые социальные сети. В современном мире трудно найти время для написания больших постов и создания привлекательного визуального ряда, тогда как аудиосообщения помогают пользователям быстро делиться своим опытом, передавать идеи интонационно и живо дискутировать — в этом и заключается их феномен.

    Одна из первых социальных сетей, которая нарушила привычный формат потребления контента — HearMeOut. Это голосовое приложение, где люди и бренды делились 42-секундными войсами. В России прогремел Telegram-бот Voices of Strangers, вся его лента состоит из голосовых сообщений от незнакомцев. Во время пандемии пользователи делятся историями своих знакомств через этот бот и ведут прямые репортажи из карантина. 

    Screenlifer поговорил с сооснователем компании Fonemica и Ассоциации лабораторий по развитию искусственного интеллекта Игорем Баско о том, как госструктуры и бизнес используют голосовые технологии. 

    Screenlife / YouTube

    Окей, Google, что будет дальше?

    В 2020-х с голосовыми технологиями уже невозможно не считаться. Они влияют на то, как будет выглядеть наша рутина, рабочие процессы и бизнес-структуры. 

    Эволюция автомобильных голосовых помощников уже превратила привычную поездку в необычный опыт. Потенциал искусственного интеллекта в режиме «на ходу» развязывает нам руки — теперь во время поездки с помощью ассистента мы можем развлекаться, учиться и делать заказы. 

    Голосовые технологии стали абсолютным драйвером электронной коммерции — то есть практически любой коммерции 21 века. Представьте, что вы сможете забронировать техосмотр своего автомобиля с помощью ассистента, который находит услугу, используя контекст происходящего: вашу геолокацию и потребность. Или представьте, как проезжаете мимо театра и можете узнать доступны ли билеты на ближайшие спектакли и купить их, используя только голос. Список потенциальных возможностей безграничен. 

    Следующим большим этапом станет внедрение голосовых технологий в корпоративную культуру. Ставшие нормой домашние голосовые помощники, точнее их адаптированные под рабочие процессы коллеги, смогут отправлять электронные письма, организовывать встречи, вносить изменения в календарь. 

    Кроме этого, бизнес сможет использовать голосовые технологии для обмена информацией между сотрудниками и обучения новых сотрудников. Например, если у новичка есть стандартный вопрос о политике компании или бизнес-процедуре, он мгновенно получит нужный ему ответ от устройства голосовой активации и не станет отвлекать коллегу или руководителя.

    Согласно прогнозам, в 2021 году 25% офисных сотрудников будут использовать виртуальных помощников ежедневно. Прибавьте к этому исследованию сегодняшнюю повестку  — ограничение тактильных контактов и прикосновений к предметам в офисе на фоне пандемии становится идеей фикс.

    Использование голосовых технологий делает рабочее место привлекательным для поколений Y и Z. 59% миллениалов считают наличие современных технологий одним из наиболее важных аспектов рабочего места. 

    Мы наблюдаем за тем, как алгоритмы учатся понимать все тональные перегибы сказанного, а голос становится идентификатором личности. Как всегда, технологии не только облегчают жизнь общества, но и заставляют его формулировать новые этические нормы, касающиеся безопасности и анонимности. Это требует времени, которое спровоцирует так называемый эффект Uber или эффект Facebook — чем больше людей будут использовать речевые технологии, тем быстрее и качественней будут развиваться сервисы и новая мораль.

    Обложка: Shutterstock

    Аня Беркова

    0 комментариев
    Отменить
    Еще статьи на эту тему

    Мы и наши партнеры используем файлы cookie на нашем сайте для персонализации контента и рекламы, предоставления функций социальных сетей и анализа нашего трафика. Продолжая просмотр страниц сайта, вы принимаете условия его использования. Более подробные сведения можно посмотреть в Политике конфиденциальности.