Десятилетняя эволюция умных устройств, которые от стандартных голосовых помощников, выполняющих простые бытовые задачи, доросли до технологий, способных запоминать предпочтения пользователя и находить ответы на самые неожиданные вопросы, — яркий пример того, насколько быстро меняется наш мир. Рассказываем о том, как виртуальные ассистенты трансформировались за это время.

Применение искусственного интеллекта постепенно выходит за пределы узкого круга любителей технологий. Теперь это уже массовый продукт, который компании активно внедряют в свои сервисы, в частности, в виртуальных помощников.

Google и Microsoft уже интегрировали генеративный ИИ в своих ассистентов. Уже летом этого года выпустить ассистента на базе ИИ планирует и Amazon.

Впрочем, даже стандартные виртуальные помощники обладают весьма широким функционалом — они могут включить сказку, найти информацию в интернете и даже закрыть шторы или вскипятить чайник.

Первые ассистенты

Современные виртуальные помощники появились более 10 лет назад. Отправной точкой можно считать момент, когда компания Apple представила Siri. Этот ассистент мог проинформировать о погоде, включить песню и даже напомнить выключить плиту по голосовой команде. Это была настоящая революция — до этого ни одно устройство не могло на таком продвинутом уровне распознавать задачи.

Вскоре вслед за Apple своих виртуальных помощников представили и другие технологические компании. В 2014 году Amazon показала «говорящую» колонку Echo со встроенным ассистентом Alexa — у нее было около 50 тысяч навыков, главный из которых — управление устройствами умного дома. В частности, она могла регулировать освещение в доме, заказывать продукты с доставкой на дом и решать другие несложные бытовые задачи. Устройство получилось максимально простым в использовании, поэтому даже непродвинутый юзер мог сразу ощутить удобство умного дома. Колонка быстро стала популярной — всего за два года компании удалось продать более 5 млн устройств. После этого Google решила последовать примеру и в 2016 году представила колонку Google Home. Успех был ошеломительный — с момента выпуска компания продавала по одной колонке Google Home Mini в секунду.

Российские компании хоть и начали покорять технологию позже, но взялись за нее не менее активно. Например, в 2017 году «Яндекс» представил «Алису», которая способна поддерживать диалог. Чуть позже виртуальный ассистент появился у VK. «Маруся» может собрать список покупок, проверить надежность паролей, поиграть с детьми и предложить интересные активности, если скучно. «Сбер», в свою очередь, выпустил целое семейство виртуальных ассистентов, каждый из которых обладает уникальным характером, голосом и манерой общения. Так пользователь может сам выбрать близкого ему по духу ассистента.

Ответы согласно сценариям

Первые современные виртуальные ассистенты, такие как Siri и Alexa, работали на основе встроенных сценариев действий. Когда пользователь задавал вопрос, например «будет ли сегодня метель?», помощник сначала распознавал речь, после чего специальное программное обеспечение переводило голосовую команду в текстовый формат и отправляло запрос на обработку. Далее алгоритмы определяли тему запроса — в данном случае это погода — и искали нужную информацию в Интернете. Затем генерировался ответ, который и выдавал ассистент: «ожидается метель и до 10 градусов мороза, по ощущениям — минус 15».

За последнее десятилетие виртуальные помощники значительно усовершенствовались. Так, например, они обрели улучшенный механизм обработки и распознавания естественного языка, который позволяет четко понимать контекст запроса. Например, вы можете попросить напомнить о встрече несколькими способами: «напомни мне о встрече завтра в 11 утра» или «предупреди меня в 11 утра завтра о встрече», но помощник правильно интерпретирует ваш запрос и выполнит его.

До недавних пор ассистенты использовались лишь для выполнения простых поисковых запросов и несложных бытовых задач. Вести осмысленный диалог и высказывать собственное мнение оставалось для них непосильной задачей. Возможности виртуальных помощников расширялись благодаря увеличению количества приложений и устройств, с которыми они могут взаимодействовать, в то время как их реальные способности были ограничены. Например, включая фонарик или камеру, ассистент выполняет одну и ту же задачу, просто взаимодействуя с разными приложениями. Да, возможность запустить музыку или поставить напоминание голосом радовала пользователей, но такой однообразный функционал уже никого не мог удивить.

ГенИИ ответов

В 2022 году Chat GPT от Open AI стал сенсацией и в одночасье заставил все крупные технологические компании переориентироваться на разработку технологий генеративного искусственного интеллекта. Это тип ИИ, который способен создавать новый контент на основе данных, на которых он обучен. Осознав потенциал технологии, компании начали массово внедрять генеративный ИИ в виртуальных ассистентов. Во-первых, такая технология открыла возможность вывести помощников за рамки простых голосовых запросов. Во-вторых, добавила способность к обучению. То есть виртуальный помощник теперь сможет адаптироваться к потребностям конкретных пользователей.

Сейчас генеративный ИИ осваивают все: от небольших стартапов до крупных технологических компаний. К слову, на этот раз российские компании осознали потенциал технологии быстрее западных коллег. Так, первой в мире компанией, которая внедрила генеративный ИИ в свой голосовой помощник, стал «Яндекс». В мае 2023 года у «Алисы» вышло обновление, благодаря которому она научилась придумывать тексты, генерировать идеи и решать другие сложные задачи. А в ноябре Сбер перевел своего виртуального помощника «Салют» на нейросетевую модель GigaChat. Она обучается на огромном корпусе русскоязычных текстов, что позволяет лучше учитывать нюансы нашего языка и особенности запросов русскоязычных пользователей.

Лидеры Кремниевой долины только начинают внедрять генеративный ИИ в своих ассистентов. Осенью 2023 года Google внедрила эту технологию в свой голосовой помощник, а в Apple заявили, что Siri обзаведется генеративным ИИ этим летом.

Не все так просто

С тех пор как ажиотаж вокруг генеративного ИИ охватил мир, крупнейшие технологические компании бросили все свои ресурсы на достижение лидерства в этой сфере. При этом аппетиты индустрии настолько высоки, что многие компании готовы жертвовать технологиями и сотрудниками из других подразделения, лишь бы найти дополнительные средства. Только в январе 2024 года из 85 технологических компаний было уволено около 23 670 человек — это самый высокий показатель с марта 2023 года. Безболезненно переориентироваться на разработку сервисов со встроенным ИИ не смогла даже Apple. Меньше месяца назад компания закрыла проект по созданию self-driving автомобилей и перевела часть работавшей над ним команды на проекты по разработке генеративного ИИ.

Причина одна: чтобы создать крутую генеративную модель, требуются большие инвестиции. Внедрение технологии в виртуального помощника также требует затрат.

В то же время окупаемость всех этих вложений в краткосрочной перспективе под вопросом. Купив умную колонку, пользователь может эксплуатировать ее 5 и более лет и ничего не платить, собственно, за виртуального помощника. В результате получается, что компания тратит деньги на разработку и совершенствование виртуальных ассистентов, но получает прибыль только от продажи устройств, на которые они уже установлены, и от контентных сервисов.

Вдобавок, с появлением генеративного ИИ ассистенты становятся намного умнее. Их ответы перестают зависеть от скриптов и шаблонов: они получают возможность бесконечно придумывать идеи и выполнять другие задачи, которые ранее были под силу только человеку. По этой причине компании решили искать способы монетизации усовершенствованных ассистентов.

Так, осенью Amazon объявила, что новая версия голосового помощника Alexa Plus со встроенным генеративным ИИ появится летом 2024 года и будет доступна только по платной подписке. Привлечение дополнительных средств должно покрыть расходы компании на разработку и улучшение пользовательского интерфейса. Microsoft придерживается схожей стратегии — виртуальный помощник Copilot Pro уже доступен пользователям только в рамках платной подписки.

Google всего пару недель назад выпустила ассистента Gemini на базе искусственного интеллекта и открыла подписку на Gemini Ultra, еще более продвинутую модель помощника.

Поживем — увидим

Учитывая, что рынок генеративного ИИ сейчас оценивается в 11,3 млрд долларов, будущее виртуальных помощников выглядит многообещающе. Эксперты прогнозируют, что в скором времени они смогут лучше понимать контекст, считывать эмоции пользователя и даже менять тон голоса в зависимости от темы разговора. Говорить о том, что стандартные виртуальные помощники без встроенного генеративного ИИ полностью исчезнут, пока рано. Однако вполне возможно, что компании станут активнее вводить платные подписки на ассистентов со «сверхвозможностями». Пользователи, в свою очередь, совсем скоро смогут обзавестись помощниками, чьи возможности будут максимально приближены к человеческому интеллекту.