Всё об «Алисе»: на что способен голосовой помощник от «Яндекс»? Тест-драйв голосового помощника «Алиса» от «Яндекса.

С середины мая ленты порталов, посвящённых мобильной электронике, запестрели новостями о том, что «Яндекс» проводит испытания собственного голосового помощника — аналога «яблочного» ассистента Siri . Голосовому помощнику от «Яндекс» дали имя «Алиса» — разработчики утверждают, что в честь Алисы Селезнёвой, героини советских фильмов. Сейчас «Алиса» уже доступна всем обладателям мобильного приложения «Яндекс».

Существует весьма красноречивая статистика (собранная порталом SEO-Auditor), утверждающая, что свыше 90% отечественных юзеров ищут информацию в одной из 2-х поисковых систем – Google или «Яндекс». Системам Mail.ru и Рамблер остаются жалкие крохи внимания пользователей, а о существовании Bing и Yahoo многие российские юзеры и вовсе не подозревают.

При этом по рейтингу SEO-Auditor можно понять, что «Яндекс», существенно опережавший Google в середине 2016-го года, в 2017-ом близок к тому, что отдать «пальму первенства». Почему «Яндекс» становится слабее? Ответ прост: потому что всё больше людей лезут в интернет с мобильных устройств, и всё меньше – с ПК. На многих ли гаджетах браузер по умолчанию работает с «Яндекс»? Нет — любой Android-смартфон сразу заходит в Google.

Дабы не допустить монополии на российском рынке поисковых систем и не проиграть Google конкуренцию вчистую, «Яндекс» пытается предложить пользователям нечто, чего не дал им ещё «заморский гигант». Этим «нечто» и должен стать толковый голосовой помощник, понимающий русский язык. Google Assistant хорош, но с русским у него пока туго; Google Now весьма примитивен по сравнению, скажем, c Siri и Alexa от Amazon. «Алиса» нужна «Яндексу», чтобы поддержать популярность.

Российской компании удалось выпустить своего голосового помощника на массовый рынок раньше, чем Google Assistant заговорил на русском — а это значимая победа.

Когда вышел голосовой помощник «Алиса»?

Компания «Яндекс» официально представила «Алису» 10 октября 2017 года . Прибегнуть к услугам «Алисы» могут владельцы всех устройств с iOS и Android. На ПК с «операционкой» Windows помощник продолжает работать в бета-версии. На других ОС поисковой гигант запускать интеллектуального ассистента не спешит.

«Алиса» хорошо распознаёт речь — более того, она понимает пользователя с полуслова. Как сообщает «Яндекс», ассистентка обучена на огромном массиве текстов, а потому является настоящим эрудитом — она способна распознавать даже незавершённые вопросы, учитывая контекст сказанного ранее. В отличие от бета-версии официальная «Алиса» не имеет проблем с интонацией – говорит она голосом Татьяны Шитовой, актрисы, озвучивающей Скарлетт Йоханссон. В «Яндекс» любят привлекать к озвучке сервисов звёзд — навигатор этой компании, например, способен говорить голосом рэпера Басты.

Что умеет ассистент «Алиса» от «Яндекс»?

  • Прокладывает маршруты, находит адреса. Также программа сообщает о пробках.
  • Производит традиционный поиск в системе «Яндекс».
  • Даёт прогнозы погоды.
  • Сообщает адреса заведений – кафе, бизнес-центров, хостелов.
  • Выполняет математические действия, конвертирует валюты.
  • Запускает сторонние приложения — например, Instagram и «ВКонтакте».
  • Поддерживает диалог, а иногда даже демонстрирует музыкальную эрудицию, цитируя песни различных исполнителей – от группы «Аквариум» до Oxxxymiron.

Ожидается, что со временем многие другие крупные компании тоже дадут «Алисе» доступ к своим приложениям.

Разработчики здорово постарались, чтобы максимально «очеловечить» «Алису» — поэтому голосовой ассистент от «Яндекс» способен юморить не хуже Siri, некоторые из перлов которой стали популярными мемами. Вот как «Алиса» объясняет, почему её так зовут:

Ответы «Алисы» действительно до крайности забавны, и голос помощника звучит вполне себе естественно (куда лучше, чем в бета-версии) — благодаря технологиям машинного обучения склейки почти незаметны. Те же, кого раздражают небольшие «дефекты речи», могут отключить голос и ответы «Алисы» читать.

Как установить «Алису» на смартфон?

Загрузить «Алису» на смартфон можно, скачав и установив официальное приложение «Яндекс» из Google Play или AppStore. Следует запустить приложение и нажать на синюю клавишу с изображением микрофона, расположенную точно посреди экрана.

Появится окно переписки, где будут отображаться старые запросы и ответы, данные на них «Алисой». Снова кликнув на кнопку с иконкой микрофона, юзер сможет сделать новый голосовой запрос.

Заключение

Согласно статистике, в 2016 году в мире использовались 3.5 млрд различных устройств с голосовыми помощниками. По оценкам специалистов, к 2021 году число таких устройств может увеличиться двукратно. Статистика убеждает, что мы находимся на стадии становления мощного общемирового бренда – уже в скором времени компания, которая не подарила миру интеллектуального помощника, созданного собственноручно, будет считаться аутсайдером.

Все крупные разработчики ПО уже обзавелись голосовыми ассистентами, которые работают в разной степени эффективно: например, Apple радует своих поклонников «умницей» Siri, а Samsung , напротив, огорчает пользователей бестолковым (пока) Bixby . Компания «Яндекс» тоже не осталась в стороне – её помощник «Алиса» с точки зрения функциональности сопоставим с нынешним хитом Google Assistant.

Друзья, в октябре выполняется 3 года со дня официального выпуска Windows 10, а интегрированный в операционную систему голосовой помощник Кортана всё никак не научится говорить по-русски. До сих пор штатный виртуальный ассистент доступен лишь для 15 стран мира, куда государства постсоветского пространства не входят. Благо, в России назрел ответ западным IT-разработкам. Теперь, ребята, у нас есть отечественный голосовой помощник, который может внедряться не только в мобильные устройства, но также в Windows-компьютеры, и зовут её Алиса. Что же, друзья, давайте с ней знакомиться.

«Окей, Яндекс» вместо Кортаны

Решить проблему Кортаны 2 года назад взялся первый поисковик Рунета Яндекс и предложил русскоязычной аудитории бесплатную утилиту Яндекс.Строка, интегрирующую в панель задач Windows аналог Кортаны – поисковик с возможностью ввода голосовых команд. Яндекс.Строка создавалась прежде всего в поддержку сервисов Яндекса. В число её возможностей входили внутристенный поиск, поиск в Интернете, получение прямо в поисковой строке ответов на простые вопросы типа погоды или конвертации величин. Активировать утилиту можно было голосовым запросом «Слушай, Яндекс» или «Окей, Яндекс».

Особого впечатления на русскоязычную аудиторию Яндекс.Строка не произвела, и её создатели пришли к выводу, что проблема заключается в безликости голосового помощника. Проанализировав ошибки, компания Яндекс недавно привела утилиту к новому формату: в ней улучшен функционал и появился виртуальный персонаж по имени Алиса. Саму же обновлённую Яндекс.Строку переименовали, назвав просто и незатейливо – «Голосовой помощник для Windows». Алиса доступна не только для Windows, но также для мобильных устройств на базе iOS и Android. В скором времени планируется внедрение Алисы в Яндекс.Браузер и другие продукты первого поисковика Рунета.

Как работает Алиса

Алиса внедряется в панель задач Windows и подменяет собой штатный внутрисистемный поиск. При клике на поисковую строку в панели задач после внедрения утилиты увидим подборку иконок избранных сайтов, извлечённых из истории браузера, популярные поисковые запросы, а также кнопки взаимодействия с Алисой.

Активировать виртуальную помощницу можно кликом по значку микрофона, а также фразами – как старыми, что использовались для Яндекс.Строки, так и новыми - «Окей, Алиса», «Привет, Алиса», «Слушай, Алиса». Кнопка со значком вопроса выведет справочную информацию о её возможностях.

Как и штатный внутрисистемный поиск Windows 10, поисковой инструмент от Яндекса структурирован разделами. В разделе ниже обнаружим некий аналог меню «Пуск» с подборкой штатных программ Windows.

А в последнем разделе получим доступ к папкам пользовательского профиля.

Ну а теперь о сути – на что способна Алиса? Голосовая помощница от Яндекса может:

Заходить на известные сайты;

Запускать некоторые программы Windows;

Открывать запрашиваемую музыку на сервисах Яндекс.Музыка и Яндекс.Радио;

Выдавать прямо в чате ответы на точные вопросы по типу возможностей умной строки Яндекса;

Выключать, перезагружать и отправлять в сон компьютер;

Выдавать прямо в чате погоду, время, дату, новости, конвертированные деньги и прочие величины, информацию о городских пробках и общественных заведениях;

Прокладывать маршруты;

Формировать поисковые запросы и перенаправлять их в браузер.

Серьёзного разговора с Алисой, конечно, не получится.

При любом перевесе её возможностей виртуальная ассистентка тотчас же отправит нас в веб-поисковик. Она пока ещё многого не умеет, чему уже обучилась Кортана – запускать будильник и таймер, планировать что-то и создавать заметки в записной книжке и т.п.

Плюс к этому, детище Яндекса не всегда корректно распознаёт голосовые запросы, запускает не все программы, не обнаруживает местоположение пользователя на Windows-устройствах без GPS. Тем не мене разработчики строят насчёт новой голосовой помощницы грандиозные планы. Её проект настолько серьёзен, что сотрудники Яндекса его в числе ключевых IT-наработок продемонстрировали президенту РФ Владимиру Путину во время его визита в компанию. При тестировании Владимир Владимирович традиционно для своего амплуа спросил у ассистентки: «Тебя здесь не обижают?»

Кто такая Алиса?

Озвучила Алису известная актриса Татьяна Шитова. Именно её голос использован в голосовом движке, посредством которого виртуальная помощница общается с пользователями. Алиса – персонаж со своим характером. Изначально в компании Яндекс её планировали сделать благородной девицей, загрузив в её словарный запас литературную терминологию. Но когда поняли, что таким образом сделали ассистентку чрезмерно уж скучной, систему словарного запаса взяли из Twitter. В итоге Алиса получилась как остроумный подросток: она умеет дерзить и даже хамить на неугодные ей темы, наделена чувством юмора и импровизирует с учётом контекста заданных вопросов.


Настройки Алисы

Алиса - не во многом, но настраиваемый инструмент. Иконки сайтов на панели быстрого доступа можно сменить на другие из числа сервисов Яндекса, часто посещаемых или недавно посещённых сайтов. Также для утилиты можно:

Настроить операции с файлами – их открытие в программе или в папке проводника;

Разделить поисковой инструмент Яндекса и чат общения с Алисой двумя отдельными кнопками на панели задач Windows;

Выбрать браузер для открытия результатов поиска.

Виртуальные голосовые помощники призваны упростить наше взаимодействие с устройствами и сервисами. Вместо того чтобы блуждать по графическому интерфейсу в поисках нужного пункта меню, вы можете просто скомандовать естественным языком «Включи музыку» или «Подскажи прогноз погоды». Идеальный помощник должен правильно понять команду и выполнить её.

Технологии, которые лежат в основе таких ассистентов, пока далеки от совершенства, но уже способны впечатлять. Вы могли наблюдать их в действии, если пользовались помощниками Google Assistant, Cortana или Siri. Теперь давайте посмотрим, чем нас может порадовать « », которая недавно поселилась в приложении «Яндекс».

Синтез и распознавание речи

Хотя в голосе помощника можно без труда расслышать искусственные нотки, он звучит на порядок естественнее своего ближайшего конкурента - русскоязычной версии Siri. Для озвучивания «Алисы» привлекли актрису Татьяну Шитову. К слову, именно её голосом говорила операционная система в фильме «Она».

В плане распознавания русской речи у помощника «Яндекса» пока тоже нет равных, ошибки встречаются относительно редко. Кроме того, ассистент не просто распознаёт фразы, но и учится правильно интерпретировать их. Поэтому вы можете использовать разные формулировки и задавать последующие вопросы в контексте предыдущих - скорее всего, сервис вас поймёт:

Но промахи в интерпретации запросов пока встречаются у всех голосовых ассистентов, и «Алиса» здесь не исключение:


Интеграция со службами «Яндекса»

Другая важная особенность «Алисы», на которой делают акцент создатели, это удобная интеграция с остальными сервисами «Яндекса».

К примеру, попросите ассистента включить песню, и она заиграет в «Яндекс.Музыке». Запросите перевод фразы на другой язык - помощник откроет «Яндекс.Переводчик»:


«Алиса» также умеет отображать прогноз погоды и строить маршруты благодаря метеосервису и картам «Яндекса». А если вам понадобится найти что-либо в Сети, поможет «Яндекс.Поиск».


Взаимодействие со сторонними программами

Что касается интеграции со сторонними приложениями и службами на мобильных устройствах, то тут у «Алисы» не всё так хорошо.

Ассистент можно установить на Android и iOS, но пока «Алиса» слабо использует возможности этих платформ. Так, с её помощью вы даже не сможете быстро завести будильник, добавить напоминание или заметку. А вот Siri легко справится с этими задачами.


Хотя «Алиса» умеет открывать по запросу установленные на устройстве программы, эта функция срабатывает не всегда. Например, ассистент без проблем запускает «ВКонтакте» и Telegram, но если попросить его открыть Viber, то вместо приложения помощник направит вас на сайт этого мессенджера. На команду «открыть калькулятор» ассистент реагирует странно.


Кроме того, чтобы обратиться к «Алисе», нужно сначала войти в приложение «Яндекс» и нажать на кнопку помощника (или воспользоваться ярлыком для быстрого доступа, если у вас Android). Это не очень удобно, ведь одна из главных задач голосового ассистента - позволить вам управлять устройством без рук. Та же Siri за счёт глубокой интеграции с iOS может принимать команды, даже когда экран заблокирован.

«Алиса» на компьютере

Ассистент «Яндекса» также доступен для компьютеров под управлением Windows в виде отдельной программы. После её установки на панели задач появляется поисковая строка и кнопка для голосового взаимодействия с помощником.

Помимо функций, представленных в мобильной версии, «Алиса» для Windows умеет искать файлы на жёстком диске, запускать настольные программы, выключать компьютер или переводить его в спящий режим.

  • Машинное обучение ,
  • Поисковые технологии ,
  • Разработка мобильных приложений
  • В будущем, как нам кажется, люди будут взаимодействовать с устройствами с помощью голоса. Уже сейчас приложения распознают точные голосовые команды, заложенные в них разработчиками, но с развитием технологий искусственного интеллекта они научатся понимать смысл произвольных фраз и даже поддерживать разговор на любые темы. Сегодня мы расскажем читателям Хабра о том, как мы приближаем это будущее на примере Алисы – первого голосового помощника, который не ограничивается набором заранее заданных ответов и использует для общения нейронные сети.

    Несмотря на кажущуюся простоту, голосовой помощник – один из самых масштабных технологических проектов Яндекса. Из этого поста вы узнаете, с какими сложностями сталкиваются разработчики голосовых интерфейсов, кто на самом деле пишет ответы для виртуальных помощников, и что общего у Алисы с искусственным интеллектом из фильма «Она».

    На заре своего существования компьютеры в основном применялись на крупных научных или оборонных предприятиях. Про голосовое управление тогда размышляли лишь фантасты, а в реальности операторы загружали программы и данные с помощью куска картона. Не самый удобный способ: одна ошибка, и все нужно начинать сначала.

    С годами компьютеры становятся доступнее и начинают применяться в компаниях поменьше. Специалисты управляют ими с помощью текстовых команд, вводимых в терминале. Хороший, надежный способ – он применяется в профессиональной среде и по сей день, но требует подготовки. Поэтому когда компьютеры стали появляться в домах обычных пользователей, инженеры принялись искать более простые способы взаимодействия машины и человека.

    В лаборатории компании Xerox зарождается концепция графического интерфейса WIMP (Windows, Icons, Menus, Point-n-Click) – массовое применение она нашла в продуктах уже других компаний. Заучивать текстовые команды для управления домашним компьютером больше не требовалось - им на смену пришли жесты и клики мышью. Для своего времени это было настоящей революцией. И теперь мир приближается к следующей.

    Теперь почти у каждого в кармане лежит смартфон, вычислительных мощностей которого достаточно, чтобы посадить корабль на Луну. Мышь и клавиатуру заменили пальцы, но ими мы совершаем все те же жесты и клики. Это удобно делать, сидя на диване, но не в дороге или на ходу. В прошлом для взаимодействия с компьютерными интерфейсами человеку приходилось осваивать язык машин. Мы верим, что сейчас пришло время научить устройства и приложения общаться на языке людей. Именно эта идея легла в основу голосового помощника Алиса.

    У Алисы можно спросить [Где поблизости выпить кофе?], а не диктовать что-то вроде [кофейня улица космонавтов]. Алиса заглянет в Яндекс и предложит подходящее место, а на вопрос [Отлично, а как туда пройти?] - даст ссылку на уже построенный маршрут в Яндекс.Картах. Она умеет отличать точные фактовые вопросы от желания увидеть классическую поисковую выдачу, хамство – от вежливой просьбы, команду открыть сайт – от желания просто поболтать.

    Может даже показаться, что где-то в облаке работает нейронная чудо-сеть, которая в одиночку решает любые задачи. Но в реальности за любым ответом Алисы скрывается целая цепочка технологических задач, решать которые мы учимся уже 5 лет. И начнем мы свой экскурс с самого первого звена – со способности слушать.

    Привет, Алиса

    Искусственный интеллект из научной фантастики умеет слушать – людям не приходится нажимать на специальные кнопки, чтобы включить «режим записи». А для этого нужна голосовая активация – приложение должно понимать, что человек к нему обращается. Сделать это не так легко, как может показаться.

    Если вы просто начнете записывать и обрабатывать на сервере весь входящий звуковой поток, то очень быстро разрядите батарейку устройства и потратите весь мобильный трафик. В нашем случае это решается с помощью специальной нейронной сети, которая обучена исключительно на распознавание ключевых фраз («Привет, Алиса», «Слушай, Яндекс» и некоторых других). Поддержка ограниченного числа таких фраз позволяет выполнять эту работу локально и без обращения к серверу.

    Если сеть обучается понимать лишь несколько фраз, вы могли бы подумать, что сделать это достаточно просто и быстро. Но нет. Люди произносят фразы далеко не в идеальных условиях, а в окружении совершенно непредсказуемого шума. Да и голоса у всех разные. Поэтому для понимания лишь одной фразы необходимы тысячи обучающих записей.

    Даже небольшая локальная нейронная сеть потребляет ресурсы: нельзя просто взять и начать обрабатывать весь поток с микрофона. Поэтому на передовой применяется менее тяжеловесный алгоритм, который дешево и быстро распознает событие «началась речь». Именно он включает нейросетевой движок распознавания ключевых фраз, который в свою очередь запускает самую тяжелую часть – распознавание речи.

    Если для обучения лишь одной фразе необходимы тысячи примеров, то вы можете себе представить, насколько трудоемко обучить нейросеть распознаванию любых слов и фраз. По этой же причине распознавание выполняется в облаке, куда передается звуковой поток, и откуда возвращаются уже готовые ответы. Точность ответов напрямую зависит от качества распознавания. Именно поэтому главный вызов – научиться распознавать речь настолько же качественно, насколько это делает человек. Кстати, люди тоже совершают ошибки. Считается, что человек распознает 96-98% речи (метрика WER). Нам удалось добиться точности в 89-95%, что уже не только сопоставимо с уровнем живого собеседника, но и уникально для русского языка.

    Но даже идеально преобразованная в текст речь ничего не будет значить, если мы не сможем понять смысл сказанного.

    Какая погода завтра в Питере?

    Если вы хотите, чтобы ваше приложение выводило прогноз погоды в ответ на голосовой запрос [погода], то здесь все просто – сравниваете распознанный текст со словом «погода» и если получаете совпадение, выводите ответ. И это очень примитивный способ взаимодействия, потому что в реальной жизни люди задают вопросы иначе. Человек может спросить у помощника [Какая погода завтра в Питере?], и тот не должен растеряться.

    Первое, что делает Алиса при получении вопроса, это распознает сценарий. Отправить запрос в поиск и показать классическую выдачу с 10 результатами? Поискать один точный ответ и сразу выдать его пользователю? Совершить действие, например открыть сайт? А, может, просто поговорить? Невероятно сложно научить машину безошибочно распознавать сценарии поведения. И любая ошибка здесь малоприятна. К счастью, у нас есть вся мощь поисковой машины Яндекса, которая каждый день сталкивается с миллионами запросов, ищет миллионы ответов и учится понимать, какие из них хорошие, а какие – нет. Это огромная база знаний, на основе которых можно обучить еще одну нейронную сеть – такую, которая бы с высокой вероятностью «понимала», чего именно хочет человек. Ошибки, конечно же, неизбежны, но их совершают и люди.

    С помощью машинного обучения Алиса «понимает», что фраза [Какая погода завтра в Питере?] – это запрос погоды (кстати, это заведомо простой пример для наглядности). Но о каком городе идет речь? На какую дату? Здесь начинается этап извлечения из пользовательских реплик именованных объектов (Named Entity Recognition). В нашем случае важную информацию несут два таких объекта: «Питер» и «завтра». И Алиса, у которой за плечами стоят поисковые технологии, «понимает», что «Питер» – синоним «Санкт-Петербурга», а «завтра» – «текущая дата + 1».

    Естественный язык – не только внешняя форма наших реплик, но и их связность. В жизни мы не обмениваемся короткими фразами, а ведем диалог – он невозможен, если не помнить контекст. Алиса его помнит – это помогает ей разбираться со сложными лингвистическими явлениями: например, справляться с эллипсисом (восстанавливать пропущенные слова) или разрешать кореференции (определять объект по местоимению). Так, если спросить [Где находится Эльбрус?], а потом уточнить [А какая у него высота?], то помощник в обоих случаях найдет верные ответы. А если после запроса [Какая погода сегодня?] спросить [А завтра?], Алиса поймет, что это продолжение диалога про погоду.

    И кое-что еще. Помощник должен не только понимать естественный язык, но и уметь говорить на нем – как человек, а не как робот. Для Алисы мы синтезируем голос, в оригинале принадлежащий актрисе дубляжа Татьяне Шитовой (официальный голос Скарлетт Йоханссон в России). Она озвучивала искусственный интеллект в фильме «Она» , хотя вы могли запомнить ее и по озвучке чародейки Йеннифэр в «Ведьмаке». Причем речь идет о достаточно глубоком синтезе с применением нейронных сетей, а не о нарезке готовых фраз – записать все их многообразие заранее невозможно.

    Выше мы описали особенности естественного общения (непредсказуемая форма реплик, отсутствующие слова, местоимения, ошибки, шум, голос), с которыми нужно уметь работать. Но у живого общения есть еще одно свойство – мы далеко не всегда требуем от собеседника конкретного ответа или действия, иногда нам просто хочется поговорить. Если приложение будет отправлять такие запросы в поиск, то вся магия разрушится. Именно поэтому популярные голосовые ассистенты используют базу редакторских ответов на популярные фразы и вопросы. Но мы пошли еще дальше.

    А поболтать?

    Мы научили машину отвечать на наши вопросы, вести диалог в контексте определённых сценариев и решать задачи пользователя. Это хорошо, но можно ли сделать ее менее бездушной и наделить человеческими свойствами: дать ей имя, научить рассказывать о себе, поддерживать разговор на свободные темы?

    В индустрии голосовых помощников эта задача решается с помощью редакторских ответов. Специальная команда авторов берет сотни наиболее популярных у пользователей вопросов и пишет по несколько вариантов ответов на каждый. В идеале это нужно делать в едином стиле, чтобы из всех ответов складывалась цельная личность помощника. Для Алисы мы тоже пишем ответы – но у нас есть кое-что еще. Кое-что особенное.

    Помимо топа популярных вопросов существует длинный хвост из низкочастотных или даже уникальных фраз, на которые заранее подготовить ответ невозможно. Вы уже догадались, с помощью чего мы решаем эту проблему, не так ли? С помощью еще одной нейросетевой модели. Для ответов на неизвестные ей вопросы и реплики Алиса использует нейросеть, обученную на огромной базе текстов из интернета, книг и фильмов. Знатоков машинного обучения, возможно, заинтересует то, что начинали мы с 3-слойной нейронной сети, а теперь экспериментируем с огромной 120-слойной. Детали прибережем для специализированных постов, а здесь скажем, что уже текущая версия Алисы старается отвечать на произвольные фразы с помощью «нейросетевой болталки» – так мы ее называем внутри.

    Алиса учится на огромном количестве самых разных текстов, в которых люди и персонажи далеко не всегда ведут себя вежливо. Нейросеть может научиться совсем не тому, чему мы хотим ее научить.

    – Закажи мне сэндвич.
    – Обойдетесь.

    Как и любого ребенка, Алису нельзя научить не хамить, ограждая ее от всех проявлений хамства и агрессии – то есть обучая нейросеть на «чистой» базе, где нет грубостей, провокаций и прочих неприятных вещей, часто встречающихся в реальном мире. Если Алиса не будет знать о существовании подобных выражений, она будет отвечать на них бездумно, случайными фразами – для неё они останутся неизвестными словами. Пусть лучше она знает, что это такое – и выработает определённую позицию по этим вопросам. Если ты знаешь, что такое мат, ты можешь либо ругнуться в ответ, либо сказать, что не станешь разговаривать с ругающимся. И мы моделируем поведение Алисы так, чтобы она выбирала второй вариант.

    Бывает так, что сама по себе реплика Алисы вполне нейтральна, но вот в контексте, заданном пользователем, ответ перестаёт быть безобидным. Однажды, еще во время закрытого тестирования, мы попросили пользователя найти какие-то заведения – кафе или что-то подобное. Он сказал: «Найди другое такое же». И в этот момент в Алисе случился баг, и она вместо запуска сценария поиска организации дала довольно дерзкий ответ – что-то вроде «на карте поищи». И не стала ничего искать. Пользователь сначала удивился, а потом удивил и нас, похвалив поведение Алисы.

    Когда Алиса использует «нейросетевую болталку», в ней может проявиться миллион разных личностей, так как нейросеть вобрала в себя немного от автора каждой реплики из обучающей выборки. В зависимости от контекста Алиса может быть вежливой или грубой, жизнерадостной или депрессивной. Мы же хотим, чтобы персональный помощник представлял собой целостную личность со вполне определенным набором качеств. Здесь на помощь приходят наши редакторские тексты. Их особенность в том, что они изначально написаны от лица той личности, которую мы хотим воссоздать в Алисе. Получается, что можно продолжать обучать Алису на миллионах строк случайных текстов, но отвечать она будет с оглядкой на эталон поведения, заложенный в редакторских ответах. И это то, над чем мы уже работаем.

    Алиса стала первым известным нам голосовым помощником, который старается поддерживать общение не только с помощью редакторских ответов, но и используя обученную нейронную сеть. Конечно же, мы еще очень далеки от того, что изображают в современной фантастике. Алиса не всегда точно распознает суть реплики, что влияет на точность ответа. Поэтому работы у нас еще много.

    Мы планируем сделать Алису самым человекоподобным помощником в мире. Привить ей эмпатию и любознательность. Сделать её проактивной – научить ставить цели в диалоге, проявлять инициативу и вовлекать собеседника в разговор. Сейчас мы одновременно и в самом начале пути, и на переднем крае наук, изучающих эту область. Чтобы двигаться дальше, придется этот край подвинуть.

    Алиса – приложение, которое выпустила компания Яндекс 10 октября 2017 года. Это голосовой помощник для компьютера и смартфонов iOS, Android, а о том можно ли включить Алису в Яндекс.Браузере я расскажу далее. Ассистент имеет все функции полноценного поиска от Яндекс, но дополнен большим набором функций, среди которых:

    Как заявляет компания Яндекс, Алиса – первое приложение в своем роде, которое не использует заранее «заученные слова и фразы». Приложение интерпретирует голос пользователя, виртуально ищет ответ в Яндекс поиске и при помощи чтения текста отвечает на поставленный вопрос. В связи с этим ее можно обучить, выбирая, понравился ли вам ответ Алисы на заданный вопрос, была ли полезная информация. Так при помощи корректировки с каждым разом голосовой помощник Алиса будет становиться все умнее и удобнее для вас.

    В связи с огромным интересом к приложению пользователи готовы уже сегодня установить его в свой браузер. На вопрос, как активировать Алису в Яндекс.Браузере можно ответить так. После недавних обновлений Яндекс.Браузера помощник Алиса встроена в него и включать ассистент нет необходимости. Установите браузер с Alice https://browser.yandex.ru/alice/1 .

    Версия голосового помощника Алиса для ПК и смартфона

    Алиса пока не может встраиваться в Яндекс.Браузер, зато она может поселиться в вашем смартфоне или телефоне. Чтобы воспользоваться помощником на своем смартфоне Android или iPhone, необходимо установить один из сервисов Яндекс: погода, карты. Как утверждают разработчики, в будущем приложение сможет работать и взаимодействовать с различными приложениями. Чтобы воспользоваться приложение Алиса для Android:

    1. Откройте на своем смартфоне Google Play .
    2. Установите поиск себе в телефон.
    3. Установить можно и другие приложения от Яндекс, перечисленные выше.

    Чтобы испробовать приложение для ПК с операционной системой Виндовс, нужно зайти на страницу с приложением https://alice.yandex.ru/windows , скачать пакет для установки и запустить его на компьютере. Скачивая это приложение, вы получаете не только голосового помощника, но еще и удобного ассистента для работы на ПК.

    Окно программы представляет собой полноценный поиск от Яндекс, с возможностью открывать любые файлы и программы на вашем компьютере. Алиса имеет приятный голос дублера Татьяны Шитовой. Отвечает вполне актуально, а парой и забавно на ваши вопросы. Как и ее англоязычная сестра Siri имеет хорошее чувство юмора и может рассказать вам анекдоты на разные темы, а также цитировать строки поэм Шекспира.

    Также в онлайн магазине приложение доступно для операционных систем iOS. Чтобы испробовать приложение, нужно также скачать один из сервисов Яндекс. Голосовой помощник Алиса встроен в фирменное приложение, установить отдельным приложением, возможности нет.

    Как пользоваться ассистенткой Алиса

    Процесс «общения» с Алисой на всех платформах происходит одинаково. Разработчики утверждают, что к Алисе не нужен особый подход, как это было с другими подобными приложениями в прошлом. Не нужно искать и формулировать свои запросы, с ней можно разговаривать как с живым человеком. Например, не нужно компоновать главные слова из предложения, чтобы составить запрос: «пиццерия, улица Гоголя», достаточно сказать простыми словами: «Ок, Алиса, где выпить чашечку кофе и поесть пиццы», и вы получите четкий, и такой же «человеческий ответ».

    Для работы ассистента была использована нейронная сеть, которая изучает огромный массив текстов. В связи с этим Алиса вполне может понимать даже незаконченные фразы и вопросы и, учитывая контекст формулировать ответ на вопрос, а иногда даже пытается импровизировать. При разработке помощника программисты делали упор на распознавание любой речи, а не только четко произнесенной фразы. Поэтому Алиса является на сегодняшний день лучшим приложением по восприятию русской речи.

    Отличая приложения от других подобных голосовых помощников

    Алиса имеет некоторые преимущества перед своей конкуренткой – англоязычной Siri. Голосовой помощник от Яндекс всегда работает в группе с другим приложением. Например, Алиса в версии для Windows ПК оперирует Яндекс поиском, а в случае, когда требуется ответ на вопрос более объемный, Алиса открывает Яндекс браузер, если он закреплен в системе по умолчанию и показывает пользователю страницу с его запросом. Алиса также хорошо работает с музыкой и картами, выполняя в точности запросы пользователя, а также в будущем сможет советовать кинофильмы и даже вызывать такси. Сторонние приложения могут в будущем предоставить Алисе свои сервисы и доступ к ним, а сегодня она уже умеет открывать Instagram и Vkontakte.