Как голосовые интерфейсы могут помочь сотням миллионов пользователей | Большие Идеи

・ Технологии
Статья, опубликованная в журнале «Гарвард Бизнес Ревью Россия»

Как голосовые интерфейсы могут помочь сотням
миллионов пользователей

Что общего у голосовых помощников и инклюзивного дизайна

Автор: Кэти Перл

Как голосовые интерфейсы могут помочь сотням миллионов пользователей
Фото: SUNNY/GETTY IMAGES

читайте также

Инфографика. Где сила в компании?

«Вы не в клубе»: почему мужчин повышают, а женщин нет

Зои Каллен,  Рикардо Перес-Трулья

Три правила Xiaomi: когда и как инвестировать в экосистему

Лян Чэнь,  Тони У. Тун,  Яньтин Го

Как пережить карьерный поворот

Рон Ашкеназ

Создаете ли вы услуги, физические продукты или программное обеспечение, вам не обойтись без инклюзивного дизайна. Это словосочетание означает, что созданными продуктами может пользоваться максимально возможное число людей. Голосовой пользовательский интерфейс — прекрасный инструмент для достижения этой цели.

Голосовой интерфейс получил распространение более 20 лет назад с первыми интерактивными автоответчиками. Изначально технология возникла скорее из финансовых соображений, чтобы помочь компаниям сэкономить деньги, поскольку сотрудники на телефоне обходятся дороже, чем автоматизированные системы.

Сейчас благодаря появлению умных колонок мы переживаем так называемую «вторую эру» голосовых интерфейсов. Сегодня такой интерфейс используется не только в автоматизированных телефонных системах, но и в голосовых помощниках, таких как Google Assistant, Amazon Echo, Bixby, Cortana, Siri и т. д. В современных голосовых интерфейсах применяются технологии с искусственным интеллектом. Сначала умные колонки предлагали только базовый набор функций — установку таймеров и воспроизведение музыки. За последние несколько лет их функционал расширился: теперь им доступны более сложные взаимодействия, такие как включение бытовых приборов, помощь при приготовлении пищи и развлечения пользователей.

Устройства таких типов обеспечивают удобство среднестатистическому пользователю, действуя более естественно, однако перед голосовым интерфейсом открывается широкое будущее: помощь людям, которые нуждаются в ней больше всего.

Приблизительно 62 млн человек в США имеют нарушения моторных или двигательных функций. Сегодня голосовой интерфейс доступен на сотнях миллионов устройств, включая умные колонки, наушники и часы, и уже используется, чтобы помогать людям в коммуникациях через электронную почту и сообщения и контролировать бытовые приборы. Они даже помогают людям с мышечной дистрофией с помощью голоса регулировать кровать в течение ночи, чтобы избежать пролежней.

285 млн человек во всем мире, страдающим нарушениями зрения, голосовой интерфейс может вернуть независимость и чувство собственного достоинства. Использование голосового интерфейса помогает людям со слабым зрением найти потерявшийся смартфон, послушать музыку, не перебирая треки на стереосистеме, и узнать, сколько времени показывает таймер. Специалисты в области технологий часто думают о решении больших задач (вроде того, как помочь людям одеваться, есть, передвигаться и т. д.), но забывают о мелочах, которые многие из нас воспринимают как должное — например, о переключении каналов на телевизоре. Голосовой интерфейс способен помочь с подобными задачами, позволяющими людям больше контролировать свою жизнь.

Однако речь идет не только о физических ограничениях.

Людям, страдающим деменцией, голосовые помощники могут без лишних эмоций напомнить о приеме лекарств, а также снова и снова отвечать на одни и те же вопросы, не обращаясь к их опекуну, который уже эмоционально истощен.

Голосовой ассистент — это также прекрасный способ для пожилых людей, у которых нет смартфона или ноутбука (или которым не очень комфортно пользоваться этими гаджетами), иметь доступ в интернет и поддерживать связь с семьей. В рамках эксперимента с фокус-группой, проходившего в Карлсбаде (Калифорния), компания FrontPorch установила умные колонки в доме престарелых. Пожилые люди отнеслись к ним с большим энтузиазмом, так как смогли отправлять сообщения родственникам, играть в игры, слушать любимую музыку и даже пользоваться мессенджерами.

«Веселей всего было начать общаться через мессенджер с двумя друзьями, которые также стали использовать это волшебное устройство. Да, мы могли подождать, пока увидимся в холле. Да, мы могли позвонить по телефону. Но в переписке с помощью мессенджера есть что-то очень личное и классное. Я так не веселился с детства, когда мы натягивали проволоку между двумя консервными банками и играли в телефон», — рассказал один из участников эксперимента.

Голосовой интерфейс также помогает преодолевать низкий уровень грамотности. В статье Wall Street Journal под названием «Конец ввода с клавиатуры: следующий миллиард пользователей будет пользоваться видео и голосовым вводом» автор пишет о человеке, который из-за низкой грамотности не может пользоваться многими свойствами своего смартфона. С помощью голосового интерфейса он теперь получает важную информацию — например, расписание поездов — и слушает любимые песни. Голосовой интерфейс также повышает уверенность при пользовании интернетом, позволяя людям делать это более комфортно.

Другая сторона этой технологии связана с помощью тем, кто потерял возможность говорить, или тем, чья речь имеет отклонение от нормы. Эти люди не всегда могут пользоваться голосовым интерфейсом, так как обучение речевым моделям проходит на стандартной речи. Но существует два подхода к решению этих проблем. Во-первых, у тех, кто теряет способность говорить из-за болезней вроде бокового амиотрофического склероза, можно записать голос и затем преобразовать его в функцию речевого воспроизведения текста. Когда больной не умеет говорить, он может воспользоваться этой функцией. Что касается второй проблемы, то речь более 100 млн человек в США и Европе не всегда подходит для использования голосового интерфейса — например, в случаях заикания или менее четкой речи в результате инсульта. Для решения этой проблемы необходимо создавать больше речевых моделей, охватывающих эти различия.

Преимущество речевых технологий и инклюзивного дизайна в целом заключается в том, что они понятны всем. Многие из нас могут испытывать временные затруднения. Например, руки могут быть заняты покупками (или ребенком), а голос измениться из-за простуды. В таком случае вам поможет ИИ с голосовым управлением. И даже если вы просто забудете очки для чтения, вы не сумеете прочитать текст на телефоне. Возможность воспользоваться голосом в подобной ситуации значительно облегчит вам жизнь.

Несмотря на то, что технологии голосового ИИ обладают потенциалом улучшения продуктов и услуг для менее многочисленных групп, следует помнить и о самих моделях распознавания речи. Для некоторых людей стандартные модели распознавания не очень эффективны, и наша задача — обеспечить, чтобы набор данных для обучения охватывал разнообразных пользователей и чтобы мы могли повышать качество распознавания речи для всех. Один из примеров, которые мы демонстрировали на недавней конференции Google I/O, служит иллюстрацией того, как мы пользуемся ИИ, чтобы совершенствовать продукты для людей с нарушениями речи. Я активно призываю компании задуматься, какую пользу может принести инклюзивный дизайн их клиентам. Голосовые технологии способны помочь нам всем.