Экспертное мнение

Почти как люди

В этой статье мы поделимся опытом применения технологий синтеза и распознавания речи в исследовательских проектах.

Мы – ООО «Системы информации и связи»: современный разработчик и интегратор платформы сбора данных «SURVEYSTUDIO» и системы автоматизированного обзвона «DEX (Dialer Express)». Телефонные сервера нашей инфраструктуры обрабатывают чуть больше десяти миллионов интервью исследовательских проектов ежемесячно.

AMD, определение автоответчиков

Одно из очевидных применений технологии распознавания голоса – выявление и фильтрация автоответчиков операторов мобильной связи на телефонных опросах. Прежде чем соединить респондента с оператором, система пытается понять, человек ли вообще взял трубку. Это не очень сложно. Люди дышат в трубку, сопят, «алёкают». Роботы конкретны, ровны, методичны или вообще молчат ожидая, пока оставят сообщение их хозяину.

В своей работе мы используем приложение AMD телефонной станции Asterisk.

Это позволяет отсеять приблизительно девять из десяти машин на стороне респондента, существенно убыстряя работу контакт-центра.

Важно: руководителям контакт-центров необходимо учитывать то, что работа приложения AMD требует установления телефонного соединения и анализа аудиопотока в нём в течение первых нескольких секунд. Эти секунды могут тарифицироваться провайдером услуг связи даже если система решила, что на другой стороне – робот и повесила трубку, не переводя в итоге разговор на оператора.

Роботизированные опросы

В этом году мы принимали участие в нескольких проектах с опросами без участия белковых форм операторов. При всей заманчивости такого подхода, результаты в целом мы пока признаём неудовлетворительными.

Основная проблема – нежелание людей общаться с роботами. Система недостаточно совершенна, чтобы полностью притворяться человеком (а когда станет – то возникнет морально-этический вопрос), а люди недостаточно дружелюбны к искусственному интеллекту. Который, к слову, не очень-то интеллектуален и туг на ухо. Это неплохо работает в справочных и банках, где человек сам заинтересован в диалоге, но плохо – в опросах, где респонденту нет никакого резона отвечать, кроме интереса, вежливости и человеческого отношения к опрашивающему.
Приведём несколько любопытных наблюдений:

  • Из десяти ответивших людей начать разговор пробует один.
  • Чем меньше говорит робот – тем лучше. Пространная записанная речь провоцирует досрочное окончание разговора. Особенно это касается приветствия.
  • Не нужно притворяться человеком. Вас всё равно раскусят. А пока не раскусят, будут отвечать развёрнуто, и на вопрос «У Вас есть высшее образование?» вы получите: «Ну, я поступил в Лесную, но что-то дело не подалось и на втором курсе перевёлся в Политех, там поучился немного и ушёл с магистратуры, кому оно нужно, деньги нужно зарабатывать, вот что главное…». Интерпретировать это будет сложно.
  • Женский голос робота воспринимается гораздо лучше мужского, что отражается не только в проценте, но и характере ответов. Робот в юбке с меньшей вероятностью нарвётся на хамство.
  • Вопросы должны быть сформулированы максимально точно и не допускать вольной интерпретации или пространных ответов. Даже если респондента просят просто сказать «да» или «нет», часто он не укладывается в навязываемые рамки, мы фиксируем «согласен», «конечно», «отстаньте», «сам-то как думаешь» и т.д. Расширенные варианты ответов встречаются в 30-35 процентах диалогов с роботами, как бы строго мы ни пытались ограничивать варианты ответов.
  • Это касается не только роботизированных опросов, а опросов в целом: крайне важен определяемый номер. Когда мы звонили с питерского номера в Москву, мы получили гораздо меньший процент ответа и множество комментариев: «зачем мне звонить из Петербурга», «зачем вы меня спрашиваете об этом из другого города», «Зенит, иди на…» и так далее. Также важно принимать обратные звонки – то есть звонки самих респондентов на номер, который отобразился у них в пропущенных. Из успешных интервью у нас около 9% - это именно такие обратные вызовы.

Контроль аудиозаписей

Существует возможность контекстного поиска по записям в целях контроля и сопоставления с собранными данными, а также автоматическая транскрипция записей для последующей обработки.

Мы успешно использовали такой поиск исключительно в технических целях, для восстановления хронологии записей при аварии на телефонной станции, однако мы понимаем, что такой же метод может применяться для поиска ключевых слов и выражений, который должны быть (или не должны быть) в интервью. При этом мы можем анализировать каналы респондента и оператора контакт-центра отдельно друг от друга. Упоминал ли оператор магазин «Пятёрочка» в вопросе? Смог ли респондент правильно назвать отчество нашего премьер-министра, или ему подсказали?

Заключение

Я помню рассуждения одного из отечественных артистов о книжках-разговорниках: де, да, в книжке написано, как именно нужно задать вопрос на немецком, и, может, ты даже произнесёшь это более менее правильно, но ведь тебе ещё и ответят, и вот тут как раз начнутся настоящие сложности.

Сказать, что контакт-центрам сейчас грозит трансформация в облачные сугубо технические решения, где вместо людей работают роботы, нельзя. Само по себе распознавание речи продвинулось далеко вперёд, но, к сожалению, остаются сложности с интерпретацией распознанного. «Да» и «нет» — это ещё не разговор, а просто удобная замена кодов клавиш: если согласны – нажмите «один».

Роботы помогают эффективно бороться с роботами и убирать рутину транскрипций разговоров, они эффективны в контроле и в роли фильтров там, где требуется обработать заведомо большую аудиторию или объём записей. Именно в формате таких инструментов мы бы и предложили рассматривать современную автоматизацию.

Не могу не упомянуть проекты голосовых помощников «Siri», «Алиса» и иже с ними. Они собирают огромное количество определяющей информации о своих пользователях. В сочетании с данными интернет-следа учётных записей их хозяев и данных смартфонов — это крайне подробное описание наших привычек и склонностей, которые могут использоваться в том числе для исследований. Но рядовому исследователю сейчас эти данные недоступны, мы вынуждены довольствоваться лишь отголосками скандалов: «Google призналась, что ее сотрудники слушают записи пользователей голосовых помощников», «Apple пообещала больше не записывать разговоры с Siri» и так далее.

© 2019 Ассоциация исследовательских компаний «Группа 7/89». Все права защищены.

Поиск