Финалист в номинации «Рост выручки»Подробнее

Как сделать вашего робота неотличимым от человека?

Как показал наш опрос населения на выборке 300 человек, 70% людей не любят, когда им приходится говорить с роботом.

Причин много, в том числе боязнь нового и  “тупость” ботов.

Поэтому даже есть ваш робот на базе платформы Даша будет адекватно отвечать на 99% всех реплик человека, но при этом человеку будет очевидно, что это робот, то отношение к нему все равно будет негативное.

Зачем роботу быть человечным?

Из за того, что людям не нравится общаться с роботом, то вы никогда не получите эффективности робозвонков, как у живых операторов.

Что сделать, чтобы вашим клиентам было комфортно общаться с роботом?

Ответ прост: робот должен быть неоличим от человека. Чтобы соответствовать этому, робот должен соответствовать 3-м условиям: Отвечать быстро. Паузы длиннее, чем 800 мс выдают в собеседнике робота. Отвечать на реплики человека адекватно, держать контекст разговора. Робот должен отвечать “впопад” на все вопросы на протяжении всего разговора. Естественный голос. Голос должен звучать абсолютно естественно - интотации, эмоции, дефекты речи. Всё это влияет на “человечность” голоса.

С первыми 2 пунктами проблем быть не должно - Даша “из коробки” отвечает быстро, чтобы отвечать впопад есть системные реакции, заложенные в модель (если вы качаете модель из нашего репозитория - ссылка), а также есть инструмент Профилировщик, который служит для отладки пар вопрос-ответ.

Но с голосом всё сложнее - сейчас на русском языке у нас еще нет достаточно хорошего синтеза, который звучит совершенно естественно. Поэтому приходится прибегать к предзаписанным фразам.

Как правильно записывать фразы для робота?

Для этого требуется соблюсти несколько простых правил:

  • Диктор, чей голос вы пишите, не должен быть профессионалом. В этом случае у человека слишком чистая речь и правильно поставленный голос. Результат будет сравним с синтезированной речью.
  • Никаких шумов на заднем фоне. Не должно быть эха, шума включенных бытовых приборов и т.п.
  • Диктор должен проявлять эмоции, для этого полезно представить, что вы не пишите звук на телефон/компьютер, а общаетесь с собеседником.
  • Записывать все фразы желательно в одном помещении на одно оборудование, находясь примерно на одном удалении от микрофона.
  • Оборудование для записи может быть любым - от профессионально оборудованной звукозаписывающей кабины до простого сотового телефона.
  • Каждая фраза должна быть в отдельном файле в mp3 формате

После записи фраз нужно обязательно обрезать паузы в начале и в конце фразы - это нужно, чтобы робот не выглядел заторможенным - т.е. 1 секунда тишины в файле сделает задержку ответа робота на секунду дольше.

Затем нужно добавить ваши предзаписанные фразы в вашу модель, проще всего это сделать на основании уже имеющейся модели в нашем репозитории: https://github.com/dasha-samples/dasha-smb-receptionist-demo-non-us

И помните: если у вас есть любые вопросы - пишите в нашем комьюнити в общие каналы (только на английском) или мне в личку (@Alexander Zaytcev)