Voice-агент Vapi + YClients: запись 24/7 без администратора
Сеть премиум-салонов из трёх точек в Москве теряла до 40% звонков вечером и в выходные. Дежурный администратор за 95k ₽/мес не закрывал проблему. Voice-агент на Vapi + GigaChat с записью прямо в YClients сделал pickup 97% и принёс +278k ₽ выручки на точку.
Звонок в 21:30 уходит в никуда
Премиум-сегмент в beauty работает по простому правилу: клиент звонит и записывается тогда, когда он об этом подумал, — в обеденный перерыв, по дороге домой, в постели перед сном. Если в этот момент ему не ответили — он пишет в WhatsApp конкуренту и обратно уже не возвращается.
Администраторы трёх салонов закрывали входящие в 10:00–21:00. После 21:00 и в выходные звонки уходили на голосовую почту, которую никто не разбирал на утро — к моменту обратного звонка клиент уже записан в другое место.
Попытка нанять дежурного на вечер и выходные за 95 000 ₽/мес на точку проблему не закрыла: дежурный не знал тонкостей мастеров, путался в кабинетах, пропускал звонки во время туалета или обеда. Pickup-rate всё равно болтался около 64% по сумме рабочих и нерабочих часов.
Voice-агент на Vapi + GigaChat → прямая запись в YClients
Vapi принимает звонок 24/7. GigaChat 2 Max — мозг диалога, знает услуги, мастеров, кабинеты, цены и расписание трёх точек. FastAPI-middleware конвертирует намерения агента в вызовы YClients REST API: проверить свободные слоты, забронировать, перенести, отменить, отправить SMS-подтверждение через SMSC.ru.
Подменный номер за основным, Yandex SpeechKit для STT/TTS на русском
14 сценариев: новая запись, перенос, отмена, прайс, мастер-консультация
Tool-calls агента → YClients REST: слоты, бронь, клиент, история
Прямая запись в нужный кабинет нужной точки, проверка конфликтов
SMSC.ru подтверждение клиенту; confidence < 0.7 → переключение на админа
14 сценариев вместо одного скрипта
Голосовой бот в beauty — это не «запиши на стрижку». Это конструктор: «хочу к Кате на маникюр, но не раньше четверга вечером», «можно ли перенести вторничный приём на пятницу», «сколько стоит окрашивание у топ-мастера», «есть ли свободные слоты на массаж лица на этой неделе». GigaChat 2 Max уверенно ведёт каждый из этих сценариев, потому что промпт-инжиниринг был сделан под конкретный YClients-кабинет: услуги, мастера, длительности, кабинеты, цены — всё подгружается из API в системный контекст модели на старте сессии.
Fallback на администратора при низком confidence
Если агент за 2 уточнения не понимает запрос — диалог сразу переключается на живого администратора (днём) или ставится в очередь обратного звонка (ночью). Это не «лучше плохая запись, чем никакой»: на премиум-сегменте плохой опыт стоит дороже потерянной записи. Порог confidence настраивался итеративно первые две недели запуска.
Tool-calls в YClients как первоклассные операции
FastAPI-middleware не «делает запрос за агента» — он выставляет агенту набор tool'ов:
find_slots,
create_record,
reschedule,
get_master_info.
Агент сам решает, какой вызвать в каком порядке. Middleware валидирует параметры
и проксирует в YClients REST с правильной авторизацией.
SMS-подтверждение через SMSC.ru
После успешной записи клиент получает SMS со ссылкой на YClients-карточку записи — можно посмотреть/перенести/отменить через стандартный интерфейс салона, как будто записал администратор.
Российские провайдеры + predictable хостинг
Voice-платформа: подключение номера, ASR/TTS-пайплайн, WebSocket к LLM
LLM-мозг диалога, tool-calling, поддерживает контекст 14 сценариев
STT/TTS на русском — премиум-голоса, не «робот-помощник»
Запись/перенос/отмена напрямую в кабинеты салонов
Сервер tool'ов: валидация, авторизация, маршрутизация по 3 точкам
SMS-подтверждение клиенту с ссылкой на YClients-карточку записи
Хостинг middleware на территории РФ — 152-ФЗ совместимо
Логи диалогов и метрики качества для итеративного тюнинга промптов
Что изменилось в цифрах
по всем входящим, включая 21:00–10:00 и выходные
в месяц — записи вне рабочих часов, 41 запись в среднем
recurring per-month: Vapi-минуты + GigaChat-токены + Selectel
Главное число для владельца — +41 запись в месяц на точку из «нерабочего» времени. Это не клиенты, которых забрали у дневных администраторов, это полностью новый поток — те, кто раньше уходил после 5 гудков.
Расход на recurring упал в 12 раз. При этом дневной администратор продолжает работать в зале — он теперь не «диспетчер на телефоне», а консультант на ресепшене, который встречает клиентов лично.
Где ещё ложится та же архитектура
Универсальный паттерн — «Voice + LLM + CRM API + fallback на человека». Та же архитектура (с заменой только нод CRM-интеграции) подходит для:
- → Барбершопы, ногтевые студии, массажные кабинеты на YClients/Altegio/Beauty Pro
- → Фитнес-клубы и студии тренировок — запись на занятия, отмена, перенос абонементов
- → Автосервисы с записью в Альфа-Авто или собственную CRM
- → Школы языков, репетиторы, центры дошкольного развития — запись на пробные уроки
- → Сервисы доставки / клининга — обработка заказов и переносов вне рабочих часов
- FastAPI-каркас middleware с tool-call API и логированием диалогов
- Промпт-инжиниринг для GigaChat с подгрузкой каталога услуг из CRM в системный контекст
- Confidence-fallback на администратора по двум критериям: качество ASR и уверенность намерения
- Selectel-хостинг middleware с правильной schema хранения ПД для 152-ФЗ
Если у вас есть CRM с расписанием и пропущенные звонки — voice-агент закроет
Vapi + GigaChat + ваша CRM — это 4-6 недель от kickoff до production. Точка возврата обычно укладывается в 2-3 месяца за счёт высвобожденных часов администраторов и перехваченных записей вне рабочих часов.
Аудит за 5 000 ₽ — с конкретным отчётом и сметой
Расскажу что внедрить в вашем бизнесе в первую очередь, какая будет окупаемость, и нужен ли вообще AI для вашей задачи (иногда — нет).
Или просто напишите свой вопрос — отвечу в течение 2 часов