Human in the Loop
Человек проверяет результат на каждом этапе работы AI-агента
Определение
Human in the Loop — паттерн работы, при котором человек сохраняет контроль над процессом, проверяя результат агента на каждом этапе. Агент предлагает — человек одобряет. Это не замедление, а страховка от ситуаций, когда агент уверенно делает неправильную вещь.
Цикл ролей вайбкодера
В работе с AI-агентом человек переключается между ролями:
Research → Plan → Action → Review
↓ ↓ ↓ ↓
Изучить Описать Агент Проверить
задачу план делает результат
Важно осознавать, в какой роли ты сейчас. Не позволять агенту перескакивать на разработку, когда ты ещё планируешь.
Уровни контроля
| Уровень | Когда использовать | Пример |
|---|---|---|
| Максимальный | Необратимые действия, продакшен | Деплой, миграция БД, удаление данных |
| Средний | Создание нового кода | Новые фичи, рефакторинг |
| Минимальный | Обратимые, простые задачи | Форматирование, тесты |
| YOLO mode | Только для прототипов | --dangerously-skip-permissions |
Как реализуется в инструментах
Claude Code
Агент предлагает → Ты одобряешь каждое действие (файл, команда)
По умолчанию Claude Code запрашивает подтверждение на каждое действие с файлами и командами.
Plan Mode
Режим планирования — реализация Human in the Loop на уровне стратегии: агент показывает план → ты утверждаешь → агент выполняет.
PRD с критериями проверки
На Уроке 3 roadmap включал критерии проверки на каждом шаге:
Шаг 1: Создать бота → Проверить: /start работает
Шаг 2: Добавить БД → Проверить: данные сохраняются
Шаг 3: Деплой → Проверить: бот отвечает в Telegram
Типичные ошибки
- Слишком доверять агенту — принимать все изменения без ревью
- Перескакивать роли — начинать кодить, не закончив планирование
- Игнорировать warnings — агент предупреждает о рисках — читайте
- YOLO для продакшена — skip-permissions только для экспериментов
В курсе
| Урок | Контекст |
|---|---|
| Урок 3 | Цикл ролей: Research → Plan → Action → Review. Roadmap с критериями проверки на каждом шаге. Не позволять агенту перескакивать на разработку |
| Урок 4 | Планирование занимает 80% времени, реализация — 20%, и это даёт 100% результат |
Ссылки
Связанное
- Plan mode — режим планирования как форма Human in the Loop
- PRD — документ с критериями проверки
- Claude Code — инструмент с встроенным контролем
- Промпт-инжиниринг — как формулировать контрольные точки