Human in the Loop

Человек проверяет результат на каждом этапе работы AI-агента

Категория: Основы

Сложность: Начинающий

Определение

Human in the Loop — паттерн работы, при котором человек сохраняет контроль над процессом, проверяя результат агента на каждом этапе. Агент предлагает — человек одобряет. Это не замедление, а страховка от ситуаций, когда агент уверенно делает неправильную вещь.

Цикл ролей вайбкодера

В работе с AI-агентом человек переключается между ролями:

Research → Plan → Action → Review
   ↓         ↓       ↓        ↓
 Изучить   Описать  Агент   Проверить
 задачу    план     делает  результат

Важно осознавать, в какой роли ты сейчас. Не позволять агенту перескакивать на разработку, когда ты ещё планируешь.

Уровни контроля

Уровень	Когда использовать	Пример
Максимальный	Необратимые действия, продакшен	Деплой, миграция БД, удаление данных
Средний	Создание нового кода	Новые фичи, рефакторинг
Минимальный	Обратимые, простые задачи	Форматирование, тесты
YOLO mode	Только для прототипов	`--dangerously-skip-permissions`

Как реализуется в инструментах

Claude Code

Агент предлагает → Ты одобряешь каждое действие (файл, команда)

По умолчанию Claude Code запрашивает подтверждение на каждое действие с файлами и командами.

Plan Mode

Режим планирования — реализация Human in the Loop на уровне стратегии: агент показывает план → ты утверждаешь → агент выполняет.

PRD с критериями проверки

На Уроке 3 roadmap включал критерии проверки на каждом шаге:

Шаг 1: Создать бота → Проверить: /start работает
Шаг 2: Добавить БД  → Проверить: данные сохраняются
Шаг 3: Деплой       → Проверить: бот отвечает в Telegram

Типичные ошибки

Слишком доверять агенту — принимать все изменения без ревью
Перескакивать роли — начинать кодить, не закончив планирование
Игнорировать warnings — агент предупреждает о рисках — читайте
YOLO для продакшена — skip-permissions только для экспериментов

В курсе

Урок	Контекст
Урок 3	Цикл ролей: Research → Plan → Action → Review. Roadmap с критериями проверки на каждом шаге. Не позволять агенту перескакивать на разработку
Урок 4	Планирование занимает 80% времени, реализация — 20%, и это даёт 100% результат

Ссылки

Связанное

Plan mode — режим планирования как форма Human in the Loop
PRD — документ с критериями проверки
Claude Code — инструмент с встроенным контролем
Промпт-инжиниринг — как формулировать контрольные точки

Редактировать на GitHub →