Human in the Loop

Человек проверяет результат на каждом этапе работы AI-агента

Категория
Основы
Сложность
Начинающий

Определение

Human in the Loop — паттерн работы, при котором человек сохраняет контроль над процессом, проверяя результат агента на каждом этапе. Агент предлагает — человек одобряет. Это не замедление, а страховка от ситуаций, когда агент уверенно делает неправильную вещь.

Цикл ролей вайбкодера

В работе с AI-агентом человек переключается между ролями:

Research → Plan → Action → Review
   ↓         ↓       ↓        ↓
 Изучить   Описать  Агент   Проверить
 задачу    план     делает  результат

Важно осознавать, в какой роли ты сейчас. Не позволять агенту перескакивать на разработку, когда ты ещё планируешь.

Уровни контроля

УровеньКогда использоватьПример
МаксимальныйНеобратимые действия, продакшенДеплой, миграция БД, удаление данных
СреднийСоздание нового кодаНовые фичи, рефакторинг
МинимальныйОбратимые, простые задачиФорматирование, тесты
YOLO modeТолько для прототипов--dangerously-skip-permissions

Как реализуется в инструментах

Claude Code

Агент предлагает → Ты одобряешь каждое действие (файл, команда)

По умолчанию Claude Code запрашивает подтверждение на каждое действие с файлами и командами.

Plan Mode

Режим планирования — реализация Human in the Loop на уровне стратегии: агент показывает план → ты утверждаешь → агент выполняет.

PRD с критериями проверки

На Уроке 3 roadmap включал критерии проверки на каждом шаге:

Шаг 1: Создать бота → Проверить: /start работает
Шаг 2: Добавить БД  → Проверить: данные сохраняются
Шаг 3: Деплой       → Проверить: бот отвечает в Telegram

Типичные ошибки

  • Слишком доверять агенту — принимать все изменения без ревью
  • Перескакивать роли — начинать кодить, не закончив планирование
  • Игнорировать warnings — агент предупреждает о рисках — читайте
  • YOLO для продакшена — skip-permissions только для экспериментов

В курсе

УрокКонтекст
Урок 3Цикл ролей: Research → Plan → Action → Review. Roadmap с критериями проверки на каждом шаге. Не позволять агенту перескакивать на разработку
Урок 4Планирование занимает 80% времени, реализация — 20%, и это даёт 100% результат

Ссылки

Связанное

  • Plan mode — режим планирования как форма Human in the Loop
  • PRD — документ с критериями проверки
  • Claude Code — инструмент с встроенным контролем
  • Промпт-инжиниринг — как формулировать контрольные точки
Редактировать на GitHub →