🔥 Три месяца доверял код одному агенту и думал что этого достаточно. Поставил второго ревьюером - он нашел дыры в первый же день. Плачу ровно столько же, а надежность уже другая

Почему один агент - это архитектурное ограничение

Claude Code и Codex построены по разным принципам. Claude Code - локальный агент: накапливает память о проекте между сессиями, видит полный контекст файлов, работает интерактивно. Codex - облачный sandbox запущенный OpenAI в мае 2025: работает асинхронно, подключается к GitHub-репо, открывает PR без участия пользователя. Модель под капотом - ChatGPT 5.5

Как устроена схема

✅ Codex на VPS - отдельный агент 24/7: свой Telegram-бот, своя MEMORY.md, свой systemd-сервис, доступ к vault-search. Пишу задачи с телефона - он выполняет. Без API-ключей, без токен-биллинга - только ChatGPT-подписка. Это не SSH-мост, это полноценный агент: свой контекст проекта, свои tasks/, своя история диалогов

✅ Claude Code - координатор и primary writer: диагностирует VPS, чинит cron, пишет скрипты, настраивает мониторинг, держит полный контекст системы между сессиями. Это первый мозг

✅ Codex - independent reviewer в VS Code: тот же код после Claude идет через Codex вторым проходом. Два независимых мнения на один файл. Если оба согласны - фикс надежный. Если расходятся - есть что разбирать

Что дала схема на 4 проектах

📌 Второй агент ловит дыры первого - не потому что первый плохой, а потому что архитектуры разные. Cross-review убирает confirmation bias: одна модель не может честно проверить саму себя

📌 $220/мес без API-биллинга сверху - $200 Claude Max + $20 ChatGPT Pro. Подписки которые и так лежали в кошельке. Codex на VPS работает через ChatGPT-подписку, не через токены

📌 Параллельность без доплат - Claude ведет сложную интерактивную задачу, Codex держит рутинную в фоне через VPS. Разные типы задач, разные агенты, одна кодбейс

📌 Слепо доверять одному нельзя - это доказано на практике, не в теории. На всех 4 проектах второй агент возвращал на доработку то что первый пропустил

Ключевой вывод

Из обсуждений на OpenAI Community: оба агента используют одни и те же базовые модели. Выигрывает тот у кого лучше harness - память, задачи, контекст, параллелизм. Именно harness компаундируется со временем, а не сама модель. Схема с двумя агентами - это двойной harness, где каждый оптимизирован под свой тип задач

⭐️ Eric Raymond, автор "The Cathedral and the Bazaar": «При достаточном количестве взглядов все баги найдутся»

🙃 Три месяца обходился одним агентом и думал что этого хватает. Второй нашел дыры в первый же день. Мог не ждать - но зато теперь знаю разницу не по статье, а по 4 живым проектам