#AI: ChatGPT за твоим ПК, ты со смартфоном 📱
👀 OpenAI выкатили обновление Codex которое меняет саму концепцию работы с ИИ-агентом. Агент теперь буквально садится за твой Windows-компьютер - видит экран, двигает мышь, кликает по интерфейсам и печатает текст - пока ты управляешь им со смартфона.
Как работает computer use на Windows:
29 мая OpenAI добавили поддержку computer use для Codex на Windows 11 - впервые для этой платформы, на macOS фича существовала раньше. Codex (на базе GPT-5.5) видит экран через скриншоты, понимает состояние интерфейсов и выполняет действия: кликает кнопки, заполняет поля, навигирует между приложениями. Задачи которые можно поручить: тестирование приложений и воспроизведение багов глазами пользователя, перенос данных между программами, автоматизация многошаговых рабочих процессов без кода. Ключевой нюанс: на Windows агент работает в foreground - занимает рабочий стол полностью. Параллельно не поработаешь - отдаешь машину агенту. На macOS работает в фоне: там мягче
Что умеет агент на компьютере:
💻 Видит экран в реальном времени - анализирует скриншоты, понимает что открыто и в каком состоянии, строит контекст задачи
💻 Управляет мышью и клавиатурой - кликает по кнопкам, перетаскивает элементы, заполняет формы, вводит текст
💻 Работает между приложениями - переносит данные, переключается между программами, тестирует и воспроизводит баги в конкретном окружении
Как управлять со смартфона:
⚡️ Подключение через QR-код - в Codex Desktop генерируется код, сканируешь в ChatGPT на iOS или Android - телефон становится пультом
⚡️ Запуск задач удаленно - пишешь что нужно сделать с мобильного, агент начинает работать на ПК, ты уходишь по своим делам
⚡️ Общение с агентом в процессе - он задает уточняющие вопросы, присылает обновления, ты одобряешь следующие шаги - не привязан к рабочему месту
Можно запустить несколько параллельных потоков на одном ПК и мониторить их все с телефона. Безопасность: агент работает внутри Windows Sandbox с ограниченным доступом к файлам и сети. Агент НЕ умеет: выполнять действия требующие прав администратора, подтверждать системные запросы безопасности, работать с терминальными приложениями. При запуске недоступно в ЕЭЗ, Великобритании и Швейцарии
💼 Первый запуск: Codex Desktop → меню подключения → QR-код → сканируй в ChatGPT с тем же аккаунтом → авторизация
⭐️ Satya Nadella, CEO Microsoft:
"Мы переходим от эпохи копилотов к эпохе агентов. Копилоты работают для вас - агенты работают вместе с вами"
🙃 Теперь схема выглядит буквально так: я со смартфоном на диване, агент за компьютером делает работу. Раньше это было метафорой из статей про "будущее ИИ". Теперь - QR-код, ChatGPT и окошко Codex на рабочем столе. Главный вопрос уже не "умеет ли агент управлять компьютером" - а "что я буду делать пока он работает"
