GPT и Claude пошли в разные стороны

OpenAI и Anthropic выпустили новые флагманские модели с разницей в неделю. 16 апреля вышел Claude Opus 4.7, 23 апреля вышел GPT-5.5. Обе компании называют свои модели лучшими. И формально не врут: просто лучшими в разном.

Смотрим на конкретику. Claude уверенно лидирует на академических и reasoning-тестах: на GPQA Diamond набрал 94.2%, результаты на HLE также выше конкурентов. GPT-5.5 берёт верх в терминальных сценариях и математике: на Terminal-Bench 2.0 показал 82.7% против 69.4% у Claude. Каждая модель сильнее там, где другая слабее, и это не случайная погрешность. На практике Claude лучше справляется с широким архитектурным мышлением на больших кодовых базах, GPT-5.5 точнее там, где нужна навигация по файлам и работа с конкретными инструментами.

Это не случайность. Обе компании сознательно сделали ставку на разные сценарии, и это задаёт тон для всей индустрии. Если раньше вопрос звучал “какой AI лучший”, то теперь правильный вопрос звучит иначе: “какой инструмент лучший для конкретной задачи”.

Рынок отвечает тем же

Посмотрим на картину шире. ChatGPT остаётся лучшим универсалом, но в каждой отдельной категории его обходят специализированные инструменты. Gemini выигрывает по глубине интеграции с Google Workspace и размеру контекстного окна. Perplexity стал стандартом для ресёрча: отвечает с источниками там, где другие галлюцинируют. Cursor сэкономил разработчикам значительное время именно потому, что делает одно, но идеально. Midjourney остаётся золотым стандартом генерации изображений по качеству и художественному контролю.

Инструмент Лучше всего Слабее Для кого
ChatGPT (GPT-5.5) Универсальные задачи, агентный кодинг, голосовой режим, навигация по файлам Глубокий анализ и длинные документы Все, разработчики
Claude (Opus 4.7) Сложный код, длинные документы, reasoning, точное следование инструкциям Голос, видео, реалтайм-поиск Разработчики, аналитики
Gemini Google Workspace, видео и аудио, огромный контекст За пределами экосистемы Google слабее Google-пользователи
Perplexity Ресёрч с источниками, актуальные данные Не для генерации контента Исследователи
Cursor Кодинг в IDE, понимает весь проект целиком Только для разработчиков Разработчики
Midjourney Художественные изображения, маркетинговые визуалы Текст на изображениях, редактирование Дизайнеры, маркетинг

Эпоха одного универсального AI заканчивается. Побеждают те, кто собрал правильный стек под свои задачи.

Как писать промпты для GPT-5.5: три правила

Вместе с релизом OpenAI выпустил новый гайд по промптингу, и его суть можно свести к одному предложению: со старым подходом к промптам новая модель работает хуже, чем могла бы.

Раньше пользователи и разработчики расписывали каждый шаг: объясняли модели что делать, в какой последовательности, с какими ограничениями. Это было вынужденной мерой, прошлые модели нуждались в подробных инструкциях, иначе сбивались с курса. Теперь ситуация изменилась. GPT-5.5 часто справляется лучше когда ей описывают цель, а не путь к ней. Детальные пошаговые инструкции могут сужать пространство для поиска решений.

OpenAI рекомендует другой подход:

  1. Опишите что нужно получить на выходе
  2. Обозначьте ограничения
  3. Объясните что считается хорошим результатом

Как именно туда добраться — модель во многих случаях справляется лучше, если дать ей выбрать путь самостоятельно.

Для обычных пользователей это хорошая новость: порог входа снижается, и теперь не нужно учиться “правильно формулировать” запросы. Для разработчиков, которые годами выстраивали сложные системные промпты, это полноценный инженерный проект по миграции. Старые инструкции превратились в технический долг.

Оба этих событий, выход двух флагманских моделей и смена правил промптинга, говорят об одном: AI-индустрия вышла из фазы гонки и вошла в фазу специализации. Инструменты становятся умнее, занимают свои ниши и требуют меньше ручного управления.

Вопрос больше не в том, какой AI лучший. Вопрос в том, какой нужен именно на этом этапе вашей задачи.