Великолепная тройка
OpenAI в релизе предлагает нам три варианта GPT-5.2:
- GPT-5.2 Instant — быстрый режим для повседневных задач и простого взаимодействия;
- GPT-5.2 Thinking — углубленное решение многозадачных вопросов и тщательной аналитики;
- GPT-5.2 Pro — максимальный уровень мышления и точности для сложных профессиональных кейсов.
Вполне удобный подход для того, чтобы пользователь сам подобрал себе модель под конкретную задачу и свои временные ограничения.
Сын маминой подруги
Но разными уровнями размышления над ответом сейчас уже никого не удивишь. Что действительно любопытно, так это то, что GPT-5.2 может решать реальные, сложные задачи, выходящие далеко за рамки обычного текстового общения. Так, например, продвинулась новая модель относительно предыдущей в расчетах бюджета огромной компании:
Еще GPT-5.2 активно гоняли по всяким контрольным специально для ИИшек, и сдал наш герой все на отлично. В частности, он, очевидно, хорош в точных науках. AIME 2025 — престижный математический экзамен с сильно усложненными задачами: нейросеть на нем набила неслыханную сотку при решении без внешних инструментов: это впервые наблюдается у таких масштабных моделей.
Pезультаты бенчмарков самых сложных экзаменов на абстрактное мышление ARC-AGI-1 и ARC-AGI-2 тоже впечатляют. GPT-5.2 Pro, как мы видим, разорвал всех искусственных конкурентов. Но самое главное: он почти нагнал в нем человека. Программа получила 54%, а средний результат людей — 60%. Вот и думайте теперь, креативщики…
GDPval (оценка профессионального знания и реальной работы) показывает, что продвинутые версии справляются лучше квалифицированных людей на ряде задач: при оценке 44 профессий модель выигрывает/добывает ничью с экспертами в 70%+ случаев. То есть для работы она не то, что правая рука, она чуть ли не целый мозг.
ИИ-гонка
Этот релиз произошел на фоне острой конкуренции с Gemini 3 и другими топовыми моделями. Например, недавно мы писали, что неожиданно хорошо по версии тестировщика больших языковых моделей LMArena себя показал обновившийся Grok: так что на авторитет OpenAI реально давят со всех сторон. И, в целом, их новая модель сравнение выдержала: она выходит вперед по ключевым метрикам в части практических задач (математика, логика, многоэтапные workflow).
Ну что, вводим нового сотрудника в бизнес?
