Вышла GPT-5.2: искусственный интеллект догоняет человеческий


12 декабря, 2025, 22:44
GPT
OpenAI официально представила GPT-5.2 — самое продвинутое крупное языковое ИИ-ядро в серии 5.x Новая версия станет доступна в трех вариантах (Instant, Thinking и Pro) и уже начала разворачиваться для платных планов пользователей.

Великолепная тройка

OpenAI в релизе предлагает нам три варианта GPT-5.2:

  • GPT-5.2 Instant — быстрый режим для повседневных задач и простого взаимодействия;
  • GPT-5.2 Thinking — углубленное решение многозадачных вопросов и тщательной аналитики;
  • GPT-5.2 Pro — максимальный уровень мышления и точности для сложных профессиональных кейсов.

Вполне удобный подход для того, чтобы пользователь сам подобрал себе модель под конкретную задачу и свои временные ограничения.

Сын маминой подруги

Но разными уровнями размышления над ответом сейчас уже никого не удивишь. Что действительно любопытно, так это то, что GPT-5.2 может решать реальные, сложные задачи, выходящие далеко за рамки обычного текстового общения. Так, например, продвинулась новая модель относительно предыдущей в расчетах бюджета огромной компании:

Еще GPT-5.2 активно гоняли по всяким контрольным специально для ИИшек, и сдал наш герой все на отлично. В частности, он, очевидно, хорош в точных науках. AIME 2025 — престижный математический экзамен с сильно усложненными задачами: нейросеть на нем набила неслыханную сотку при решении без внешних инструментов: это впервые наблюдается у таких масштабных моделей.

Pезультаты бенчмарков самых сложных экзаменов на абстрактное мышление ARC-AGI-1 и ARC-AGI-2 тоже впечатляют. GPT-5.2 Pro, как мы видим, разорвал всех искусственных конкурентов. Но самое главное: он почти нагнал в нем человека. Программа получила 54%, а средний результат людей — 60%. Вот и думайте теперь, креативщики…

GDPval (оценка профессионального знания и реальной работы) показывает, что продвинутые версии справляются лучше квалифицированных людей на ряде задач: при оценке 44 профессий модель выигрывает/добывает ничью с экспертами в 70%+ случаев. То есть для работы она не то, что правая рука, она чуть ли не целый мозг.

ИИ-гонка

Этот релиз произошел на фоне острой конкуренции с Gemini 3 и другими топовыми моделями. Например, недавно мы писали, что неожиданно хорошо по версии тестировщика больших языковых моделей LMArena себя показал обновившийся Grok: так что на авторитет OpenAI реально давят со всех сторон. И, в целом, их новая модель сравнение выдержала: она выходит вперед по ключевым метрикам в части практических задач (математика, логика, многоэтапные workflow).

Ну что, вводим нового сотрудника в бизнес?