Что там по Claude Opus 4.5

#ai
📥Левашов (https://t.me/proitru)

Anthropic выпустила Claude Opus 4.5 — свою самую мощную и продвинутую модель на сегодня.

➡️ Главное:

1️⃣ Заявляется, что это лучший в мире ИИ для программирования, агентов и работы с компьютером.
2️⃣ Существенно умнее в повседневных задачах: анализ, исследования, таблицы, слайды.
3️⃣ Доступен уже сегодня в приложениях, API и всех крупных облаках.
4️⃣ Цена: $5 / $25 за миллион токенов — Opus стал заметно доступнее.

➡️ По производительности:

1️⃣ показывает state-of-the-art результаты на инженерных тестах (SWE-bench Verified — №1);
2️⃣ пишет код лучше других моделей на 7 из 8 языков по SWE-bench Multilingual;
3️⃣ демонстрирует продвинутые агентные навыки: способен находить нестандартные, но корректные решения, которые выходят за рамки ожиданий бенчмарко.

➡️ Первые впечатления от Claude Opus 4.5

Первые тестеры внутри Anthropic и компании с ранним доступом говорят почти одно и то же:
«Opus 4.5 просто работает и делает то, что ожидаешь — даже когда задача действительно сложная». Модель стала гораздо лучше в ситуациях, где раньше ИИ «терял нить» или требовал детальных подсказок. Теперь Claude уверенно держит контекст, выбирает между противоречивыми условиями и предлагает решения, которые реально работают. Тестеры отмечают несколько вещей:

Уверенность в сложных и неоднозначных задачах. Где раньше приходилось «вести модель за руку», Opus 4.5 сам раскладывает задачу на части, сравнивает варианты и выбирает оптимальный путь.
Реальные инженерные навыки. Если указать на сложный баг, модель не запутается — она находит реальный фикс и объясняет логику, как опытный разработчик. Сценарии, которые были почти невыполнимы для Sonnet 4.5, теперь решаемы.
Нестандартное, но корректное мышление. Один интересный пример: в агентном бенчмарке модель должна была помочь клиенту с билетом, но менять бронирование нельзя. Opus 4.5 нашёл «хитрый» путь — сначала апгрейдить класс, а уже потом изменить рейс. Бенчмарк посчитал это ошибкой, но по сути это легальный и креативный путь решения задачи.
Естественность. Многие заметили, что Opus 4.5 «разговаривает» увереннее и естественнее. Он реже делает лишние шаги, меньше извиняется без причины, быстрее приходит к сути.

➡️ И что там по контенту:

Судя по текстам Claude Opus 4.5 стал не просто быстрее и умнее — он получил набор качеств, которые напрямую влияют на весь цикл контент-продукции: от ресёрча и сценариев до дизайна, локализации и публикации. Главное изменение в Opus 4.5 — он стал мощнее как агентная система.

Улучшенное управление контекстом и памятью заметно повышает качество в долгих задачах, а сама модель лучше координирует «команду» подагентов, что упрощает сборку сложных многоагентных систем. В тестах такой стек приёмов поднял результат Opus 4.5 на глубоком исследовательском бенчмарке почти на 15 п.п.

Теперь модель не просто пишет текст, а берёт на себя весь контент-процесс целиком, работая как связка умных помощников. Вы сможете быстрее готовить статьи, сценарии, посты, рассылки и презентации, минимизировать ручные правки и переписывания, автоматизировать до 70–80% технической рутины: от ресёрча до финального форматирования.

Евгений Левашов

Что там по Claude Opus 4.5

Комментарии