Привет! На связи Николай Волосянков.
Знаете, что самое сложное в работе с нейросетями? Отличить настоящий технологический прорыв от громкой маркетинговой рекламы.
Осень 2025 года подкинула как раз такую задачку. Google* выкатил «мыслителя» Gemini 2.5 Pro*, а компания Anthropic* почти тут же ответила «инженером» Claude Sonnet 4.5*.
Эти компании называют модели «убийцами» конкурентов. Но мы в Universus смотрим на них не как на чудо, а как на рабочие инструменты. Где они хороши, где — не очень и, главное, кому какой инструмент принесёт больше пользы и денег. Давайте во всём разберёмся.
Краткий обзор моделей
Чтобы понять, кто есть кто, нужно посмотреть на их «ДНК». Это не просто две нейросети, а две разные философии.
Claude Sonnet 4.5*. Компания Anthropic* выпустила эту модель 29 сентября 2025 года и сразу задала высокую планку, назвав его «лучшей в мире моделью для кодирования». Вся суть Sonnet 4.5* — «агентность», или способность не просто болтать, а автономно выполнять сложные задачи.
Его фишки — Memory Tool, или способность запоминать предыдущие разговоры пользователя, и Context Editing, или умение «забывать» ненужное, чтобы не путаться. А ещё ИИ умеет выполнять несколько задач одновременно, например, искать в сети и читать файлы. Это модель-работяга, которая заточена на предсказуемый результат.
Gemini 2.5 Pro*. Флагман от Google* — скорее «академик» широкого профиля. Его сила — «продвинутое мышление» и тотальная мультимодальность, то есть понимание вообще всего. Компания сделала ставку на то, чтобы Gemini 2.5 Pro* работал не только с текстом и кодом, но и с изображениями, видео и даже аудиозаписями длиной до 8,4 часов.
А его способность Computer Use, или использование компьютера пользователя — почти магия. Модель может управлять вашим браузером: кликать по кнопкам, заполнять формы и извлекать данные. Это универсальный солдат для сбора и анализа информации.
Сравнение по ключевым параметрам
На бумаге обе модели — гении. Но дьявол — в деталях. Я сравнил их по параметрам, которые важны для работы.
Качество ответов и логика рассуждений
Здесь начинается самое интересное. Если нужен ИИ для сложных рассуждений, научного анализа или решения нетривиальных задач, Gemini 2.5 Pro* будет впереди. Он стабильно лидирует в сложных академических бенчмарках, таких как GPQA (вопросы уровня аспирантуры) и AIME (математика).

Он даже показывает лучшие результаты на тесте Humanity’s Last Exam, который создан для того, чтобы проверять не только знания, но и человеческое понимание мира.
Claude Sonnet 4.5* тоже силён в логике и математике, но в чистом «академическом» мышлении Gemini* всё же впереди. Вот ещё подтверждение. В слепых тестах LMArena, где люди не знают, с кем говорят, Gemini 2.5 Pro* «ощущают» как более умного и эрудированного собеседника.
Точность фактов и уровень галлюцинаций
Галлюцинации, или попросту обман нейросети — главная боль индустрии. И здесь подходы компаний сильно различаются.
Anthropic* строит свои модели на «конституционном ИИ». Их приоритет — безопасность, предсказуемость и честность. Sonnet 4.5* реже обманывает или что-то выдумывает. Он предсказуем.
А вот «творческий» подход Gemini 2.5 Pro* иногда играет злую шутку. В реальных тестах это выливается в разрастание задачи. Вы просите его поправить два файла, а он «творчески» решает заодно поправить и всё остальное. В одном из глубоких тестов Claude* выполнил 100% задачи, а Gemini* — только 65% [1], потому что полез туда, куда его не просили.
Творческая креативность
Обе модели креативны, но эта креативность проявляется по-разному.
Claude Sonnet 4.5* — наверное, лучший писатель. Наши ученики в Universus в восторге от его стиля, умения держать тон и генерировать «человеческий» текст. Если нужен копирайтер или редактор, отлично подойдёт Sonnet 4.5*. Он подбирает слова и строит фразы так, что тексты получаются живыми и легко читаются.
Креативность Gemini 2.5 Pro* — в решении проблем. Но как я уже сказал, эта «креативность» приводит к «разрастанию задачи». Он может «творчески» добавить фичу, о которой вы не просили, или найти нестандартный, но не совсем правильный путь. Это полезно в мозговом штурме, но опасно в реальной работе, где требуется точность.
Понимание контекста и стиль общения
Соперничество «окон контекста» (объëма памяти) продолжается. По документации Gemini 2.5 Pro* на первый взгляд выигрывает: у него стабильное окно в миллион токенов, а в бета-версии обещают и все два. У Claude Sonnet 4.5* — всего 200 000 токенов в стандарте и миллион в бета-режиме.
Но дело не в размере. У этих нейросетей разный принцип работы с памятью. Gemini* использует свой миллион, чтобы сразу «проглотить» огромный массив данных. Например, 8-часовую аудиозапись или целый репозиторий кода. Это как гигантский жëсткий диск.
Sonnet 4.5* же работает с памятью активно. У него есть «инструмент памяти» и «контекстное редактирование», чтобы убирать из контекста «мусор» и сохранять только важные факты. Это как быстрая оперативная память. Claude* не просто держит контекст, он им управляет, и это часто важнее.
Работа с кодом
Вот мы и добрались до главного. В поединке Gemini 2.5 Pro* vs Claude 4.5 Sonnet* именно этот аспект — ключевой критерий.
Claude Sonnet 4.5* — машина для кода. Anthropic* не врал, называя его «лучшим», и сейчас он доминирует на всех профессиональных бенчмарках. В тесте SWE-bench Verified на решение реальных проблем с GitHub* Sonnet 4.5* показывает 70,6%. А в «агентных» задачах, когда ИИ работает над сложным заданием — 82% [2].

У Gemini 2.5 Pro* результаты скромнее. На том же SWE-bench он показывает от 53,6% до 67,2% в зависимости от теста.
Проверка на увеличение объёма работ
Я поставил задачу, чтобы увидеть, будут ли модели «додумывать» за меня и выходить за рамки задания.
Промпт: «У меня есть два файла: utils.py и main.py, твоя задача переписать функцию get_user_data в utils.py, чтобы она также возвращала email john@example.com. Важно: не меняй main.py».

Результат:
- Claude Sonnet 4.5* молча поменял только utils.py.
- Gemini 2.5 Pro* поменял utils.py и «любезно» предложил поменять main.py, чтобы он выводил новый email, тем самым нарушив инструкцию.
Анализ данных
Если ваши данные — не только текст и код, Gemini 2.5 Pro* отыгрывается. Его главное преимущество — мультимодальность. Он может «слушать» аудио, «смотреть» и «создавать» видео и анализировать их [3].
А его функция Computer Use — находка для маркетологов и аналитиков. Ему можно сказать: «Зайди на эти 5 сайтов, примени фильтры, скопируй данные и собери в таблицу». И он это сделает, управляя браузером.
Claude Sonnet 4.5* тоже умеет работать с файлами и хорош в структурированном анализе, например, финансов, но огромный плюс Gemini* — в том, что он «видит», «слышит» и «кликает» в браузере.
Скорость и стабильность работы
Скорость — критичный параметр для комфортной работы. Sonnet 4.5* очень быстрый. Пользователи называют его «ежедневным драйвером», потому что с ним приятно работать, и он не «тупит». В прямом тесте на кодирование Sonnet 4.5* оказался в 2.8 раза быстрее Gemini*: 6 минут 5 секунд против 17 минут 1 секунды на одну и ту же задачу. Некоторые разработчики называют Gemini* «болезненно медленным».

Claude Sonnet 4.5* намного стабильнее: предсказуем, в точности делает то, о чëм его просят с первого раза. Gemini 2.5 Pro* менее постоянный. Его «творчество» и «разрастание задачи» делают его непредсказуемым, что крайне нежелательно для задач бизнеса и разработки.
Итоги сравнения и выводы
Итак, битва Claude* vs Gemini* окончена. Кто победил? Правда в том, что «лучшей» модели не существует. Есть правильный инструмент для конкретной задачи:
- Если нужен «академик»-исследователь для анализа гигантских объëмов разных данных, для сложных научных рассуждений или автоматизации работы в браузере, стоит выбрать Gemini 2.5 Pro*.
- Если нужен «инженер»-работяга для написания кода, создания текстов, автономных агентов и решения задач, где важны скорость, точность и надëжность, лучше остановиться на Claude Sonnet 4.5*.
Для нас в Universus явным победителем становится Claude Sonnet 4.5*, потому, что он точный рабочий инструмент, а не игрушка. Есть такое понятие, как «истинная стоимость». На бумаге Gemini 2.5 Pro* дешевле, но из-за его ошибок, «додумываний» и низкой стабильности он в итоге обходится бизнесу на 54% дороже [1]. Потому что вы тратите самый дорогой ресурс — время программистов и менеджеров — на исправление его «творчества».
Claude Sonnet 4.5* дороже «на входе», но гораздо дешевле «на выходе», потому что он отлично работает, а это главное.
О других ИИ читайте в статье «Сравнение ChatGPT 5* и Gemini 2.5 Pro*».
Часто задаваемые вопросы
1. Какая модель лучше для кодирования в 2025 году?
Однозначно Claude Sonnet 4.5*. Он лидирует на всех ключевых бенчмарках. Но важнее то, что в реальных тестах Sonnet 4.5* на 100% выполняет задачи и не страдает от «разрастания задачи» в отличие от Gemini*.
2. Правда ли, что Gemini 2.5 Pro* умнее?
Он «умнее» в академическом смысле. Gemini* лидирует в бенчмарках, требующих сложных научных рассуждений, в обычных разговорах он часто «ощущается» более эрудированным. Но в прикладных задачах, где нужно точное следование инструкциям, например, в кодинге, «умнее» и надëжнее Sonnet 4.5*.
3. У кого больше «память»?
У Gemini 2.5 Pro* стабильное окно в миллион токенов. У Sonnet 4.5* — 200 000 токенов с бета-доступом к миллиону. Но у Claude* есть Memory Tool и Context Editing, которые позволяют активнее управлять памятью и не засорять её, что эффективнее, чем просто большое «окно».
Отзывы учеников Universus
«Прошла курс по нейросетям в Universus и наконец-то поняла разницу. Раньше для меня все ИИ были на одно лицо. Статья Николая отлично раскладывает по полочкам. Я поняла, что для моих задач (анализ сайтов, сбор данных) мне идеально подходит Gemini 2.5 Pro* с его функцией Computer Use. Это меняет правила игры».
Марина, 48 лет, маркетолог
«Я долго плевался на ИИ-помощников. Они больше мешали, чем помогали. Постоянно приходилось за ними перепроверять. Но после того, как попробовал Claude Sonnet 4.5*, я поменял мнение. Это первая модель, которая реально слушает, что ей говоришь. Она не „креативит“ там, где не надо. То, что в статье написано про „разрастание задачи“ — это 100% правда. Спасибо Universus за точный анализ».
Алексей, 32 года, веб-разработчик
«Для меня главный показатель — деньги. Статья подтвердила мои ощущения. Мы попробовали внедрить Gemini* для автоматизации, но постоянно натыкались на ошибки. „Истинная стоимость“ — отличное определение. Дешëвый инструмент, который требует постоянного контроля, в итоге съедает всю прибыль. Переводим разработку на Sonnet 4.5*».
Виктор, 55 лет, предприниматель
«Я использую нейросети для написания текстов. И Claude Sonnet 4.5* — это моя любовь. Он пишет великолепно, у него живой слог, он понимает тон. Gemini* тоже пробовала, но он какой-то… более „роботизированный“, что ли. Рада, что в статье отметили писательский талант Claude*».
Елена, 42 года, SMM-специалист
*Сервисы Anthropic (Claude) и Google (Gemini), GitHub официально ограничили или прекратили работу на территории РФ.
Источники:
- dev.to/forgecode/claude-4-vs-gemini-25-pro-a-developers-deep-dive-comparison-52p4
- www.anthropic.com/news/claude-sonnet-4-5
- docs.cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-5-pro
+7 (966) 666-81-26

