AI-дайджест #3: Mercury 2 убивает reasoning-бутылочное горлышко, Kling 3.0 с аудио, JetBrains переизобретает IDE
Неделя прошла под знаком скорости и агентов: новая архитектура сломала миф о том, что reasoning-модели медленные, JetBrains переосмыслил IDE под многоагентную разработку, а Kling научился говорить. Разбираю, что из этого реально меняет работу.
Mercury 2 — reasoning-модель 1000+ токенов/сек, в 5 раз быстрее Claude
Mercury 2 — первый reasoning diffusion LLM (dLLM): генерирует несколько токенов параллельно вместо последовательного. Результат — 1000+ токенов/сек против 150–200 у конкурентов, при этом дешевле GPT-5 Mini и Claude 4.5 Haiku в 5 раз. Рассуждает и быстро.
Почему это важно для бизнеса
Раньше была дилемма: хочешь умно — жди, хочешь быстро — получай поверхностный ответ. Mercury 2 эту дилемму снимает. Для бизнеса это значит: AI-агенты на reasoning-моделях перестают быть «медленными» и становятся practical для real-time задач — чат-боты, голосовые ассистенты, мгновенный анализ.
LLMreasoningпроизводительностьAI-агент
Gemini 3.1 Pro — лидер в 13 из 16 бенчмарков, цена не изменилась
Google выпустил Gemini 3.1 Pro с ARC-AGI-2 score 77.1% — лучший результат среди всех моделей. Лидирует в кодировании, математике и логике. Цена осталась прежней: $2 за 1M input токенов, $12 за output.
Почему это важно для бизнеса
Google продолжает агрессивную стратегию: улучшают модель, не поднимая цену. Для разработчиков в России это прямая выгода — если вы на Gemini 2.0 Flash в своих проектах, апгрейд до 3.1 Pro даёт ощутимый прирост качества за те же деньги. Особенно заметно на сложных рассуждениях и генерации кода.
LLMGeminiбенчмаркиAPI
JetBrains выпустил Air и Junie CLI — многоагентная разработка в IDE
Air — окружение для параллельного запуска нескольких AI-агентов на разные подзадачи прямо из IDE. Junie CLI — LLM-agnostic кодинг-агент для любого редактора, терминала и CI/CD. Оба инструмента доступны с марта 2026.
Почему это важно для бизнеса
JetBrains признал очевидное: будущее разработки — это не «AI помогает писать код», а «разработчик оркестрирует агентов». Air позволяет запустить 5 агентов одновременно на разные задачи и собрать результат. Для тех, кто уже работает как оркестратор — это нативный инструмент под ваш стиль работы.
IDEAI-агентразработкаJetBrains
Kling 3.0 — видео + нативное аудио в одной генерации
Kling 3.0 (платформа Omni One) генерирует видео и аудио синхронно: диалог персонажей, фоновые звуки, атмосфера. Добавлен Element Binding — стабильность лица под разными углами. Поддержка 5 языков для аудио (русский пока не входит). Chain-of-Thought reasoning перед сложными сценами.
Почему это важно для бизнеса
Для контент-маркетинга это сдвиг: раньше нужно было отдельно генерить видео, отдельно накладывать звук в редакторе. Теперь промо-ролик с атмосферой — за один запрос. Русский язык пока через ElevenLabs или Яндекс SpeechKit поверх, но визуальная часть уже на уровне студийного продакшна.
генерация видеоконтент-маркетингмультимодальный AI
Galileo выпустил Agent Control — governance framework для AI-агентов
Open-source слой управления для AI-агентов: стандарты поведения, аудит действий, ограничения бизнес-логики. Рынок agentic AI — $9 млрд в 2026, прогноз $139 млрд к 2034.
Почему это важно для бизнеса
Пока AI-агенты — это стартапы и эксперименты, governance никому не нужен. Но когда агент начинает автоматически отправлять письма клиентам или менять данные в CRM — вопрос «кто отвечает за ошибку» становится юридическим. Agent Control — первый шаг к enterprise-стандарту. Следим.
AI-агентбезопасностьenterpriseopen-source
Harness: AI-разработчики деплоят в 3 раза чаще, но DevOps не успевает
Исследование 2000+ разработчиков: активные пользователи AI-инструментов деплоят ежедневно в 45% случаев против 15% у тех, кто AI не использует. Но 69% тех же активных пользователей сталкиваются с проблемами при деплое — CI/CD и тестирование не рассчитаны на такой темп.
Почему это важно для бизнеса
Узкое место сместилось. Раньше писать код было долго — теперь долго деплоить и проверять. Для заказчиков вывод: если исполнитель говорит «AI ускорил разработку в 10 раз» — спросите про тесты и CI/CD. Скорость без автоматизированного контроля качества — это технический долг со скоростью ×10.
разработкаDevOpsпродуктивностьстатистика
Частые вопросы
Mercury 2 заменит Claude и GPT для разработки?
Для задач где нужна скорость и reasoning одновременно — да, это сильный кандидат. Но экосистема, интеграции и надёжность у OpenAI/Anthropic пока лучше. Mercury 2 стоит протестировать в конкретных сценариях: real-time анализ, быстрые агенты, высокий RPS.
Kling 3.0 доступен в России без VPN?
Да, китайские сервисы РФ не блокируют. Русский интерфейс есть, для аудио на русском пока нужен постпродакшн через Яндекс SpeechKit или ElevenLabs. Визуальная часть — полностью рабочая.
Стоит ли переходить на Gemini 3.1 Pro если уже на 2.0 Flash?
Зависит от задачи. Для простых Telegram-ботов и быстрых ответов Gemini 2.0 Flash по-прежнему оптимален по цене. Gemini 3.1 Pro берите когда нужно сложное рассуждение, анализ документов или генерация кода уровня выше среднего.