AI-дайджест #2: GPT-5.4, Gemini 3.1 Flash-Lite, Anthropic vs Пентагон, DeepSeek V4 на подходе
Неделя, которая войдёт в историю: три крупнейших AI-компании выпустили новые модели за 5 дней, Anthropic поссорился с Пентагоном из-за AI-безопасности, а OpenAI привлёк $110 млрд. Разбираю, что из этого реально важно для бизнеса.
OpenAI выпустил GPT-5.4 — первая модель с нативным computer use
GPT-5.4 вышел 5 марта в трёх версиях: стандартная, Thinking (для рассуждений) и Pro (для API). Ключевое: нативный computer use — модель умеет управлять компьютером через скриншоты, мышь и клавиатуру. Контекст до 1 млн токенов, точность на 33% выше GPT-5.2, ошибок в ответах на 18% меньше.
Почему это важно для бизнеса
Computer use — это не про замену разработчиков. Это про автоматизацию рутины: заполнение CRM, выгрузка отчётов из 1С, перенос данных между системами. Для малого бизнеса — возможность автоматизировать то, что раньше делал помощник за 40 000₽/мес.
LLMGPTcomputer useAI-агент
Google выпустил Gemini 3.1 Flash-Lite — самая дешёвая модель для разработчиков
3 марта Google представил Gemini 3.1 Flash-Lite: $0.25 за миллион входных токенов, скорость генерации на 45% выше Gemini 2.5 Flash, до 1 млн токенов контекста. Обогнал GPT-5 mini и Claude 4.5 Haiku в 6 из 8 бенчмарков.
Почему это важно для бизнеса
Для бизнеса это значит: AI-боты и автоматизация стали ещё дешевле. Telegram-бот на Gemini 3.1 Flash-Lite при 1000 диалогов в день обойдётся примерно в $3–5/мес на API. Это дешевле чашки кофе.
LLMGeminiAPIстоимость
Anthropic потерял контракт с Пентагоном на $200M из-за AI-безопасности
Anthropic отказался ослабить ограничения безопасности Claude для военного использования. Пентагон объявил компанию «риском для цепочки поставок» — впервые для американской компании. OpenAI попытался подхватить контракт, но откатился после внутреннего сопротивления сотрудников. К 7 марта Anthropic возобновил переговоры с Пентагоном.
Почему это важно для бизнеса
Anthropic выбрал принципы вместо $200M — редкость в BigTech. Для бизнеса вывод простой: если вы работаете с персональными данными и выбираете AI-провайдера, Anthropic пока самый прозрачный в вопросах безопасности. Но ситуация развивается.
AnthropicAI-безопасностьрегулирование
DeepSeek V4 вот-вот выйдет: мультимодальная модель на триллион параметров
DeepSeek готовит V4 — мультимодальную MoE-модель на триллион параметров (~32B активных), с контекстом 1M токенов. Оптимизирована под чипы Huawei Ascend. Утечки показывают 90% на HumanEval и 80%+ на SWE-bench. Модель будет open-source.
Почему это важно для бизнеса
Если бенчмарки подтвердятся — это лучшая кодовая модель в мире, и она бесплатная. Для разработчиков в России это особенно актуально: модель работает на китайском железе, значит санкции не влияют. Следим за релизом.
DeepSeekopen-sourceмультимодальный AI
OpenAI привлёк $110 млрд при оценке $730 млрд — рекорд частного финансирования
Amazon вложил $50 млрд, Nvidia — $30 млрд, SoftBank — $30 млрд. OpenAI расширяет партнёрство с AWS на $100 млрд за 8 лет. Модели OpenAI будут работать на Amazon Bedrock.
Почему это важно для бизнеса
Масштаб инвестиций говорит об одном: крупнейшие корпорации ставят на AI как на следующую платформу уровня интернета. Для малого бизнеса это хорошая новость — конкуренция между провайдерами снижает цены на API.
инвестицииOpenAIтренды
GitHub: 43 млн PR в месяц — AI создаёт «бутылочное горлышко» на ревью
GitHub зафиксировал рост PR на 23% год к году — до 43 млн в месяц. AI-ассистенты ускоряют написание кода, но ревью остаётся ручным. Copilot покрывает только 20% рабочего процесса разработчика. TypeScript стал языком #1 (+66%) — типизация помогает LLM писать точнее.
Почему это важно для бизнеса
Код пишется быстрее, но проверять его всё ещё должен человек. Для заказчиков это значит: не верьте обещаниям «сделаю за день с AI». Скорость написания — это 30% процесса, остальное — архитектура, тестирование, ревью. Ищите исполнителя, который это понимает.
разработкаGitHubпродуктивность
Apple отложил «умную Siri» — часть функций перенесена на осень
Обновлённая Siri с AI должна была выйти в iOS 26.4 в марте, но часть функций перенесена на май или iOS 27 (сентябрь). Apple заключил сделку с Google на использование Gemini — $1.5 млрд/год. Три ключевые функции: личный контекст, понимание экрана, управление приложениями голосом.
Почему это важно для бизнеса
Apple опаздывает с AI — и это типично для компании, которая не спешит, а «делает правильно». Для бизнеса пока ничего не меняется: Siri по-прежнему не конкурент Telegram-ботам или кастомным решениям для работы с клиентами.
AppleSiriголосовой AI
Частые вопросы
GPT-5.4 или Claude Sonnet 4.6 — что лучше для бизнес-задач?
Зависит от задачи. GPT-5.4 сильнее в computer use и автоматизации рабочего стола. Claude 4.6 лучше в длинных рассуждениях и работе с документами. Для Telegram-ботов оба избыточны — подойдёт Gemini 3.1 Flash-Lite за копейки.
DeepSeek V4 — можно ли использовать в России?
Да, модель будет open-source. Можно развернуть на своём сервере или арендованном GPU. Оптимизация под Huawei Ascend — плюс для российского рынка, где доступ к Nvidia ограничен.
Стоит ли ждать DeepSeek V4 или начинать проект сейчас?
Начинайте сейчас. Архитектура продукта не зависит от конкретной модели — LLM можно поменять за час. Ждать «идеальную модель» — терять время. Через месяц выйдет ещё что-то новое.