Прогнозы в AI обычно стареют за квартал. Поэтому этот пост не про «AGI к 2030» и не про «нейросети заменят всех». Это разбор шести конкретных направлений, в которые сейчас идут деньги и таланты, плюс предельно практичный список того, что нужно делать маркетологу, дизайнеру и разработчику уже в 2026-м, чтобы не отстать.
Каждое направление — это не футурология, а то, что уже работает в продакшене у крупных компаний или будет работать в течение 12-18 месяцев. Я опираюсь на отчёты Anthropic, OpenAI, Google DeepMind и Meta AI Research, плюс данные по венчурным инвестициям AI-стартапов за Q1 2026.
1. Agentic AI: модели, которые делают, а не отвечают
Главный сдвиг 2025-2026 года — от chat-AI к agentic AI. Разница принципиальна. Chat-AI отвечает на вопрос. Agent-AI выполняет многошаговую задачу: «забронируй мне столик в итальянском ресторане в центре на пятницу 19:00 на двоих и закинь приглашение в календарь».
Флагманы сейчас:
- Claude Computer Use (Anthropic, релиз октябрь 2024, обновление март 2026). Модель видит экран и управляет курсором/клавиатурой как человек. На бенчмарке OSWorld — 28% против 12% у предыдущей версии.
- ChatGPT Operator (OpenAI, релиз январь 2025, GA-доступ март 2026). Бронирует билеты, оформляет заказы, заполняет формы — через виртуальный браузер с человеческим интерфейсом.
- Gemini 2 with Project Mariner (Google, превью октябрь 2025). Аналог Operator, интегрирован в Chrome.
К концу 2026 года agentic-функции станут стандартом. К концу 2027 — войдут в OS (Apple Intelligence, Windows Copilot+). Это серьёзно изменит UX компьютера: меньше клика, больше делегирования.
2. Realtime multimodal: видео, аудио и чат одновременно
Сейчас вы открываете отдельный чат для текста, отдельную модель для генерации видео, отдельную — для голоса. К 2027 году эти потоки объединятся в один realtime-канал. Прототипы уже есть:
- OpenAI Realtime API (GA октябрь 2024) — голосовой разговор с GPT-4o с задержкой 300мс. К 2026 — расширен на видео-вход.
- Gemini Live (GA сентябрь 2024) — голосовой ассистент с видео-восприятием через камеру телефона.
- Sora 2 Realtime (анонс март 2026) — генерация видео ниже одной секунды на короткие промпты, демо-доступ внутри OpenAI.
Что это значит: к 2027 году появятся приложения, где AI-видео генерируется в ответ на голос в реальном времени. Это меняет UX образования, развлечений, видеосвязи. Прогноз: первое массовое приложение в этой категории — конец 2026 — начало 2027.
3. On-device модели: AI без облака
В 2024-2025 годах все вычисления уходили в облако. В 2026-м — серьёзная часть LLM-запросов обрабатывается локально на устройстве:
- Apple Intelligence на iPhone 15 Pro+ и M-Mac. Локальная модель 3B параметров для базовых задач (suggestions, рерайт, простые ответы). Сложные запросы — в Private Cloud Compute или ChatGPT.
- Gemini Nano на Pixel 9, Samsung S25, ASUS Zenfone 11 Ultra. Локально работают суммаризация уведомлений, smart reply, генерация ответов.
- Phi-4 от Microsoft (релиз декабрь 2024) — 14B параметров на консьюмерском GPU.
Зачем это нужно: privacy (данные не уходят в облако), latency (мгновенный ответ без интернета), стоимость (нет API-платежей). К 2027 году ожидается, что 40% всех LLM-запросов будут обрабатываться on-device — это качественно меняет рынок.
4. Специализированные модели: медицина, право, наука
Эра «один GPT для всего» заканчивается. На 2026-2027 — рост специализированных моделей, обученных на доменных данных и проходящих профессиональные сертификации:
- Med-Gemini (Google DeepMind) — обучена на медицинских данных, прошла USMLE на 91% (выше большинства практикующих врачей).
- Harvey для юристов — fine-tuned LLM поверх GPT для анализа договоров и судебной практики. Используется в Allen & Overy, PwC Legal.
- AlphaFold 3 (DeepMind) — структура белков и других биомолекул, лежит в основе фарм-разработок.
- FinGPT и аналоги — модели для финансовой аналитики, прогнозов, анализа отчётности.
Тренд: вместо универсальной модели, которая хорошо знает всё на уровне 70-75%, будут вертикальные модели с уровнем 95%+ в своей области. Это аналогично тому, как развивалось ПО: от универсальных IDE к специализированным под язык/фреймворк.
5. Open-source паритет с frontier
В 2023 году open-source модели отставали от GPT-4 на 18-24 месяца. В 2025 — на 6-9 месяцев. К концу 2026 года ожидается полный паритет: open-source флагман станет неотличим от закрытой модели на большинстве задач.
Кто лидирует:
- Llama 4 (Meta, релиз февраль 2026) — 405B параметров, MoE-архитектура. На MMLU — 87.5% против 89% у GPT-5.
- DeepSeek V4 (анонс март 2026) — Reasoning-модель за треть стоимости OpenAI o1.
- Mistral Large 3 — европейская альтернатива, лицензия Apache 2.0 для коммерции.
- Qwen 3 от Alibaba — лидер на бенчмарках для китайского и азиатских языков.
Что это даёт: компании смогут разворачивать frontier-качество AI на своих серверах. Это критично для регулируемых индустрий (банки, медицина, госсектор), где облачный AI запрещён или ограничен.
6. Регуляция: AI Act, точечные законы, маркировка
EU AI Act полностью вступает в силу к августу 2026 года. Основные обязательства:
- Маркировка AI-контента через C2PA-метаданные (статья 50). Несоблюдение — штрафы до €15M или 3% выручки.
- Транспарентность GPAI: провайдеры должны публиковать сводку обучающих данных.
- Запрет на социальные scoring-системы, real-time распознавание лиц в публичных местах, manipulative AI (статья 5).
- High-risk AI (медицина, рекрутинг, кредитование) — обязательная сертификация.
США идут точечными законами: AI Executive Order Байдена (2023, частично отменён в 2025), федеральный закон против deepfake (принят в марте 2026), законы Калифорнии и Иллинойса о disclosure AI в рекламе. В РФ обсуждается аналог AI Act, проект внесён в Госдуму в марте 2026 года.
Что это меняет практически: маркировка станет нормой, юр-департаменты войдут в каждый AI-проект, появится новая категория compliance-специалистов по AI.
Инфраструктурные вызовы: энергия, чипы, дата-центры
Прогресс AI ограничен не только алгоритмами, но и физикой. В 2026 году мы упёрлись в три инфраструктурных потолка одновременно.
Энергопотребление. По данным International Energy Agency, дата-центры на AI потребляют в 2026 году около 4% мирового электричества — больше, чем вся Япония. Прогноз на 2027: 6-7%. Это давит на электросети, особенно в США и Ирландии, где идёт массовое строительство AI-кампусов. Microsoft уже договорился о возобновлении атомной станции Three Mile Island для питания AI-инфраструктуры.
Дефицит чипов. NVIDIA остаётся монополистом по тренировочным GPU (H100, H200, B200). Очередь на B200 в 2026 году — 8-12 месяцев. Альтернативы (AMD MI300, Google TPU v5, Amazon Trainium 2) набирают долю, но не закрывают спрос.
Дата-центры и охлаждение. Современный AI-кампус потребляет 100-300 МВт. Это сопоставимо с малым городом. Локации, где можно одновременно подключить такую мощность и иметь доступ к воде для охлаждения — дефицитный ресурс. Это объясняет, почему AI-инфраструктура концентрируется в Texas, Iowa, Ireland, Nordics.
Что это значит для конечного пользователя: цена API будет снижаться медленнее ожидаемого. Доступность frontier-моделей может стать ограниченной в часы пик. Бизнесу стоит планировать AI-расходы с учётом этих факторов.
AI Safety: что обсуждают исследователи в 2026
Параллельно с коммерческим развитием идёт большая исследовательская работа по безопасности. Главные направления в 2026:
- Alignment. Как сделать так, чтобы модель оптимизировала то, что человек реально хочет, а не букву инструкции. Anthropic с Constitutional AI и OpenAI с RLHF / Deliberative Alignment лидируют в этой области.
- Interpretability. Понимание того, что происходит внутри нейросети. Anthropic в 2024-2025 годах опубликовала прорывные работы по mechanistic interpretability — извлечению «фич» и «schemes» из активаций модели.
- Sandboxing для agentic AI. Когда модель управляет компьютером, нужна защита от того, чтобы она не нанесла вреда (стёрла файлы, оплатила лишнее, утекла данные). Active area of research.
- Безопасное масштабирование. Чем больше модель, тем сложнее предсказать её поведение. Каждая лаборатория формирует свой Responsible Scaling Policy / Preparedness Framework.
На какой риск стоит обращать внимание прямо сейчас:
- Prompt injection. Атака, при которой пользователь подсовывает скрытые инструкции в данные, которые читает агент. Главная уязвимость agentic AI в 2026 году.
- Data leakage. Модель может «вспомнить» обучающие данные и выдать их в ответе. Решается через differential privacy и фильтрацию training data.
- Misinformation at scale. AI генерирует убедительный контент в больших объёмах — это меняет ландшафт fake news и социальной инженерии.
Что происходит с AI в России
На российском рынке AI в 2026 году несколько ключевых процессов:
- Импортозамещение моделей. Yandex YandexGPT 5, T-Bank T-pro, Sber GigaChat 3 — отечественные LLM, которые догнали GPT-4o в задачах на русском языке. Для корпоратов это становится альтернативой иностранным API.
- Доступ к иностранным моделям. Ограничения OpenAI и Anthropic на российские IP-адреса заставляют использовать прокси-сервисы и боты-агрегаторы вроде Quantium.
- Регулирование. В Госдуме обсуждается проект «закона о регулировании искусственного интеллекта», внесённый в марте 2026 года. Концепция — близко к EU AI Act, но с акцентом на маркировку и ответственность платформ.
- Кадры. Большой отток AI-исследователей в 2022-2024 годах сменился стабилизацией. Yandex, Sber, T-Bank активно набирают команды в Сербии, Армении, Казахстане для удалённой работы на московский офис.
Для российского бизнеса в 2026 году актуальны три варианта: 1) использовать отечественные LLM (для гос-сектора и регулируемых индустрий), 2) использовать иностранные через ботов-агрегаторы (для маркетинга, контента, дизайна), 3) гибридная стратегия — критичные данные в РФ-моделях, креатив и контент в иностранных.
Какие профессии исчезнут, какие появятся
Уйдут или сильно трансформируются
- Junior-копирайтеры универсального профиля. SEO-статьи, описания товаров, базовый email-маркетинг — это переходит в AI. См. наш эксперимент AI vs копирайтер.
- Junior-программисты. Boilerplate, простые CRUD, базовые тесты — AI делает за минуты.
- Графические дизайнеры стоковых изображений. Малый бизнес заменит покупку стока на AI-генерацию.
- Базовая бухгалтерия. Категоризация транзакций, простые отчёты — на AI с верификацией бухгалтером.
- Колл-центры первой линии. Голосовые agents с GPT-уровнем уже работают в Tinkoff, Сбере, Альфа-Банке.
Появятся и расширятся
- AI-редактор контента. Доводит AI-драфты до публикации, проверяет факты, настраивает тон.
- Промпт-инженер. Специалист по проектированию диалогов с AI для бизнеса. Зарплаты в США — $200-400K.
- AI-architect. Проектирует workflow с несколькими моделями для корпораций.
- AI-compliance officer. Юр-специалист по AI Act, GDPR, корпоративному использованию.
- Tone-of-voice стратег. Специалист по формированию голоса бренда в AI-контенте. Премиум-сегмент.
- Доменный эксперт-копирайтер. Доктор, который пишет в медицинский блог. Юрист — в юридический. AI без эксперта не работает в специализированных областях.
Что делать прямо сейчас
Если у вас есть конкретная роль — вот что делать в ближайшие 6-12 месяцев.
Маркетологу
Дизайнеру
Разработчику
7 моделей, которые стоит освоить уже сейчас
- GPT-5 (OpenAI) — универсальный флагман. Доступен в чате Quantium. Используйте для большинства задач по умолчанию.
- Claude Sonnet 4.5 (Anthropic) — длинные тексты, код, аналитика. Лидер на бенчмарках reasoning. Тоже в Quantium.
- Gemini 2.5 Pro (Google) — мультимодальность, контекстное окно 2M токенов. Идеален для работы с PDF и длинными документами.
- FLUX 2 Pro (Black Forest Labs) — фотореалистичная графика. См. наш промпт-гайд.
- GPT-Image (OpenAI) — редактирование изображений, маски, character consistency.
- Sora 2 (OpenAI) — видео-генерация с лучшей физикой в индустрии.
- ElevenLabs — TTS уровня кинопродакшна, клонирование голоса. См. подкастинг через TTS.
Все семь моделей доступны в Quantium одной подпиской — это сокращает porog входа для тех, кто хочет освоить их параллельно, не оформляя 7 отдельных аккаунтов.
Главный вывод
Будущее не «AI заменит профессии». Будущее — AI станет таким же базовым инструментом, как Excel в 1995-м и интернет в 2005-м. Люди, которые освоят его на 2-3 года раньше остальных, получат значимое преимущество. Те, кто проигнорирует — постепенно потеряют конкурентоспособность.
Это не про панику. Это про спокойную и системную работу с инструментами, которые уже здесь. Семь моделей выше, гибридный workflow, фокус на стратегии и доменной экспертизе — этого достаточно, чтобы пройти 2026-2027 годы без потерь.
Связанные материалы: Тренды AI-видео 2026, AI vs копирайтер, Сравнение чат-моделей, Все модели Quantium.
Попробуйте Quantium бесплатно
20 кредитов в месяц на бесплатном тарифе. 30+ нейросетей в одном Telegram-боте.
Открыть бот →


