Прогнозы в AI обычно стареют за квартал. Поэтому этот пост не про «AGI к 2030» и не про «нейросети заменят всех». Это разбор шести конкретных направлений, в которые сейчас идут деньги и таланты, плюс предельно практичный список того, что нужно делать маркетологу, дизайнеру и разработчику уже в 2026-м, чтобы не отстать.

Каждое направление — это не футурология, а то, что уже работает в продакшене у крупных компаний или будет работать в течение 12-18 месяцев. Я опираюсь на отчёты Anthropic, OpenAI, Google DeepMind и Meta AI Research, плюс данные по венчурным инвестициям AI-стартапов за Q1 2026.

1. Agentic AI: модели, которые делают, а не отвечают

Главный сдвиг 2025-2026 года — от chat-AI к agentic AI. Разница принципиальна. Chat-AI отвечает на вопрос. Agent-AI выполняет многошаговую задачу: «забронируй мне столик в итальянском ресторане в центре на пятницу 19:00 на двоих и закинь приглашение в календарь».

Флагманы сейчас:

  • Claude Computer Use (Anthropic, релиз октябрь 2024, обновление март 2026). Модель видит экран и управляет курсором/клавиатурой как человек. На бенчмарке OSWorld — 28% против 12% у предыдущей версии.
  • ChatGPT Operator (OpenAI, релиз январь 2025, GA-доступ март 2026). Бронирует билеты, оформляет заказы, заполняет формы — через виртуальный браузер с человеческим интерфейсом.
  • Gemini 2 with Project Mariner (Google, превью октябрь 2025). Аналог Operator, интегрирован в Chrome.

К концу 2026 года agentic-функции станут стандартом. К концу 2027 — войдут в OS (Apple Intelligence, Windows Copilot+). Это серьёзно изменит UX компьютера: меньше клика, больше делегирования.

2. Realtime multimodal: видео, аудио и чат одновременно

Сейчас вы открываете отдельный чат для текста, отдельную модель для генерации видео, отдельную — для голоса. К 2027 году эти потоки объединятся в один realtime-канал. Прототипы уже есть:

  • OpenAI Realtime API (GA октябрь 2024) — голосовой разговор с GPT-4o с задержкой 300мс. К 2026 — расширен на видео-вход.
  • Gemini Live (GA сентябрь 2024) — голосовой ассистент с видео-восприятием через камеру телефона.
  • Sora 2 Realtime (анонс март 2026) — генерация видео ниже одной секунды на короткие промпты, демо-доступ внутри OpenAI.

Что это значит: к 2027 году появятся приложения, где AI-видео генерируется в ответ на голос в реальном времени. Это меняет UX образования, развлечений, видеосвязи. Прогноз: первое массовое приложение в этой категории — конец 2026 — начало 2027.

3. On-device модели: AI без облака

В 2024-2025 годах все вычисления уходили в облако. В 2026-м — серьёзная часть LLM-запросов обрабатывается локально на устройстве:

  • Apple Intelligence на iPhone 15 Pro+ и M-Mac. Локальная модель 3B параметров для базовых задач (suggestions, рерайт, простые ответы). Сложные запросы — в Private Cloud Compute или ChatGPT.
  • Gemini Nano на Pixel 9, Samsung S25, ASUS Zenfone 11 Ultra. Локально работают суммаризация уведомлений, smart reply, генерация ответов.
  • Phi-4 от Microsoft (релиз декабрь 2024) — 14B параметров на консьюмерском GPU.

Зачем это нужно: privacy (данные не уходят в облако), latency (мгновенный ответ без интернета), стоимость (нет API-платежей). К 2027 году ожидается, что 40% всех LLM-запросов будут обрабатываться on-device — это качественно меняет рынок.

4. Специализированные модели: медицина, право, наука

Эра «один GPT для всего» заканчивается. На 2026-2027 — рост специализированных моделей, обученных на доменных данных и проходящих профессиональные сертификации:

  • Med-Gemini (Google DeepMind) — обучена на медицинских данных, прошла USMLE на 91% (выше большинства практикующих врачей).
  • Harvey для юристов — fine-tuned LLM поверх GPT для анализа договоров и судебной практики. Используется в Allen & Overy, PwC Legal.
  • AlphaFold 3 (DeepMind) — структура белков и других биомолекул, лежит в основе фарм-разработок.
  • FinGPT и аналоги — модели для финансовой аналитики, прогнозов, анализа отчётности.

Тренд: вместо универсальной модели, которая хорошо знает всё на уровне 70-75%, будут вертикальные модели с уровнем 95%+ в своей области. Это аналогично тому, как развивалось ПО: от универсальных IDE к специализированным под язык/фреймворк.

5. Open-source паритет с frontier

В 2023 году open-source модели отставали от GPT-4 на 18-24 месяца. В 2025 — на 6-9 месяцев. К концу 2026 года ожидается полный паритет: open-source флагман станет неотличим от закрытой модели на большинстве задач.

Кто лидирует:

  • Llama 4 (Meta, релиз февраль 2026) — 405B параметров, MoE-архитектура. На MMLU — 87.5% против 89% у GPT-5.
  • DeepSeek V4 (анонс март 2026) — Reasoning-модель за треть стоимости OpenAI o1.
  • Mistral Large 3 — европейская альтернатива, лицензия Apache 2.0 для коммерции.
  • Qwen 3 от Alibaba — лидер на бенчмарках для китайского и азиатских языков.

Что это даёт: компании смогут разворачивать frontier-качество AI на своих серверах. Это критично для регулируемых индустрий (банки, медицина, госсектор), где облачный AI запрещён или ограничен.

6. Регуляция: AI Act, точечные законы, маркировка

EU AI Act полностью вступает в силу к августу 2026 года. Основные обязательства:

  • Маркировка AI-контента через C2PA-метаданные (статья 50). Несоблюдение — штрафы до €15M или 3% выручки.
  • Транспарентность GPAI: провайдеры должны публиковать сводку обучающих данных.
  • Запрет на социальные scoring-системы, real-time распознавание лиц в публичных местах, manipulative AI (статья 5).
  • High-risk AI (медицина, рекрутинг, кредитование) — обязательная сертификация.

США идут точечными законами: AI Executive Order Байдена (2023, частично отменён в 2025), федеральный закон против deepfake (принят в марте 2026), законы Калифорнии и Иллинойса о disclosure AI в рекламе. В РФ обсуждается аналог AI Act, проект внесён в Госдуму в марте 2026 года.

Что это меняет практически: маркировка станет нормой, юр-департаменты войдут в каждый AI-проект, появится новая категория compliance-специалистов по AI.

Инфраструктурные вызовы: энергия, чипы, дата-центры

Прогресс AI ограничен не только алгоритмами, но и физикой. В 2026 году мы упёрлись в три инфраструктурных потолка одновременно.

Энергопотребление. По данным International Energy Agency, дата-центры на AI потребляют в 2026 году около 4% мирового электричества — больше, чем вся Япония. Прогноз на 2027: 6-7%. Это давит на электросети, особенно в США и Ирландии, где идёт массовое строительство AI-кампусов. Microsoft уже договорился о возобновлении атомной станции Three Mile Island для питания AI-инфраструктуры.

Дефицит чипов. NVIDIA остаётся монополистом по тренировочным GPU (H100, H200, B200). Очередь на B200 в 2026 году — 8-12 месяцев. Альтернативы (AMD MI300, Google TPU v5, Amazon Trainium 2) набирают долю, но не закрывают спрос.

Дата-центры и охлаждение. Современный AI-кампус потребляет 100-300 МВт. Это сопоставимо с малым городом. Локации, где можно одновременно подключить такую мощность и иметь доступ к воде для охлаждения — дефицитный ресурс. Это объясняет, почему AI-инфраструктура концентрируется в Texas, Iowa, Ireland, Nordics.

Что это значит для конечного пользователя: цена API будет снижаться медленнее ожидаемого. Доступность frontier-моделей может стать ограниченной в часы пик. Бизнесу стоит планировать AI-расходы с учётом этих факторов.

AI Safety: что обсуждают исследователи в 2026

Параллельно с коммерческим развитием идёт большая исследовательская работа по безопасности. Главные направления в 2026:

  • Alignment. Как сделать так, чтобы модель оптимизировала то, что человек реально хочет, а не букву инструкции. Anthropic с Constitutional AI и OpenAI с RLHF / Deliberative Alignment лидируют в этой области.
  • Interpretability. Понимание того, что происходит внутри нейросети. Anthropic в 2024-2025 годах опубликовала прорывные работы по mechanistic interpretability — извлечению «фич» и «schemes» из активаций модели.
  • Sandboxing для agentic AI. Когда модель управляет компьютером, нужна защита от того, чтобы она не нанесла вреда (стёрла файлы, оплатила лишнее, утекла данные). Active area of research.
  • Безопасное масштабирование. Чем больше модель, тем сложнее предсказать её поведение. Каждая лаборатория формирует свой Responsible Scaling Policy / Preparedness Framework.

На какой риск стоит обращать внимание прямо сейчас:

  • Prompt injection. Атака, при которой пользователь подсовывает скрытые инструкции в данные, которые читает агент. Главная уязвимость agentic AI в 2026 году.
  • Data leakage. Модель может «вспомнить» обучающие данные и выдать их в ответе. Решается через differential privacy и фильтрацию training data.
  • Misinformation at scale. AI генерирует убедительный контент в больших объёмах — это меняет ландшафт fake news и социальной инженерии.

Что происходит с AI в России

На российском рынке AI в 2026 году несколько ключевых процессов:

  • Импортозамещение моделей. Yandex YandexGPT 5, T-Bank T-pro, Sber GigaChat 3 — отечественные LLM, которые догнали GPT-4o в задачах на русском языке. Для корпоратов это становится альтернативой иностранным API.
  • Доступ к иностранным моделям. Ограничения OpenAI и Anthropic на российские IP-адреса заставляют использовать прокси-сервисы и боты-агрегаторы вроде Quantium.
  • Регулирование. В Госдуме обсуждается проект «закона о регулировании искусственного интеллекта», внесённый в марте 2026 года. Концепция — близко к EU AI Act, но с акцентом на маркировку и ответственность платформ.
  • Кадры. Большой отток AI-исследователей в 2022-2024 годах сменился стабилизацией. Yandex, Sber, T-Bank активно набирают команды в Сербии, Армении, Казахстане для удалённой работы на московский офис.

Для российского бизнеса в 2026 году актуальны три варианта: 1) использовать отечественные LLM (для гос-сектора и регулируемых индустрий), 2) использовать иностранные через ботов-агрегаторы (для маркетинга, контента, дизайна), 3) гибридная стратегия — критичные данные в РФ-моделях, креатив и контент в иностранных.

Какие профессии исчезнут, какие появятся

Уйдут или сильно трансформируются

  • Junior-копирайтеры универсального профиля. SEO-статьи, описания товаров, базовый email-маркетинг — это переходит в AI. См. наш эксперимент AI vs копирайтер.
  • Junior-программисты. Boilerplate, простые CRUD, базовые тесты — AI делает за минуты.
  • Графические дизайнеры стоковых изображений. Малый бизнес заменит покупку стока на AI-генерацию.
  • Базовая бухгалтерия. Категоризация транзакций, простые отчёты — на AI с верификацией бухгалтером.
  • Колл-центры первой линии. Голосовые agents с GPT-уровнем уже работают в Tinkoff, Сбере, Альфа-Банке.

Появятся и расширятся

  • AI-редактор контента. Доводит AI-драфты до публикации, проверяет факты, настраивает тон.
  • Промпт-инженер. Специалист по проектированию диалогов с AI для бизнеса. Зарплаты в США — $200-400K.
  • AI-architect. Проектирует workflow с несколькими моделями для корпораций.
  • AI-compliance officer. Юр-специалист по AI Act, GDPR, корпоративному использованию.
  • Tone-of-voice стратег. Специалист по формированию голоса бренда в AI-контенте. Премиум-сегмент.
  • Доменный эксперт-копирайтер. Доктор, который пишет в медицинский блог. Юрист — в юридический. AI без эксперта не работает в специализированных областях.

Что делать прямо сейчас

Если у вас есть конкретная роль — вот что делать в ближайшие 6-12 месяцев.

Маркетологу

Освойте 3-4 ключевые модели. GPT-5, Claude, Gemini, FLUX 2 Pro — на уровне продвинутого юзера, не «попробовал один раз».
Постройте гибридный воркфлоу. AI-драфт → ваша редактура → AI-проверка. Это сейчас win-win.
Учитесь промпт-инжинирингу. Это новая базовая грамотность.
Смещайте фокус на стратегию. AI делает тактику, ваша ценность — концепция, инсайты, исследование.

Дизайнеру

Освойте FLUX 2 Pro и GPT-Image. Это базовые инструменты для коммерческой графики в 2026.
Изучите image-to-video в Sora 2 и Kling. Видео в кампании — уже не опция, а норма.
Не теряйте основы. Композиция, типографика, цвет — AI генерирует, но без вашей насмотренности результат будет средним.
Стройте свою библиотеку промптов и LoRA. Это новый аналог вашего файла с шаблонами.

Разработчику

Глубоко работайте с Copilot и Cursor. Не «копирую подсказку», а строите workflow вокруг AI.
Учите архитектурный уровень. AI пишет код, ваша ценность — проектирование систем, дизайн API, безопасность.
Освойте интеграцию с LLM-API. Любой backend в 2026-2027 будет хотеть AI-фичи.
Следите за agentic-frameworks. LangGraph, AutoGen, CrewAI — стек, на котором строят next-gen приложения.

7 моделей, которые стоит освоить уже сейчас

  1. GPT-5 (OpenAI) — универсальный флагман. Доступен в чате Quantium. Используйте для большинства задач по умолчанию.
  2. Claude Sonnet 4.5 (Anthropic) — длинные тексты, код, аналитика. Лидер на бенчмарках reasoning. Тоже в Quantium.
  3. Gemini 2.5 Pro (Google) — мультимодальность, контекстное окно 2M токенов. Идеален для работы с PDF и длинными документами.
  4. FLUX 2 Pro (Black Forest Labs) — фотореалистичная графика. См. наш промпт-гайд.
  5. GPT-Image (OpenAI) — редактирование изображений, маски, character consistency.
  6. Sora 2 (OpenAI) — видео-генерация с лучшей физикой в индустрии.
  7. ElevenLabs — TTS уровня кинопродакшна, клонирование голоса. См. подкастинг через TTS.

Все семь моделей доступны в Quantium одной подпиской — это сокращает porog входа для тех, кто хочет освоить их параллельно, не оформляя 7 отдельных аккаунтов.

Главный вывод

Будущее не «AI заменит профессии». Будущее — AI станет таким же базовым инструментом, как Excel в 1995-м и интернет в 2005-м. Люди, которые освоят его на 2-3 года раньше остальных, получат значимое преимущество. Те, кто проигнорирует — постепенно потеряют конкурентоспособность.

Это не про панику. Это про спокойную и системную работу с инструментами, которые уже здесь. Семь моделей выше, гибридный workflow, фокус на стратегии и доменной экспертизе — этого достаточно, чтобы пройти 2026-2027 годы без потерь.

Связанные материалы: Тренды AI-видео 2026, AI vs копирайтер, Сравнение чат-моделей, Все модели Quantium.

Q
Quantium Editorial 30+ нейросетей в одном Telegram-боте

Попробуйте Quantium бесплатно

20 кредитов в месяц на бесплатном тарифе. 30+ нейросетей в одном Telegram-боте.

Открыть бот →

Читайте также