Как устроен AI для бизнеса: агент, RAG и закрытый контур простыми словами

Тебе продают «AI-решение», а ты не понимаешь, что под капотом и за что платишь. Чат-бот, агент, RAG, дообучение — на этих словах легко кивнуть и согласиться на не то.

Цена ошибки тут не абстрактная. По исследованию MIT, 95% корпоративных пилотов с генеративным ИИ не дают измеримого эффекта на прибыль. И часто дело не в технологии, а в том, что под задачу выбрали неподходящую архитектуру.

Разберём пять понятий, которые стоит понимать тому, кто принимает решение, — чтобы не переплатить и не купить красивую обёртку.

Чат-бот или AI-агент: в чём разница

Чат-бот отвечает на вопрос по заранее заданному сценарию. AI-агент получает описание роли и набор инструментов, сам решает, какой применить, и строит план из нескольких шагов. По прогнозу Gartner, доля корпоративных приложений со встроенными агентами вырастет примерно с 5% в начале 2025 года до 40% к концу 2026.

На практике разница такая. Бот скажет клиенту статус заказа, если его об этом спросили. Агент может сам собрать оффер по всей базе, запустить рекламу через код и свести отчёт — потому что у него есть и задача, и доступ к инструментам.

Что такое RAG и почему это важнее дообучения

RAG — это когда нейросеть отвечает не из общей памяти, а сначала ищет ответ в твоих документах и базах, а потом формулирует. Это снижает выдумки и даёт ссылку на источник, без переобучения модели. По данным Gartner, более 70% корпоративных AI-команд используют RAG как основной способ заземлить ИИ на свои данные.

Зачем это бизнесу. Без RAG модель отвечает «в среднем по интернету» и иногда уверенно врёт. С RAG она отвечает по твоей базе знаний, твоим договорам, твоему регламенту — и показывает, откуда взяла. Для большинства корпоративных задач это и есть рабочий вариант.

RAG против fine-tuning: что выбрать

Дообучение (fine-tuning) — это когда модель доучивают на твоих данных, чтобы она переняла стиль, тон или формат. Сравнение простое.

RAG дешевле на старте, обновляется без переобучения, лучше для фактов и трассируемости — когда важно, чтобы ответ был по актуальным данным и со ссылкой.
Fine-tuning дороже на входе, но даёт предсказуемую цену за запрос и лучше держит стиль, тон и формат — когда важно, как именно модель говорит.

Для большинства бизнес-задач по умолчанию берут RAG, а дообучение добавляют точечно. Гибридные подходы тоже растут, но начинать с дорогого дообучения «на всякий случай» — частый способ потратить бюджет впустую.

On-premise или облако

Облако и API — это когда модель работает на стороне провайдера: быстро и дёшево начать, но данные уходят за пределы твоего контура. On-premise или закрытый контур — модель работает на твоей инфраструктуре: данные остаются внутри, что нужно для чувствительной информации под 152-ФЗ, но настройка сложнее и дороже.

Выбор зависит от данных. Маркетинговые тексты и идеи спокойно живут в облаке. Управленческая отчётность, договоры и базы клиентов — повод смотреть в сторону закрытого контура. Подробнее про безопасность и российские варианты — в отдельной статье блога про AI и 152-ФЗ.

Галлюцинации и контекстное окно

Два слова, которые стоит знать, чтобы не обмануться на демонстрации. Галлюцинация — это когда модель уверенно выдаёт выдумку за факт. RAG и проверка человеком снижают риск, но не убирают его полностью. Контекстное окно — сколько информации модель удерживает за один раз. Если документ длиннее окна, она «забывает» начало, и ответ плывёт.

Почему «посадить агента в код» работает

«Мы посадили AI-агентов внутрь компании: один ведёт Яндекс.Директ через код, другой собирает персональные офферы по всей базе — B2C и B2B» — Илья Бердыш, фаундер mymeet.ai

Это и есть разница между «ИИ советует» и «ИИ делает». Когда у агента есть задача, доступ к инструментам и к твоим данным, он не пишет рекомендацию, а выполняет работу. Именно поэтому архитектура — это не технические детали, а вопрос о том, за что ты платишь: за подсказку или за результат.

Что реально автоматизируют в России

По данным «Сбераналитики» и «Сбер Бизнес Софт», чаще всего ИИ ставят на документооборот и обработку заявок (около 70% компаний), бухгалтерию (55%) и HR-процессы (34%). То есть рабочий ROI чаще приходит из операционки и бэк-офиса, а не из эффектных витринных сценариев.

Антикейс: архитектура не спасает кривой процесс

Здесь снова уместен MIT. В исследовании «The GenAI Divide» 95% пилотов не дали эффекта на прибыль, и при этом покупка готового решения у вендора оказалась успешной примерно в 67% случаев, а попытка собрать всё внутри — вдвое реже. Причина не в выборе модели. Чаще ИИ запускают поверх неперестроенных процессов и ждут чуда, а получают дорогой эксперимент.

Как выбирать: на понедельник

Сформулируй задачу и пойми, где живут нужные данные.
Нужны ответы по своим документам — бери RAG, а не дообучение.
Данные чувствительные — смотри в сторону закрытого контура.
Простой вопрос-ответ закрывает бот, многошаговое действие — агент. Не плати за агента там, где хватит бота.

Вопросы и ответы

Чем AI-агент отличается от чат-бота?

Чат-бот отвечает на вопрос по сценарию. Агент получает роль и набор инструментов, сам выбирает, что применить, и выполняет многошаговую задачу. Бот сообщает статус заказа, агент может сам собрать и отправить оффер по всей базе.

Что такое RAG простыми словами?

RAG — это когда нейросеть перед ответом ищет нужное в твоих документах и базах, а потом формулирует ответ со ссылкой на источник. Это снижает выдумки и не требует переобучения модели, поэтому для фактов по своим данным это рабочий вариант по умолчанию.

Нужно ли дообучать модель под свою компанию?

В большинстве случаев нет. Для ответов по своим данным дешевле и быстрее RAG. Дообучение добавляют точечно, когда важно перенять стиль, тон или формат, а не факты — начинать с дорогого дообучения «на всякий случай» обычно невыгодно.

Можно ли держать нейросеть в закрытом контуре?

Да. Есть российские варианты с хранением данных в РФ и развёртыванием в закрытом контуре — например, GigaChat и YandexGPT, а также открытые модели на своей инфраструктуре. Это нужно для чувствительных данных под 152-ФЗ.

Где это разбирают вживую

Открывает AI Борщ нетворк-сессия про разработку и архитектуру ИИ, а на Open Talk «Как внедрять AI без боли» спикеры разбирают, как встроить ИИ в реальные процессы без хаоса: инфраструктура, роли, безопасность. 30 июня, Москва. Билеты на aiborsch.com.

Как устроен AI для бизнеса: чат-бот, агент, RAG и закрытый контур простыми словами