Что такое ИИ-агент простыми словами и чем он отличается от чат-бота
Введение
В одной из следующих статей вы прочитаете, как к нам пришел заказ на разработку ИИ-чат-бота и как так оказалось, что заказчикам нужна была простая автоматизация.
А пока что давайте посмотрим на то, что интересно сейчас всем нам. На скриншоте видно, что за последние 5 лет интерес к агентам и ИИ-ботам начал расти, но как же отличить ботов от ИИ-агентов и чат-ботов на основе ИИ?
Вопрос кажется простым, но когда начинаешь уточнять детали, то начинается каша.
Кто-то называет ИИ-ботом обычного Telegram-бота с кнопками. Другие — чат на сайте, который отвечает по базе знаний. Кто-то — ChatGPT. Третьи — систему, которая ходит из мессенджера в CRM, создает задачи, пишет письма, обновляет статусы и т.д.
И вот тут уже хочется немного притормозить. Потому что если все подряд называть ИИ-ботом или тем же агентом, то можно заказать себе разработку того, чего сам не понимаешь, и попросту слить бюджет. И повезет, если в результате нагрузка на сотрудников в бизнесе… хотя бы не увеличится. В общем, давайте прояснять.
Главные отличия
Если совсем коротко:
ИИ-бот — это широкое бытовое название почти любой системы, в которую интегрирован ИИ.
Чат-бот — это система, которая общается с пользователем в диалоге. Например, Telegram-бот или ассистент на сайте в окошечке справа внизу.
ИИ-чат-бот — это чат-бот, усиленный языковой моделью. Например, ChatGPT или Claude.
ИИ-агент — это система, которая может не только отвечать, но и выполнять шаги для достижения цели. Например, искать данные, вызывать API, обновлять CRM, писать код, проверять статус заказа, создавать тикет и т.д.
Грубо говоря, чат-бот ведет коммуникацию, а агент выполняет действия. Таким образом эти системы замечательно работают в синтезе. К одному чат-боту может быть подключен как один агент, так и целые агентские системы или системы-оркестраторы. Например, как бы себя вели разные системы в Telegram-боте:
Допустим, у вас интернет-магазин и Telegram-бот, в который попадают ваши пользователи после оформления заказа на сайте. Если бы он был обычным чат-ботом, то мог бы ответить клиенту:
Чтобы оформить возврат, перейдите в личный кабинет на сайте, выберите последний заказ и нажмите кнопку «Оформить возврат».
А ИИ-агент в похожей ситуации должен уметь сделать больше:
- найти ваш последний заказ
- проверить правила возврата
- понять, подходит ли заказ под условия
- вызвать нужный инструмент;
- изменить статус заявки;
- сообщить результат.
Это принципиально разная логика. В первом случае система помогает человеку понять, что делать. Во втором — система сама выполняет часть работы. Причем в обоих случаях это может быть Telegram-бот, который является лишь оболочкой и интерфейсом взаимодействия с пользователем.
Что такое ИИ-бот простыми словами
Это самый широкий и размытый термин из всех, приведенных в этой статье.
Поэтому, когда вы слышите «ИИ-бот» от своего коллеги или партнера по бизнесу, то стоит уточнить, что, блин, он имеет в виду. Это может быть почти что угодно:
- Telegram-бот с подключенным GPT
- Backend-сервис для отслеживания и аналитики KPI менеджеров
- голосовой ассистент
- простая автоматизация с использованием нейросетей
То есть, термина «ИИ-бот» как такового не существует в техническом мире. Потому что он почти ничего не говорит об устройстве системы. Он сообщает только то, что внутри системы где-то должен быть ИИ. В то время как ИИ-агент имеет определенную архитектуру. Да и чат-бота можно реализовывать очень по-разному.
Что такое чат-бот
Вот и добрались. Чат-бот — это система диалога. Пользователь пишет сообщение, бот отвечает. Иногда текстом, иногда кнопками, ссылкой или ведет пользователя по заранее подготовленному сценарию.
Он может успешно разгрузить поддержку клиентов — сократить количество повторяющихся вопросов и дать пользователю быстрый ответ без ожидания оператора. Если, например, у компании много однотипных вопросов: доставка, оплата, возврат, гарантия, запись на услугу, статус заказа, график работы, документы, условия тарифа.
Обычные чат-боты нужны, в первую очередь, для информационного сопровождения пользователей. Они отвечают на вопросы, объясняют, помогают найти нужный раздел или собрать первичные данные (имя, телефон, почту и пр.).
Но сама работа часто остается на человеке. Чат-бот сказал, куда нажать. А нажимаете вы. Чат-бот объяснил, какие нужны документы. А вы их собираете. Подсказал, как создать заявку. А создаете и заполняете вы или менеджер.
Что такое ИИ-чат-бот
ИИ-чат-бот — это чат-бот, внутри которого используется языковая модель, например, LLM: GPT, Claude, Gemini, Llama, Qwen и т.д.
В отличие от обычного сценарного чат-бота, который работает по жестким условиям и кнопкам, ИИ-чат-бот может понимать свободный текст. Пользователю не нужно выбирать только то, что есть в меню бота.
Он может написать как человек:
Слушайте, я заказывал у вас товар примерно неделю назад, он не подошел, коробка целая, можно как-то вернуть?
Чат-бот, получив нестандартный ответ от пользователя, скорее всего уйдет в игнор, т.к. не сможет обработать ответ, если он не попадает ни под одно условие в коде. А ИИ-чат-бот поймет, что речь идет о возврате, уточнит детали или найдет подходящую инструкцию в базе знаний.
Таким образом ИИ-чат-бот может:
- понимать разные формулировки;
- отвечать более естественным языком;
- переформулировать сложные правила;
- работать с базой знаний;
- учитывать контекст диалога;
- не придерживаться жесткого сценария;
- задавать уточняющие вопросы.
Однако это не делает из него ИИ-агента.
Если система просто получает сообщение, ищет ответ в базе знаний и генерирует текст — это все еще чат-бот. Возможно, очень хороший и полезный, но он все еще не выполняет никаких действий.
Что такое ИИ-агент
ИИ-агент — это система на базе языковой модели, которая получает цель, контекст, инструменты и правила, а затем может выполнять шаги для достижения результата.
Хм... давайте рассмотрим лучше на примере:
Представим, что пользователь пишет:
Как оформить возврат?
Чат-бот ответил бы инструкцией. Но если написать:
Оформи возврат по последнему заказу, если он подходит под правила.
Чат-бот бы написал какой-нибудь текст-заглушку, чтобы клиент обратился к инструкции или менеджеру. Агент же сможет отреагировать на запрос действиями:
- Понять задачу.
- Определить пользователя.
- Найти его последний заказ.
- Проверить правила возврата.
- Понять, подходит ли заказ под условия.
- Если данных не хватает — задать уточняющий вопрос.
- Если возврат возможен — вызвать инструмент оформления возврата.
- Обновить статус.
- Отправить подтверждение.
- Если случай спорный — создать заявку менеджеру.
Хочу заметить, что это не автономная система, как может показаться. И идея о том, что это «цифровой сотрудник», который сам все делает не всегда бьется с практикой. Я бы сформулировал скорее так:
ИИ-агент — это система, где модель участвует в управлении процессом и его реализации. Она получает задачу (цель), самостоятельно выстраивает шаги по достижению цели и сама же их выполняет. То есть система может определить:
- что нужно сделать дальше;
- какой инструмент использовать;
- достаточно ли данных;
- нужно ли продолжать;
- нужно ли остановиться;
- нужно ли спросить пользователя;
- нужно ли передать задачу человеку.
Почему ChatGPT сам по себе — еще не ИИ-агент
Отдельная путаница возникает вокруг ChatGPT/Claude. Многие спрашивают: это чат-бот или ИИ-агент?
— Зависит от того, как он используется.
Если вы открыли ChatGPT/Claude и написали:
Объясни, что такое налоговый вычет
А он вам ответил текстом — это чат с языковой моделью.
Но если ваш промпт подразумевает, что система должна открыть файл, найти нужные данные, вызвать инструмент, запустить код, сходить в календарь, создать письмо, проверить результат и решить следующий шаг — это становится агентской системой.
Сам интерфейс ChatGPT, так же, как и чат с Telegram-ботом, является не больше чем просто интерфейсом. А за ним может быть как обычный чат-бот на базе ИИ, так и агентная система с инструментами, памятью, логикой действий и ограничениями.
Из чего состоит ИИ-агент
ИИ-агент = модель + цель + инструкции + (возможно MCP) + контекст + инструменты + цикл действий + ограничения.
Модель — это LLM, которая понимает текст, анализирует задачу, формулирует промежуточные шаги и помогает принимать решения.
Цель — то, что агент должен сделать или конечный результат, к которому нужно прийти.
Инструкции — правила поведения агента. Например:
- не обещать того, чего нет в политике компании;
- не отправлять письма без подтверждения;
- не удалять данные;
- передавать человеку случаи выше определенной суммы.
Контекст — все, что агенту нужно знать: история диалога, документы, база знаний, правила компании, данные клиента, CRM, прошлые заявки, кодовая база, тикеты.
Инструменты — способы действовать в интернете или на локальном компьютере: API, CRM, база данных, календарь, почта, браузер, файлы, платежная система, GitHub, внутренние сервисы и т.д.
Цикл действий — «сердце» агента. Он выглядит примерно так:
понять задачу → выбрать следующий шаг → вызвать инструмент → получить результат → оценить результат → решить, что делать дальше.
Ограничения — то, что защищает систему от лишних и опасных действий. Например, агент может подготовить письмо, но отправка требует подтверждения человека. Или может собрать данные для возврата, но не может сам вернуть деньги, если сумма выше лимита.
В высокорискованных задачах с высокой ценой ошибки обычно добавляется еще:
- права доступа
- логи
- мониторинг
- retries
- аудит
- тесты
- трассировки
- sandbox.
Другими словами, агент — это система вокруг модели.
Почему ИИ-агентов не стоит воспринимать как цифровых сотрудников
Мне кажется, метафора «цифровой сотрудник» создает много слепых зон. Что я имею в виду?
Она хорошо звучит и достаточно точно объясняет ценность. Но фактически не несет в себе такой ценности.
Потому что сотрудник — это, во-первых, человек. А мы, люди, не всегда действуем по заданным алгоритмам. У нас есть жизненный опыт, здравый смысл, социальный контекст, понимание негласных правил, страх последствий, ощущение ответственности, способность заметить странность и спросить коллегу:
«Слушай, а это так и должно быть или тут что-то не так?»
У агента этого нет. Он может уверенно ошибаться, неправильно понять контекст, вызвать правильный инструмент с неправильными параметрами, принять ошибку API за успешный результат. Или выполнить действие, которое формально разрешено, но по смыслу неуместно.
Поэтому не думаю, что агента можно воспринимать как сотрудника, на которого можно положиться и доверить ему какую-то ответственность. Скорее, это именно робот-исполнитель, который является не больше чем инструментом для выполнения определенных задач.
Надеюсь, у меня получилось разложить по полочкам концепции агентов и ботов. Если у вас есть что дополнить или предложить, что улучшить, пишите в чат моего Telegram-канала.