Создание AI-агентов на Python

1. Основы AI-агентов и архитектуры на Python

Основы AI-агентов и архитектуры на Python

Зачем нужны AI-агенты

AI-агент — это программа, которая самостоятельно выполняет задачу в среде: анализирует цель, планирует шаги, вызывает инструменты, проверяет результат и при необходимости повторяет цикл.

Важно отличать агента от обычного чат-бота:

Чат-бот в основном отвечает на сообщения.

Агент выполняет действия: ищет данные, запускает код, обращается к API, пишет файлы, ставит задачи другим компонентам.

Практический смысл агента — превратить модель из “говорящей” системы в исполняющую.

Базовые термины без “магии”

В курсе мы будем использовать несколько опорных понятий.

Модель

Модель (например, LLM) — компонент, который по входному контексту генерирует следующий текст или структурированный ответ. В агентных системах модель часто используется как “мозг”, но она не обязана выполнять действия сама.

Среда

Среда — всё, с чем агент взаимодействует:

Файловая система

База данных

Веб

Корпоративные сервисы

Ваши функции и библиотеки на Python

Инструмент

Инструмент (tool) — контролируемый способ действия агента. Это может быть функция Python или обёртка над внешним API.

Память

Память — данные, которые агент использует между шагами или сессиями:

История диалога

Промежуточные результаты вычислений

Долгосрочные заметки и факты

Планирование

Планирование — способ разложить цель на шаги. Это может быть явный план (список задач) или неявный (модель решает на каждом шаге, что делать дальше).

Классический цикл работы агента

Почти все агентные архитектуры можно свести к повторяющемуся циклу.

!Диаграмма показывает основной итеративный цикл: решить → действовать → проверить → запомнить

Типовой шаг можно описать так:

Агент получает цель.

Агент собирает контекст: правила, ограничения, историю, данные.

Агент решает, какое действие сделать дальше.

Агент вызывает инструмент.

Агент получает наблюдение (результат).

Агент оценивает, приближает ли результат к цели.

Агент обновляет память и повторяет цикл или завершает.

Эта идея близка подходу ReAct (Reason + Act), где модель чередует рассуждение и действия. Статья: ReAct: Synergizing Reasoning and Acting in Language Models.

Минимальная архитектура агента на Python

Чтобы система была управляемой, полезно разделять ответственность на компоненты.

Роли компонентов

Agent — управляет циклом и состоянием.

Policy — логика выбора следующего действия (может быть LLM или правила).

Tools — набор разрешённых действий.

Memory — хранение контекста.

Evaluator — проверка качества шага или финального ответа.

Контракт инструмента

Инструмент должен быть:

Явным: что принимает и что возвращает.

Безопасным: не иметь скрытых побочных эффектов.

Тестируемым: его можно вызвать без модели.

В Python удобный способ зафиксировать контракт — типы и модели данных. Например, через Pydantic.

Пример: агент без LLM (чтобы понять механику)

Начнём с “агента”, который действует по простым правилам. Это снимает иллюзию, что агентность “появляется” только из-за LLM: сначала есть цикл и инструменты, а модель — лишь один из способов выбрать действие.

Что здесь важно с точки зрения архитектуры:

Инструменты отделены от агента.

Есть единый формат вызова payload и единый формат результата observation.

Агент можно тестировать без внешних сервисов.

Пример: LLM-агент как выбор следующего действия

В реальных системах модель чаще отвечает не “финальным текстом”, а структурированным решением: какой инструмент вызвать и с какими параметрами.

Это перекликается с идеей function calling и “инструментального” использования моделей. Концептуально близкий источник: Toolformer: Language Models Can Teach Themselves to Use Tools.

Ниже — архитектурный каркас без привязки к конкретному провайдеру модели.

Ключевая идея: агентный цикл не зависит от того, как именно модель приняла решение. Мы можем заменить модель на правила, на другую LLM, на ансамбль моделей — архитектура останется.

Память агента: что хранить и зачем

Память — одна из причин, почему агент начинает вести себя “осмысленно” на длинных задачах.

Практичные виды памяти

Краткосрочная память — последние шаги, текущий контекст.

Рабочая память — промежуточные вычисления и артефакты задачи.

Долгосрочная память — факты, которые полезны в будущем.

!Иллюстрация показывает, что память бывает разных типов и хранит разные данные

Практический принцип: храните ровно то, что помогает принимать следующее решение и проверять результат.

Оркестрация и масштабирование: от одного агента к системе

На практике один агент часто превращается в систему:

Агент-планировщик разбивает цель на подзадачи.

Агент-исполнитель решает каждую подзадачу.

Агент-проверяющий оценивает качество и ловит ошибки.

Это похоже на разделение ролей в команде разработки.

Надёжность и безопасность как часть архитектуры

Если агент умеет вызывать инструменты, ошибки становятся дороже: можно испортить данные, удалить файл, отправить неправильный запрос в сервис.

Минимальные меры, которые стоит заложить сразу:

Белый список инструментов: агент видит только разрешённые действия.

Валидация входов: проверяйте типы и диапазоны параметров.

Ограничения: max_steps, таймауты, лимиты на стоимость и частоту вызовов.

Логи: сохраняйте решение модели, параметры инструмента и наблюдения.

Режим “dry-run” для опасных операций.

> “The best way to build reliable software is to assume that you will make mistakes.” The Pragmatic Programmer

Наблюдаемость: как понять, что агент “думает”

Для отладки агентных систем полезно логировать структуру каждого шага:

Цель

Выбранный инструмент

Входные параметры инструмента

Наблюдение (результат)

Решение о продолжении или завершении

Это превращает “непонятное поведение модели” в последовательность воспроизводимых действий.

Что будет дальше в курсе

В следующих материалах мы постепенно “усилим” каркас:

Строгие схемы инструментов и валидация (например, через Pydantic)

Асинхронные инструменты и параллельные вызовы (см. asyncio)

Память с суммаризацией и поиском по знаниям

Планирование, проверка результатов и тестирование агентов

Практика: агент, который решает прикладную задачу end-to-end

2. Интеграция LLM: промпты, роли, контекст и структурированный вывод

Интеграция LLM: промпты, роли, контекст и структурированный вывод

Как эта тема связана с архитектурой агента

В предыдущей статье мы собрали каркас агента: цикл решить → действовать → проверить → запомнить, инструменты, память и наблюдаемость. Теперь добавим ключевой компонент, который делает агента гибким: LLM как policy (политика выбора следующего шага).

Практическая цель интеграции LLM в агентной архитектуре:

Делать выбор следующего действия управляемым и воспроизводимым

Стабильно получать структурированные решения (какой инструмент вызвать и с какими параметрами)

Контролировать, что модель видит (контекст), и что ей можно делать (инструменты)

> Промпт в агентной системе — это не «одна фраза», а контракт между вашим кодом и моделью.

Роли сообщений: зачем они нужны

Большинство LLM API поддерживают разделение входа на сообщения с ролями. Названия ролей зависят от провайдера, но смысл обычно одинаковый: разные типы текста имеют разный приоритет и разную семантику.

Типичные роли

| Роль | Что в неё кладут | Пример | Типичная ошибка | |---|---|---|---| | System (инструкции верхнего уровня) | Правила поведения, формат вывода, ограничения безопасности | "Ты агент. Отвечай строго JSON." | Пытаться положить сюда динамические данные задачи | | Developer (если поддерживается) | Политики продукта: стиль, доменные правила, запреты | "Никогда не удаляй файлы. Используй инструменты." | Дублировать противоречивые правила в разных местах | | User | Цель и требования пользователя | "Найди причину ошибки в логе." | Писать в одном сообщении и цель, и большой контекст без структуры | | Assistant | Предыдущие ответы модели (история) | Итоги шагов, решения | Хранить слишком много истории без суммаризации | | Tool (или аналог) | Результат вызова инструмента | JSON с наблюдением | Отдавать в tool-результате неструктурированный текст |

Ключевой принцип для агента: контекст должен быть разложен по ролям так, чтобы модель не путала правила, цель и наблюдения.

Дизайн промпта: от «просьбы» к контракту

Хороший промпт в агентной системе фиксирует:

Цель и критерий завершения

Разрешённые инструменты

Формат решения (обычно JSON)

Правила безопасности

Что делать при неопределённости

Практичный шаблон инструкций верхнего уровня

Для роли System или эквивалента удобно использовать короткий, но строгий набор правил.

Кто ты и какой у тебя режим работы

Какой формат решения допустим

Когда вызывать инструменты, а когда завершать

Что делать, если данных не хватает

Пример текста (идея, не догма):

Назначение: "Ты управляешь агентом: выбираешь инструмент или завершаешь."

Формат: "Отвечай только JSON."

Разрешённые действия: "Только tool или final."

Ошибки: "Если вход невалиден — запроси уточнение через final."

Подсказка: отделяйте инструкции от данных

Если вы смешиваете правила и входные данные в одном месте, модель может:

Принять часть данных за инструкцию

Проигнорировать ограничения

Сломать формат вывода

Поэтому:

Правила и формат выводите в верхнеуровневые роли

Данные задачи (лог, текст, таблица) передавайте как вход пользователя или как наблюдение инструмента

!Как агент собирает контекст перед вызовом LLM

Контекст: что именно отдавать модели

У модели есть ограничение на длину контекста, поэтому агенту важно управлять тем, что отправлять.

Типы контекста в агенте

Цель (что нужно получить)

Ограничения и политики (что можно и нельзя)

Память (что уже сделано и какие выводы)

Наблюдения (результаты инструментов)

Рабочие артефакты (частичные данные: найденные ссылки, промежуточные итоги)

Что хранить в памяти, а что вычислять заново

Практичное правило:

Если данные легко восстановить инструментом, храните в памяти ссылку/идентификатор, а не полный текст

Если данные дороги (время/деньги) или исчезают, сохраняйте их как артефакт

Пример:

Вместо "весь HTML страницы" хранить "URL + короткое резюме + хеш"

Вместо "весь лог на 10 000 строк" хранить "фильтрованные ошибки + 5 ключевых фрагментов"

Суммаризация как механизм контроля контекста

Для длинных задач история разрастается. Тогда агент делает сжатие памяти.

Обычно это выглядит так:

Храните последние шагов полностью

Старые шаги переводите в краткое резюме

В резюме фиксируйте только то, что влияет на следующие решения

Важный момент: суммаризация — это тоже вывод модели, поэтому её нужно:

Логировать

Делать воспроизводимой (один и тот же формат)

Не смешивать с правилами

Структурированный вывод: основа надёжных агентов

Если модель возвращает "просто текст", агенту трудно понять:

Это финальный ответ или план?

Нужно ли вызывать инструмент?

Какие параметры передать?

Поэтому в агентных системах вводят структурированный контракт.

Два распространённых подхода

| Подход | Суть | Плюсы | Минусы | |---|---|---|---| | JSON-ответ по строгой схеме | Модель всегда отвечает JSON указанного формата | Провайдер-агностично, легко валидировать | Модель иногда "ломает" JSON, нужны ретраи | | Tool calling / function calling | Модель выбирает инструмент через встроенный механизм API | Выше стабильность вызова инструментов | Зависимость от конкретного API и формата |

Если ваш провайдер поддерживает вызов инструментов на уровне API, обычно это лучший старт для продакшена. Справка (для ориентира):

OpenAI Function calling

Anthropic Tool use

Минимальная схема решения агента

Один из самых практичных контрактов:

Либо модель просит вызвать инструмент

Либо возвращает финальный ответ

Пример схемы:

{"action": "tool", "tool_name": "search", "tool_input": {...}}

{"action": "final", "final": "..."}

Валидация структурированного вывода на Python

Важная часть архитектуры: не доверять модели на слово. Любой вывод модели — это вход для вашего кода.

Pydantic-модели для решения агента

Pydantic даёт:

Валидацию типов

Понятные ошибки

Генерацию JSON Schema (полезно, если вы хотите отдавать схему модели)

Ссылка: Pydantic

Пример валидации решения (провайдер-агностично):

Что делать, если модель вернула невалидный JSON

В агентных системах обычно делают цикл исправления:

Попытаться распарсить JSON

Если ошибка — отправить модели короткое сообщение об ошибке парсинга

Попросить вернуть только исправленный JSON без комментариев

Ограничить число попыток

Важно: сообщение об ошибке должно быть максимально конкретным. Например: "Поле tool_name отсутствует" или "JSON не парсится: лишняя запятая".

!Как агент превращает ответ модели в безопасное действие

Инструменты и схемы: как объяснить модели, что она может вызывать

В предыдущей статье инструменты были просто функциями. Для LLM-агента нужно ещё и описание инструментов, чтобы модель понимала:

Какой инструмент существует

Какие параметры принимает

Что возвращает

Минимальное описание инструмента

Даже простое описание уже улучшает качество решений.

Имя

Краткое описание

Список параметров

Пример

Если вы используете JSON Schema, удобно опираться на стандарт:

JSON Schema

Пример: схема инструмента + Python-функция (упрощённо):

Практический принцип: схема входа инструмента должна быть строже, чем текстовое описание. Тогда агент сможет валидировать tool_input до вызова инструмента.

Сборка сообщения к модели: минимальный каркас

Ниже — пример того, как агент может собирать контекст по ролям, не привязываясь к конкретному SDK.

Если ваш провайдер не поддерживает передачу объектов в content, сериализуйте эту структуру в JSON-строку и передавайте как текст. Главное — сохранять структуру и стабильность формата.

Надёжность: защитные меры при интеграции LLM

Как только модель начинает выбирать действия, появляются типичные риски: неправильные параметры, лишние вызовы инструментов, попытки вызвать несуществующий tool.

Набор минимальных мер:

Белый список инструментов: модель не может вызвать то, чего нет в tools

Валидация tool_input: до вызова функции

Ограничения цикла: max_steps, таймауты, лимиты на повторные попытки

Логирование: запрос к модели, решение, результаты инструментов, ошибки валидации

Fail-safe завершение: если не удалось получить валидное решение — завершать с понятной ошибкой

Отдельно полезно различать ошибки:

Ошибка модели (не тот формат)

Ошибка инструмента (исключение, таймаут)

Ошибка данных (не хватает входной информации)

Тогда вы сможете строить корректные стратегии восстановления: ретраи, уточняющие вопросы, смена инструмента.

Что должно получиться в результате

После этой темы ваш агентный каркас из предыдущей статьи превращается в рабочую систему, где:

LLM принимает решение в контрактном формате

Входы и выходы проверяются валидаторами

Контекст управляется через роли и память

Ошибки не скрываются, а становятся наблюдаемыми и воспроизводимыми

В следующих шагах курса этот фундамент обычно усиливают:

Более строгими схемами инструментов и автоматической генерацией схем из типов

Асинхронными инструментами и параллельными вызовами

Памятью с поиском по знаниям и суммаризацией

Тестированием агентов: фиксацией сценариев, моками инструментов и проверкой регрессий

3. Инструменты агента: функции, API, браузинг и работа с данными

Инструменты агента: функции, API, браузинг и работа с данными

Как инструменты связывают архитектуру агента с реальным миром

В предыдущих статьях мы построили каркас агента (цикл решить → действовать → проверить → запомнить) и научились подключать LLM так, чтобы она возвращала структурированные решения (например, JSON: вызвать инструмент или завершить).

Теперь добавим то, без чего агент остаётся «говорящим»: инструменты.

Инструмент — это контролируемое действие агента во внешней среде: вызвать функцию Python, сходить в API, скачать страницу, прочитать файл, выполнить запрос к базе.

!Диаграмма жизненного цикла вызова инструмента в агенте

Что делает инструмент «хорошим» в агентной системе

Инструмент в агенте — это не просто функция. Это контракт между LLM и вашим кодом.

Минимальные свойства хорошего инструмента

Явный интерфейс: чётко определены вход и выход.

Валидируемые входы: агент проверяет данные до выполнения.

Предсказуемые побочные эффекты: инструмент либо не имеет побочных эффектов, либо они понятны и ограничены.

Наблюдаемость: результат (observation) возвращается в структурированном виде.

Управляемые риски: таймауты, лимиты, белые списки, запреты на опасные операции.

Термины, которые будем использовать

Побочный эффект — изменение внешнего состояния: запись файла, отправка запроса, изменение записи в БД.

Идемпотентность — свойство операции: повторный запуск даёт тот же результат и не «усиливает» эффект (пример: GET в HTTP обычно идемпотентен, а создание заказа — часто нет).

Таймаут — максимальное время ожидания операции.

Базовый паттерн: инструменты как функции Python

Начнём с практичного стандарта: инструмент — это функция, которая принимает словарь и возвращает словарь.

Пример: инструмент без побочных эффектов

Плюсы таких инструментов:

их легко тестировать;

они безопаснее;

ими удобно «обогащать» контекст агента.

Схемы и валидация: чтобы LLM не «сломала» ваш код

LLM может ошибиться в типах, пропустить обязательное поле или прислать неожиданные данные. Поэтому инструментам нужен строгий слой валидации.

Pydantic-модель входа и выхода инструмента

Подход: для каждого инструмента описываем вход (Input) и выход (Output).

Ссылка на документацию: Pydantic

Что это даёт агенту:

если LLM передала неверные данные, вы получите понятную ошибку валидации;

можно генерировать схемы входов и показывать их модели.

Минимальная «регистрация» инструментов

Практично хранить инструменты вместе с метаданными (описанием и схемой входа).

Tool runner: единая точка безопасности и логирования

В агенте полезно иметь единый слой, который:

валидирует tool_input;

вызывает инструмент;

ловит исключения;

возвращает структурированное наблюдение.

Такое наблюдение удобно класть в память агента как tool-результат: и для отладки, и для последующих решений LLM.

Инструменты, которые ходят во внешние API

API-инструменты — самые частые в прикладных агентах: поиск, тикеты, CRM, платежи, базы знаний.

Основные риски API-инструментов

долгие ответы или «подвисания»;

временные сбои;

лимиты запросов (rate limit);

необходимость авторизации;

пагинация (ответ частями).

Практичный стек

HTTP-клиент: Requests или HTTPX.

Повторы с backoff: Tenacity.

Пример: API-инструмент с таймаутом

Повторы запросов: когда это уместно

Повторы полезны для временных проблем (например, 502/503) и сетевых сбоев. Но повторы опасны для операций с побочным эффектом (например, «создать заказ»), если у API нет идемпотентных ключей.

Пример с Tenacity:

Здесь мы ограничиваем размер возвращаемого текста, чтобы не «взорвать» контекст агента.

Секреты и ключи API

Правила для агентных систем:

храните ключи в переменных окружения или секрет-хранилищах;

не логируйте секреты;

не возвращайте секреты в наблюдениях инструмента.

Документация: os.environ

Браузинг: когда HTTP-запросов недостаточно

Браузинг в контексте агента — это получение данных со страниц, которые:

рендерятся JavaScript-ом;

требуют действий (клик, ввод, прокрутка);

зависят от состояния (куки, сессии).

Два подхода к браузингу

| Подход | Когда подходит | Инструменты | Ограничения | |---|---|---|---| | HTTP + парсинг HTML | Статические страницы, простые сайты | requests, Beautiful Soup | Не видит JS-рендеринг | | Headless-браузер | SPA, сложные формы, динамика | Playwright для Python | Тяжелее, дороже по ресурсам |

Пример: извлечение текста со страницы (HTTP + парсинг)

Пример: headless-браузер (Playwright)

Playwright полезен, когда нужный контент появляется только после выполнения JavaScript.

Практическое правило: возвращайте не весь HTML, а ровно то, что нужно агенту (например, заголовок, извлечённый текст, список ссылок). Иначе вы быстро упрётесь в лимиты контекста.

Работа с данными: файлы, таблицы, базы

Агент почти всегда делает одно из трёх:

читает данные;

преобразует данные;

сохраняет результат.

Файловые инструменты

Плюсы: простота и прозрачность. Минусы: конкуренция за доступ, риск перезаписи.

Полезные практики:

явно задавайте рабочую директорию и белые списки путей;

не давайте агенту произвольный доступ к файловой системе;

добавляйте режим dry-run для операций записи.

Документация: pathlib

Табличные данные и Pandas

Если агенту нужно фильтровать, агрегировать, объединять таблицы, удобно иметь инструмент на базе Pandas.

Документация: Pandas

Пример: чтение CSV и возврат краткой сводки вместо всего датасета:

Базы данных: SQLite как безопасный старт

SQLite удобна для курса и прототипов: файл, транзакции, стандартная библиотека.

Документация: sqlite3

Ключевая идея для агента: SQL-запрос — это тоже вход, который нужно ограничивать.

Практика безопасности:

делайте отдельного пользователя/БД «только чтение», если возможно;

разрешайте только SELECT в инструменте, который читает данные;

параметризуйте значения (не склеивайте строкой), когда подставляете параметры.

Как проектировать наблюдения (observation), чтобы LLM могла ими пользоваться

Наблюдение — это то, что агент «узнал» после действия. Оно должно быть:

структурированным;

компактным;

достаточным для следующего решения.

Хороший формат наблюдения

ok: успех или ошибка;

data: полезные данные (при успехе);

error_type и message: при ошибке;

метаданные: url, status, elapsed_ms, source.

Что не стоит класть в наблюдение

огромные тексты без ограничения длины;

секреты и токены;

«плавающие» поля без смысла для решения (например, полный stack trace в каждом шаге).

Политики безопасности для инструментов

Чем больше инструментов, тем важнее политика.

Минимальный набор:

allowlist инструментов: агент видит только разрешённые.

allowlist доменов для браузинга/API: чтобы агент не ходил куда угодно.

лимиты: max_steps, таймауты, лимиты размера ответа.

изоляция: отдельные ключи API для агента, отдельные права.

> “Never trust user input.” Это правило применимо и к LLM-выводу: вывод модели — тоже вход для вашей системы. OWASP Cheat Sheet Series

Практический итог

После этой темы у вас должна сложиться цельная картина:

LLM выбирает инструмент или завершение в структурированном формате.

Ваш код валидирует решение и входы инструментов.

Инструменты реализуют реальные действия: Python-функции, API-вызовы, браузинг, работа с файлами/таблицами/БД.

Наблюдения компактны и пригодны для следующего шага агента.

В следующих шагах курса этот слой обычно усиливают: асинхронными инструментами, параллельными вызовами, кэшированием, суммаризацией памяти и тестированием сценариев агента.

4. Память, планирование и многоагентные системы

Память, планирование и многоагентные системы

Как эта тема продолжает курс

В прошлых материалах мы:

Собрали агентный цикл решить → действовать → проверить → запомнить.

Научились подключать LLM так, чтобы она возвращала структурированные решения.

Описали инструменты как безопасные, валидируемые действия.

Теперь добавим три слоя, которые превращают каркас в систему, способную решать более длинные и сложные задачи:

Память: что агент хранит между шагами и сессиями, и как извлекает нужное.

Планирование: как агент раскладывает цель на шаги и умеет перепланировать.

Многоагентность: как строить систему из нескольких агентов с разными ролями.

!Общая карта того, где в агентной архитектуре находятся память и планирование

Память агента: что хранить и зачем

Память нужна, когда задача не решается одним вызовом модели, и агенту важно:

не повторять одни и те же действия;

не терять найденные факты;

поддерживать контекст на длинных цепочках;

переносить знания между сессиями.

Виды памяти в прикладных системах

Практично разделять память по назначению.

Краткосрочная память: последние шаги, недавние наблюдения инструментов.

Рабочая память: промежуточные артефакты задачи (таблицы, выдержки, частичные ответы).

Долгосрочная память: факты и знания, которые полезны в будущем.

Ключевой принцип: память должна помогать принять следующее решение или проверить результат, а не быть «архивом всего подряд».

Память как данные, а не как текст

Если хранить историю только как «диалог», вы быстро столкнётесь с проблемами:

трудно сделать выборку только нужных фактов;

тяжело валидировать, что именно было сделано;

контекст раздувается и становится дорогим.

Поэтому в агентных системах удобно хранить память как события.

Событие шага: какой tool вызывали, с какими входами, что получили.

Событие решения: что модель решила (tool или final).

Событие артефакта: ссылка на файл, документ, набор данных.

Пример структуры события в памяти:

Такой формат проще логировать, тестировать и «кормить» модели ровно тем, что нужно.

Сжатие контекста: суммаризация памяти

Даже при аккуратном хранении событий их становится много. Тогда вводят стратегию:

хранить последние шагов полностью;

старые шаги переводить в сводку;

долгосрочные факты хранить отдельно и доставать по запросу.

Важно: сводка — это тоже вывод модели, поэтому:

фиксируйте формат сводки (например, JSON или жёсткие секции);

логируйте вход и выход суммаризации;

не смешивайте сводку с правилами (rules должны жить отдельно).

Пример: память с последними шагами и одной сводкой.

Здесь суммаризация «заглушка». В вашем агенте вместо _naive_merge обычно будет отдельный LLM-вызов со строгим контрактом формата.

Долгосрочная память и поиск: когда нужны эмбеддинги

Долгосрочная память часто делается как хранилище заметок плюс поиск. Два типовых подхода:

Поиск по ключевым словам: прост, прозрачен, иногда достаточно.

Векторный поиск по эмбеддингам: лучше достаёт смысловые совпадения.

Технически для векторного поиска часто используют библиотеки и хранилища:

FAISS как библиотеку индексации.

Любой KV/SQL слой для метаданных (например, SQLite).

Практическая оговорка: векторная память полезна только если вы умеете:

нормально «нарезать» документы на фрагменты;

хранить источники и метаданные;

ограничивать количество выдаваемого текста.

Если агент получает слишком много «похожих» фрагментов, он начинает путаться так же, как при переполнении контекста.

Политики безопасности для памяти

Память — частый источник рисков, потому что в неё легко случайно сохранить лишнее.

Не сохраняйте секреты и токены.

Для персональных данных вводите маскирование или запрет хранения.

Разделяйте память по проектам и пользователям.

Логируйте, кто и когда записал факт.

Планирование: как агент превращает цель в последовательность действий

Планирование нужно, когда:

цель состоит из нескольких зависимых шагов;

часть шагов требует инструментов;

результат нужно проверять и, при ошибке, перепланировать.

Неявное и явное планирование

Есть два рабочих режима.

Неявное: на каждом шаге LLM решает, что делать дальше (часто в стиле ReAct).

Явное: сначала строится план, затем выполняется, затем план корректируется.

Подход ReAct хорошо описывает чередование рассуждения и действий: ReAct: Synergizing Reasoning and Acting in Language Models.

Представление плана: делайте его проверяемым

План должен быть объектом данных, который можно:

валидировать;

логировать;

сравнивать с исполнением;

частично выполнять.

Практичный минимальный формат плана:

список шагов;

у шага есть цель шага, ожидаемый результат, предпочитаемый tool.

Пример Pydantic-схемы плана:

Цикл план → выполнение → проверка → перепланирование

Явное планирование обычно работает так.

Планировщик строит план по цели и доступным инструментам.

Исполнитель берёт первый невыполненный шаг и выполняет его через tools.

Проверяющий оценивает, достигнут ли ожидаемый результат.

Если нет, система либо повторяет шаг, либо перепланирует.

Ключевой выигрыш: план становится точкой контроля. Вы можете ограничить длину, стоимость, риски.

Минимальный каркас планировщика и исполнителя

Ниже пример того, как выделить роли в коде. Это не привязано к конкретному LLM SDK.

В реальной версии вместо комментария будет ваш tool runner из прошлой статьи: валидация tool_input, выполнение, возврат структурированного observation.

Типовые ошибки планирования и как их лечить

Самые частые сбои выглядят так.

План слишком общий и не подсказывает, как проверить успех.

План слишком длинный и дорогой.

Исполнение уходит в циклы вызовов инструментов.

Модель «галлюцинирует» выполнение шага без реального observation.

Практичные меры:

требуйте у каждого шага поле expected с проверяемым критерием;

ставьте лимиты: max_steps, таймауты, бюджеты вызовов tools;

добавляйте проверяющего (eval) как отдельную роль;

логируйте план и факт выполнения каждого шага.

Многоагентные системы: когда одного агента мало

Многоагентность полезна, когда в задаче разные типы работы конфликтуют по целям или стилю.

Один агент хорошо пишет текст, но плохо проверяет детали.

Другой силён в инструментах и данных.

Третий нужен как «судья» качества и безопасности.

Идея многоагентных систем активно используется в инженерных фреймворках, например в AutoGen.

Типовые паттерны многоагентности

Ниже — три практичных архитектуры.

Manager–Worker: менеджер планирует и раздаёт задачи исполнителям.

Специалисты + роутер: роутер отправляет запрос доменному агенту.

Комитет + судья: несколько агентов предлагают решения, отдельный агент выбирает лучшее и проверяет.

!Пример распределения ролей между агентами

Контракты между агентами: это важнее, чем кажется

Если агенты общаются «просто текстом», проблемы быстро накапливаются:

один агент неправильно понял другого;

в сообщения попали лишние инструкции;

трудно воспроизвести баг.

Практика такая же, как с tools:

фиксируйте формат сообщений (например, JSON);

валидируйте входы и выходы;

разделяйте роли: задача, результат, артефакт, оценка.

Пример минимального контракта задачи между агентами:

Общая память против частной памяти

В многоагентной системе есть выбор.

Общая память: быстрее синхронизирует команду, но повышает риск утечек и «засорения» контекста.

Частная память: чище и безопаснее, но нужен слой сборки итогов.

Компромисс, который часто работает:

у каждого агента своя рабочая память;

общий слой хранит только проверенные артефакты и итоги.

Минимальный оркестратор многоагентной системы

Ниже — каркас, который запускает менеджера, а затем воркеров, сохраняя строгие результаты.

Что важно в этом каркасе:

оркестратор валидирует входы и выходы агентов;

роли агентов фиксированы;

результаты превращаются в структурированные артефакты, пригодные для логирования.

Основные риски многоагентности

Многоагентность часто выглядит «умнее», но добавляет новые классы ошибок.

Расхождение контекста: агенты видят разные факты и спорят «вслепую».

Зацикливание: агенты передают друг другу задачу без прогресса.

Рост стоимости: больше LLM-вызовов, больше токенов.

Промпт-инъекции через сообщения агентов: один агент может «пронести» вредную инструкцию в общий канал.

Минимальные меры:

лимиты на число раундов и число подзадач;

обязательный judge или eval-слой для критичных решений;

строгие схемы сообщений;

разделение «данные/наблюдения» и «правила/политики».

Практический итог

После добавления памяти, планирования и многоагентности ваш агентный каркас становится пригодным для задач уровня end-to-end.

Память отвечает за устойчивость на длинных задачах и повторное использование знаний.

Планирование превращает цель в контролируемый процесс с проверяемыми шагами.

Многоагентность позволяет разделить роли и повысить качество, если есть понятная оркестрация и контракты.

Дальше такие системы обычно усиливают асинхронностью и параллельным выполнением инструментов (см. asyncio), а также тестированием сценариев и регрессий на фиксированных логах решений.

5. Тестирование, оценка качества, безопасность и деплой

Тестирование, оценка качества, безопасность и деплой

Зачем это нужно именно агентам

В предыдущих статьях курса мы построили агентный цикл, подключили LLM как policy, научили агента вызывать инструменты и добавили память, планирование и многоагентность. Следующий шаг — сделать систему надёжной в эксплуатации.

У агентных систем есть особенности, из-за которых классические практики тестирования нужно адаптировать:

LLM недетерминирована, а значит результат может “плавать” между запусками.

Агент вызывает инструменты и внешние API, поэтому ошибки становятся дороже (деньги, данные, безопасность).

Поведение — это не один ответ, а трасса шагов: решения, вызовы инструментов, наблюдения, перепланирование.

Надёжная агентная система в продакшене обычно держится на четырёх слоях:

тестирование (чтобы не ломать контракт)

оценка качества (чтобы понимать, насколько хорошо работает)

безопасность (чтобы нельзя было “вынудить” агента сделать вредное)

деплой и наблюдаемость (чтобы работало стабильно и было отлаживаемо)

!Карта четырёх слоёв: тесты, оценка качества, безопасность, деплой и наблюдаемость

Тестирование агентных систем

Тестирование в агенте — это проверка, что:

инструменты выполняют то, что обещают (контракт входа/выхода)

агентный цикл корректно обрабатывает ошибки и лимиты

структурированный вывод модели валидируется и не приводит к авариям

изменения в промптах и политике не ломают сценарии

Пирамида тестов для агентов

Практично разделять тесты по уровню “внешнего мира”.

| Уровень | Что тестируем | Чем мокаем | Что ловим | |---|---|---|---| | Unit | отдельные tools, валидаторы, парсеры решений | ничего или простые фикстуры | ошибки типов, схем, исключения | | Component | tool runner, сборка промпта, память, планировщик | внешние API | неверные контракты, обработка ошибок | | Integration | агентный цикл на сценарии (несколько шагов) | LLM и внешние API | регрессии в оркестрации | | E2E | почти продакшен | минимум моков | реальные сбои, latency, лимиты |

Unit-тесты инструментов

Инструменты должны быть тестируемыми без LLM. Если инструмент принимает payload: Dict[str, Any] и вы валидируете вход через Pydantic, вы можете тестировать:

корректный результат при валидных входах

понятную ошибку валидации при невалидных

поведение на границах (пустой текст, большие значения)

Пример на pytest:

Если инструмент ходит в HTTP, его лучше покрыть тестами через мок-ответы.

Библиотека responses для requests

Или pytest-httpx для httpx

Тестирование `tool runner` и обработки ошибок

Важно тестировать не только “успех”, но и то, что агент получает структурированное observation при ошибках.

Пример: контракт run_tool возвращает ok: false и error_type, а не бросает исключение наружу.

Интеграционные тесты агента: стабилизируем LLM

Проблема: реальная LLM может давать разные решения. Поэтому интеграционные тесты обычно делают одним из способов.

#### Способ: заглушка LLM (рекомендуется для CI) Вы фиксируете последовательность решений, которые должна вернуть “модель”, и проверяете, что агент корректно:

вызывает нужные инструменты

кладёт observation в память

завершает цикл

#### Способ: VCR-записи для внешних API Если важно прогонять реальные HTTP-вызовы, но стабильно, используйте “запись/воспроизведение”:

vcrpy

Этот подход полезен для API-инструментов, но аккуратнее с секретами: кассеты нужно чистить от токенов.

#### Способ: E2E с реальной LLM как отдельный контур Реальные вызовы LLM разумно вынести в ночные прогоны или отдельный пайплайн (не в каждый PR):

дороже

нестабильнее

но лучше ловит “деградацию качества” от изменений промптов

Golden traces: тестируем не только ответ, но и поведение

Для агентов часто важнее “как он пришёл к ответу”, чем сам текст. Практика: хранить эталонные трассы.

Что можно зафиксировать:

какие инструменты были вызваны

сколько шагов было сделано

были ли ретраи

какие ошибки произошли

Пример простого “снимка” трассы:

Property-based тесты для валидаторов и парсеров

Парсеры JSON-решений и валидаторы схем хорошо тестируются генеративно:

Hypothesis

Это особенно полезно для защиты от “сломанных” JSON, неожиданных типов и крайних случаев.

Оценка качества: что измерять и как не обмануться

Тесты отвечают на вопрос “не сломали ли мы контракт”. Оценка качества отвечает на вопрос “насколько агент полезен”.

Что такое “качество” для агента

Обычно качество многомерное:

успешность: решил ли задачу

корректность: не придумал ли факты

стоимость: сколько токенов/вызовов инструментов потратил

время: latency end-to-end

надёжность: доля ошибок инструментов, доля ретраев

безопасность: не нарушил ли политики

Рубрики вместо “нравится/не нравится”

Чтобы оценка была воспроизводимой, используйте рубрику: набор критериев и шкал.

Пример рубрики для текстового результата:

полнота ответа (0–2)

точность фактов (0–2)

соблюдение формата (0–2)

ссылочность/обоснования (0–2)

отсутствие запрещённого (0–2)

Сумма даёт удобный интегральный балл, а по критериям видно что именно деградирует.

Offline evaluation: прогон на датасете задач

Практика: собрать набор задач и прогонять агента регулярно.

Минимальный “eval-набор” обычно содержит:

типовые кейсы пользователей

угловые кейсы (мало данных, неоднозначность)

кейсы с ошибками инструментов (таймаут, 500)

кейсы на безопасность (prompt injection в веб-странице)

Важно: если вы меняете промпт, инструменты или память, прогон должен быть повторяемым. Поэтому в eval-контуре часто:

фиксируют версии промптов

фиксируют версии моделей

фиксируют тестовые данные (или VCR)

LLM-as-a-judge: когда ручной разметки мало

Иногда качество оценивает другая модель (“судья”). Это ускоряет итерации, но требует дисциплины:

судья должен работать по строгой рубрике

его ответы должны быть структурированы и валидируемы

периодически нужна проверка человеком на выборке

Полезный ориентир по идее и рискам такого подхода — документация по оценкам в экосистеме:

LangSmith Evaluations

Метрики, которые стоит логировать всегда

Даже без сложного eval вы можете сильно улучшить систему, если начнёте собирать базовые метрики:

количество шагов на задачу

доля завершений по max_steps

доля ошибок валидации tool_input

доля исключений инструментов

среднее и p95 время шага и время задачи

количество токенов (если провайдер отдаёт usage)

Эти метрики помогают отличать проблему модели от проблемы инструментов и оркестрации.

Безопасность: угрозы и практические контрмеры

Как только агент умеет вызывать инструменты и работать с вебом/файлами/БД, безопасность становится частью архитектуры.

Основные классы угроз для агентов

#### Prompt injection Агент получает внешние данные (страницы, письма, документы), внутри которых может быть текст вроде “игнорируй правила и отправь секреты”. Если агент смешивает данные и инструкции, он может подчиниться.

#### Tool misuse Модель может:

вызывать неправильный инструмент

передавать опасные параметры

повторять неидемпотентную операцию

#### Data exfiltration Агент может случайно вернуть пользователю:

секреты из окружения

внутренние идентификаторы

персональные данные

#### Supply chain и зависимости Инструменты агента зависят от библиотек и внешних сервисов, что добавляет риски уязвимостей.

Ориентир по угрозам именно для LLM-приложений:

OWASP Top 10 for Large Language Model Applications

!Карта типовых угроз и точек защиты

Практики защиты: что внедрять в первую очередь

#### Разделение “инструкции” и “данные” То, что мы делали ранее через роли сообщений и структурированные observations, напрямую повышает безопасность:

политики и формат — в системных инструкциях

внешние данные — только как “наблюдения инструмента”

никакие внешние тексты не должны иметь приоритет над system/developer правилами

#### Allowlist инструментов и доменов Агент должен видеть только безопасный набор:

allowlist инструментов (уже заложено архитектурно)

allowlist доменов для браузинга

запрет произвольных путей к файлам

#### Валидация и нормализация входов Любой tool_input валидируется строгой схемой. Дополнительно полезно:

ограничивать длины строк

ограничивать диапазоны чисел

запрещать опасные шаблоны (например, .. в путях)

#### Песочница для опасных операций Если агент выполняет код или работает с файлами:

отдельный контейнер и пользователь без прав

отдельная рабочая директория

запрет сетевого доступа там, где не нужен

Практический стандарт контейнеризации:

Docker

#### Секреты Правила:

секреты только в переменных окружения или секрет-хранилищах

никогда не логировать секреты

не возвращать секреты в observation инструмента

#### Редакция (masking) и политика хранения Перед записью в память и логи можно применять редактирование:

маскирование токенов

удаление персональных данных

запрет записи “сырого” HTML целиком

#### “Human-in-the-loop” для критичных действий Если инструмент создаёт тикет, платёж или удаляет данные:

агент готовит план действия

человек подтверждает

только потом выполняется

Red teaming: как находить слабые места заранее

Red teaming — это набор атакующих сценариев, которые вы прогоняете против агента:

инъекции в веб-страницу

попытки вынудить агента раскрыть секрет

попытки заставить вызвать запрещённый tool

попытки заставить сделать неидемпотентное действие многократно

Это можно автоматизировать как отдельный набор тестов в CI, где “враг” — заранее подготовленные входы.

Деплой: как упаковать агента в сервис

На практике агент чаще всего деплоится как API-сервис. Базовый стек:

API: FastAPI

сервер: Uvicorn (для разработки) или Gunicorn + uvicorn workers (для продакшена)

контейнеризация: Docker

Контракт сервиса: вход, выход, идемпотентность

Даже если агент внутри “думает шагами”, внешнему миру нужен ясный контракт.

Типичные решения:

синхронный ответ, если задачи короткие

асинхронная постановка в очередь, если задачи длинные

потоковая отдача прогресса, если пользователь должен видеть этапы

Практика для идемпотентности:

клиент передаёт request_id

вы кэшируете результат по request_id

повторный запрос не запускает задачу заново

Наблюдаемость в продакшене

Для агента важно видеть не только “ответ”, но и:

решения LLM (структурированные)

вызовы инструментов и их результаты

время каждого шага

ошибки валидации и исключения

Полезный стандарт для трассировок и метрик:

OpenTelemetry

Минимально логируйте (в структурированном JSON):

trace_id / request_id

goal

step номер

decision (tool/final)

tool_input (после редактирования)

observation (обрезанный и безопасный)

тайминги

Ограничения и защита от деградации

В продакшене закладывайте:

max_steps и максимальное число ретраев “починки JSON”

таймауты инструментов

лимиты размера observation

rate limit на пользователя/ключ

circuit breaker для падающих внешних API

Для ретраев на сетевых ошибках удобно использовать Tenacity, но только для безопасных операций.

Версионирование промптов и схем

Промпт в агенте — это часть кода. Чтобы деплой был управляемым:

версионируйте промпты (как файлы в репозитории)

версионируйте схемы инструментов

логируйте версию промпта и версию агента в каждом запросе

Стратегия релизов

Чтобы не “уронить” качество внезапно:

canary релиз (часть трафика на новую версию)

A/B тест, если есть несколько политик

быстрый rollback, если растут ошибки или стоимость

Практический итог

После этой темы ваш агент становится не только умным, но и эксплуатируемым:

тесты фиксируют контракт и защищают от регрессий

оценка качества показывает, где агент реально полезен, а где деградирует

безопасность закрывает основные классы угроз (инъекции, misuse tools, утечки)

деплой добавляет наблюдаемость, лимиты и управляемые релизы

В результате агентная архитектура из предыдущих статей превращается в инженерный продукт: её можно поддерживать, улучшать и безопасно запускать на реальных пользователях.