Определение Роман Гачковский · 27 мая 2026

RAG — Retrieval Augmented Generation

Определение

RAG (Retrieval Augmented Generation) — технология при которой языковая модель перед генерацией ответа ищет релевантные источники в реальном времени и включает их в контекст. Именно через RAG большинство сайтов попадает в AI-ответы без ожидания следующего обучения модели.

Как работает RAG

Когда пользователь задаёт вопрос в Perplexity или ChatGPT с поиском, система выполняет три шага:

  • Retrieval (поиск) — запрос кодируется в вектор, система ищет страницы с наибольшим семантическим сходством в поисковом индексе
  • Augmentation (дополнение) — найденные фрагменты добавляются в контекст запроса к модели
  • Generation (генерация) — модель формирует ответ опираясь на найденные источники и указывает их как цитаты

Ключевое отличие от параметрической памяти: RAG работает в реальном времени и не зависит от даты обучения модели.

Какие платформы используют RAG

ПлатформаRAGИсточник индекса
PerplexityВсегдаСобственный веб-индекс
Яндекс НейроВсегдаИндекс Яндекса
ChatGPT (с поиском)При включённом поискеBing
GigaChatЧастичноЭкосистема Сбера
ClaudeОпциональноВеб при включённом поиске
ChatGPT (без поиска)НетТолько параметрическая память

RAG vs параметрическая память

Параметрическая память — знания зашитые в модель при обучении. ChatGPT без поиска отвечает из неё на ~60% запросов. Попасть туда можно только через накопление упоминаний в авторитетных источниках до момента обучения модели.

RAG — быстрый канал. Если сайт проиндексирован и контент структурирован, RAG-система найдёт его при следующем запросе пользователя. Именно поэтому в GEO-стратегии RAG-системы (Perplexity, Яндекс Нейро) — первоочередная цель: туда можно попасть за недели, а не месяцы.

Что влияет на отбор в RAG

  • Семантическое сходство — насколько контент страницы соответствует смыслу запроса
  • Структура контента — чёткие заголовки, определения в начале разделов, FAQ, таблицы
  • Свежесть — для Perplexity и Яндекс Нейро актуальность контента имеет значение
  • Авторитет домена — косвенно влияет через приоритет в поисковом индексе
  • Скорость загрузки — медленные сайты краулеры обходят реже

Частые вопросы

RAG (Retrieval Augmented Generation) — технология при которой языковая модель перед ответом ищет релевантные источники в реальном времени. Используется в Perplexity, ChatGPT с поиском, Яндекс Нейро.
Perplexity (всегда), Яндекс Нейро (всегда, через индекс Яндекса), ChatGPT с включённым поиском (через Bing), GigaChat частично. ChatGPT без поиска и Claude работают преимущественно из параметрической памяти.
RAG — главный быстрый канал попадания в AI-выдачу. Не нужно ждать следующего обучения модели — достаточно попасть в поисковый индекс и структурировать контент. Первые упоминания через RAG возможны за 3–6 недель.
По семантическому сходству: запрос и контент кодируются в векторы и сравниваются. Побеждают источники с наибольшим совпадением по смыслу, структурированным контентом и авторитетом домена.

Хотите попасть в RAG-системы?

Проверим видимость вашего сайта в Perplexity и Яндекс Нейро бесплатно

Получить аудит →