RAG — Retrieval Augmented Generation
RAG (Retrieval Augmented Generation) — технология при которой языковая модель перед генерацией ответа ищет релевантные источники в реальном времени и включает их в контекст. Именно через RAG большинство сайтов попадает в AI-ответы без ожидания следующего обучения модели.
Как работает RAG
Когда пользователь задаёт вопрос в Perplexity или ChatGPT с поиском, система выполняет три шага:
- Retrieval (поиск) — запрос кодируется в вектор, система ищет страницы с наибольшим семантическим сходством в поисковом индексе
- Augmentation (дополнение) — найденные фрагменты добавляются в контекст запроса к модели
- Generation (генерация) — модель формирует ответ опираясь на найденные источники и указывает их как цитаты
Ключевое отличие от параметрической памяти: RAG работает в реальном времени и не зависит от даты обучения модели.
Какие платформы используют RAG
| Платформа | RAG | Источник индекса |
|---|---|---|
| Perplexity | Всегда | Собственный веб-индекс |
| Яндекс Нейро | Всегда | Индекс Яндекса |
| ChatGPT (с поиском) | При включённом поиске | Bing |
| GigaChat | Частично | Экосистема Сбера |
| Claude | Опционально | Веб при включённом поиске |
| ChatGPT (без поиска) | Нет | Только параметрическая память |
RAG vs параметрическая память
Параметрическая память — знания зашитые в модель при обучении. ChatGPT без поиска отвечает из неё на ~60% запросов. Попасть туда можно только через накопление упоминаний в авторитетных источниках до момента обучения модели.
RAG — быстрый канал. Если сайт проиндексирован и контент структурирован, RAG-система найдёт его при следующем запросе пользователя. Именно поэтому в GEO-стратегии RAG-системы (Perplexity, Яндекс Нейро) — первоочередная цель: туда можно попасть за недели, а не месяцы.
Что влияет на отбор в RAG
- Семантическое сходство — насколько контент страницы соответствует смыслу запроса
- Структура контента — чёткие заголовки, определения в начале разделов, FAQ, таблицы
- Свежесть — для Perplexity и Яндекс Нейро актуальность контента имеет значение
- Авторитет домена — косвенно влияет через приоритет в поисковом индексе
- Скорость загрузки — медленные сайты краулеры обходят реже
Частые вопросы
Хотите попасть в RAG-системы?
Проверим видимость вашего сайта в Perplexity и Яндекс Нейро бесплатно
Получить аудит →