Как запретить индексацию сайта через robots.txt

Марина Лыкова

Опубликовано 11.06.26

Обновлено 11.06.26

Опубликовано 26.07.26

Обновлено 26.07.26

Для чего ограничивать доступ поисковых роботов

Не все страницы сайта предназначены для попадания в поисковую выдачу. Помимо полезного контента, на ресурсе часто присутствуют технические разделы, служебные файлы, тестовые страницы, административные каталоги и другие материалы, которые не представляют ценности для пользователей.

Если такие страницы индексируются, поисковые системы тратят часть краулингового бюджета на обработку второстепенного контента. В результате важные документы могут индексироваться медленнее, а качество поискового представления сайта снижается.

Кроме того, временное ограничение индексации нередко применяется во время редизайна, переноса сайта, разработки новых разделов или масштабных технических работ. Это позволяет избежать попадания в поисковую базу некорректных версий страниц.

Проверить текущий статус индексации можно через панели вебмастеров поисковых систем, где отображаются страницы, доступные для сканирования и находящиеся в индексе.

Управление индексацией через robots.txt

Основным инструментом управления поисковыми роботами остается файл robots.txt, расположенный в корневой директории сайта.

В нем используются три базовые директивы:

User-agent — определяет робота, для которого задаются правила;
Disallow — запрещает обход и индексацию;
Allow — снимает ограничения для отдельных разделов или страниц.

Комбинируя эти инструкции, можно контролировать доступ как для всех поисковых систем одновременно, так и для отдельных роботов.

Полный запрет индексации сайта

Чтобы закрыть ресурс от всех поисковых систем, достаточно указать следующие правила:

User-agent: *
Disallow: /

Если необходимо оставить доступ только роботам Яндекса:

User-agent: *
Disallow: /

User-agent: Yandex
Allow: /

Если индексация должна выполняться только Google:

User-agent: *
Disallow: /

User-agent: Googlebot
Allow: /

Также можно ограничить работу отдельных поисковых ботов.

Например, запретить индексацию изображений роботом Яндекса:

User-agent: YandexImages
Disallow: /

Подобная настройка позволяет гибко регулировать процесс сканирования ресурса.

Ограничение доступа к отдельным разделам

Чаще всего требуется скрыть не весь сайт, а только определенные разделы или документы.

Запрет индексации каталога:

User-agent: *
Disallow: /catalog

Запрет индексации конкретной страницы:

User-agent: *
Disallow: /contact.html

Закрытие всего сайта с сохранением доступа к одному разделу:

User-agent: *
Disallow: /
Allow: /catalog

Запрет индексации раздела с исключением для подраздела:

User-agent: *
Disallow: /product
Allow: /product/auto

Такой подход особенно полезен при работе с фильтрами, каталогами, служебными разделами и тестовыми страницами.

Как исключить ссылки из обхода

Помимо страниц, можно ограничить обработку отдельных ссылок.

Первый вариант — использовать метатег:

<meta name="robots" content="nofollow">

Второй вариант — добавить специальный атрибут к ссылке:

<a href="url" rel="nofollow">Текст ссылки</a>

На практике чаще применяется атрибут rel="nofollow", поскольку он работает точечно и позволяет управлять отдельными ссылками независимо от настроек страницы.

Типичные ошибки при настройке robots.txt

Даже небольшая ошибка в синтаксисе может привести к некорректной индексации сайта.

Ошибка в значениях директив

Неверно:

User-agent: /
Disallow: Yandex

Верно:

User-agent: Yandex
Disallow: /

Несколько путей в одной строке

Неверно:

Disallow: /admin/ /tags/ /images/

Верно:

Disallow: /admin/
Disallow: /tags/
Disallow: /images/

Не указан User-agent

Неверно:

User-agent:
Disallow: /

Верно:

User-agent: *
Disallow: /

Отсутствует начальный слеш

Неверно:

User-agent: Yandex
Disallow: admin

Верно:

User-agent: Yandex
Disallow: /admin/

После внесения изменений рекомендуется обязательно протестировать файл через инструменты вебмастера, чтобы убедиться в корректности правил.

Практические рекомендации

При работе с robots.txt важно придерживаться нескольких принципов:

закрывать только действительно служебные разделы;
избегать случайной блокировки важных страниц;
регулярно проверять файл после изменений на сайте;
использовать точечные правила вместо полного запрета без необходимости;
контролировать индексацию через панели вебмастеров.

Особенно внимательно следует относиться к настройкам после редизайна, миграции сайта или изменения структуры URL.

Выводы

Файл robots.txt остается одним из ключевых инструментов технической SEO-оптимизации. Он позволяет управлять доступом поисковых систем к страницам сайта, распределять краулинговый бюджет и предотвращать попадание в индекс технического контента.

Грамотная настройка помогает поисковым роботам быстрее находить приоритетные страницы и эффективнее использовать ресурсы на сканирование сайта. При этом важно помнить, что robots.txt требует регулярного контроля: даже одна ошибка способна привести к выпадению важных разделов из поиска или, наоборот, к индексации служебных документов.

Поэтому оптимальной практикой считается не только настройка правил доступа, но и регулярный аудит индексации, позволяющий своевременно выявлять проблемы и поддерживать корректное взаимодействие сайта с поисковыми системами.

Другие статьи автора

Яндекс Wordstat: полное руководство по анализу спроса и сбору семантического ядра

Опубликовано 24.04.26

Читать

Как алгоритмы Google и Microsoft отбирают контент для ИИ-ответов: механики и паттерны

Опубликовано 06.05.26

Читать

Проверка файла robots.txt

Опубликовано 11.06.26

Читать

Как заполнить карточку компании в Яндекс Картах?

Опубликовано 25.03.25

Читать

Как запретить индексацию сайта через robots.txt

Для чего ограничивать доступ поисковых роботов

Управление индексацией через robots.txt

Полный запрет индексации сайта

Чтобы закрыть ресурс от всех поисковых систем, достаточно указать следующие правила:

Если необходимо оставить доступ только роботам Яндекса:

Если индексация должна выполняться только Google:

Также можно ограничить работу отдельных поисковых ботов.

Например, запретить индексацию изображений роботом Яндекса:

Ограничение доступа к отдельным разделам

Запрет индексации каталога:

Запрет индексации конкретной страницы:

Закрытие всего сайта с сохранением доступа к одному разделу:

Запрет индексации раздела с исключением для подраздела:

Как исключить ссылки из обхода

Типичные ошибки при настройке robots.txt

Ошибка в значениях директив

Несколько путей в одной строке

Не указан User-agent

Отсутствует начальный слеш

Практические рекомендации

Выводы

Другие статьи автора

Написать нам

Оставить заявку

Откликнуться на вакансию

Заказать звонок