MaryProject
Верейская улица, 17 121357 Москва,
+74950155855, info@maryproject.ru
SEO продвижение
сайтов

Как запретить индексацию сайта через robots.txt

Марина Лыкова
Опубликовано 11.06.26
Обновлено 11.06.26
Опубликовано 11.06.26
Обновлено 11.06.26

Для чего ограничивать доступ поисковых роботов

Не все страницы сайта предназначены для попадания в поисковую выдачу. Помимо полезного контента, на ресурсе часто присутствуют технические разделы, служебные файлы, тестовые страницы, административные каталоги и другие материалы, которые не представляют ценности для пользователей.

Если такие страницы индексируются, поисковые системы тратят часть краулингового бюджета на обработку второстепенного контента. В результате важные документы могут индексироваться медленнее, а качество поискового представления сайта снижается.

Кроме того, временное ограничение индексации нередко применяется во время редизайна, переноса сайта, разработки новых разделов или масштабных технических работ. Это позволяет избежать попадания в поисковую базу некорректных версий страниц.

Проверить текущий статус индексации можно через панели вебмастеров поисковых систем, где отображаются страницы, доступные для сканирования и находящиеся в индексе.

Управление индексацией через robots.txt

Основным инструментом управления поисковыми роботами остается файл robots.txt, расположенный в корневой директории сайта.

В нем используются три базовые директивы:

  • User-agent — определяет робота, для которого задаются правила;
  • Disallow — запрещает обход и индексацию;
  • Allow — снимает ограничения для отдельных разделов или страниц.

Комбинируя эти инструкции, можно контролировать доступ как для всех поисковых систем одновременно, так и для отдельных роботов.

Полный запрет индексации сайта

Чтобы закрыть ресурс от всех поисковых систем, достаточно указать следующие правила:

User-agent: *
Disallow: /

Если необходимо оставить доступ только роботам Яндекса:

User-agent: *
Disallow: /

User-agent: Yandex
Allow: /

Если индексация должна выполняться только Google:

User-agent: *
Disallow: /

User-agent: Googlebot
Allow: /

Также можно ограничить работу отдельных поисковых ботов.

Например, запретить индексацию изображений роботом Яндекса:

User-agent: YandexImages
Disallow: /

Подобная настройка позволяет гибко регулировать процесс сканирования ресурса.

Ограничение доступа к отдельным разделам

Чаще всего требуется скрыть не весь сайт, а только определенные разделы или документы.

Запрет индексации каталога:

User-agent: *
Disallow: /catalog

Запрет индексации конкретной страницы:

User-agent: *
Disallow: /contact.html

Закрытие всего сайта с сохранением доступа к одному разделу:

User-agent: *
Disallow: /
Allow: /catalog

Запрет индексации раздела с исключением для подраздела:

User-agent: *
Disallow: /product
Allow: /product/auto

Такой подход особенно полезен при работе с фильтрами, каталогами, служебными разделами и тестовыми страницами.

Как исключить ссылки из обхода

Помимо страниц, можно ограничить обработку отдельных ссылок.

Первый вариант — использовать метатег:

<meta name="robots" content="nofollow">

Второй вариант — добавить специальный атрибут к ссылке:

<a href="url" rel="nofollow">Текст ссылки</a>

На практике чаще применяется атрибут rel="nofollow", поскольку он работает точечно и позволяет управлять отдельными ссылками независимо от настроек страницы.

Типичные ошибки при настройке robots.txt

Даже небольшая ошибка в синтаксисе может привести к некорректной индексации сайта.

Ошибка в значениях директив

Неверно:

User-agent: /
Disallow: Yandex

Верно:

User-agent: Yandex
Disallow: /

Несколько путей в одной строке

Неверно:

Disallow: /admin/ /tags/ /images/

Верно:

Disallow: /admin/
Disallow: /tags/
Disallow: /images/

Не указан User-agent

Неверно:

User-agent:
Disallow: /

Верно:

User-agent: *
Disallow: /

Отсутствует начальный слеш

Неверно:

User-agent: Yandex
Disallow: admin

Верно:

User-agent: Yandex
Disallow: /admin/

После внесения изменений рекомендуется обязательно протестировать файл через инструменты вебмастера, чтобы убедиться в корректности правил.

Практические рекомендации

При работе с robots.txt важно придерживаться нескольких принципов:

  • закрывать только действительно служебные разделы;
  • избегать случайной блокировки важных страниц;
  • регулярно проверять файл после изменений на сайте;
  • использовать точечные правила вместо полного запрета без необходимости;
  • контролировать индексацию через панели вебмастеров.

Особенно внимательно следует относиться к настройкам после редизайна, миграции сайта или изменения структуры URL.

Выводы

Файл robots.txt остается одним из ключевых инструментов технической SEO-оптимизации. Он позволяет управлять доступом поисковых систем к страницам сайта, распределять краулинговый бюджет и предотвращать попадание в индекс технического контента.

Грамотная настройка помогает поисковым роботам быстрее находить приоритетные страницы и эффективнее использовать ресурсы на сканирование сайта. При этом важно помнить, что robots.txt требует регулярного контроля: даже одна ошибка способна привести к выпадению важных разделов из поиска или, наоборот, к индексации служебных документов.

Поэтому оптимальной практикой считается не только настройка правил доступа, но и регулярный аудит индексации, позволяющий своевременно выявлять проблемы и поддерживать корректное взаимодействие сайта с поисковыми системами.

Узнайте стоимость продвижения
SEO, PPC, CRO, SERM!

Другие статьи автора

Закажите продвижение
Мы с Вами обязательно свяжемся!

Оставить заявку

Наш менеджер свяжется с вами в ближайшее время

Откликнуться на вакансию

Наш менеджер свяжется с вами в ближайшее время

Заказать звонок

Наш менеджер свяжется с вами в ближайшее время

Мы используем cookie для корректной работы нашего сайта и сервиса.

Продолжая использовать наши сайт и сервис, вы соглашаетесь на использование файлов cookie.