Bcorrections

Sitemap.xml: лучшие практики и типичные ошибки в 2026

Sitemap кажется простым XML-файлом, но в нём прячется куча тонкостей. Разбираем структуру, размеры, sitemap-index, частоту обновлений и типичные провалы.

Sitemap.xml — формальная карта вашего сайта, которую вы передаёте поисковикам. Звучит просто: список URL в XML. На практике в нём прячется десяток тонкостей, которые делают разницу между «sitemap работает» и «sitemap уже три месяца отображается как Error в Search Console и я не понимаю почему».

В этой статье — практический разбор sitemap.xml для 2026 года: что должно быть, что не должно, как делить большие sitemap'ы, и как избежать самых частых провалов.

Зачем sitemap, если поисковик и так найдёт

Sitemap не заменяет crawl — поисковик всё равно идёт по ссылкам с главной и обнаруживает страницы естественным путём. Но sitemap делает три полезные вещи:

  1. Помогает обнаружить новые страницы — особенно полезно для больших сайтов или сайтов с глубокой структурой, где новая страница может затеряться
  2. Передаёт метаданныеlastmod, priority, changefreq — подсказки поисковику
  3. Является адресной книгой — Google Search Console и Я.Вебмастер используют sitemap для подсчёта «сколько страниц проиндексировано из общих»

Sitemap — гигиена. Имеет смысл всегда, даже на маленьких сайтах.

Базовая структура

Минимальный валидный sitemap:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://yourdomain.ru/</loc>
    <lastmod>2026-01-15</lastmod>
    <changefreq>weekly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://yourdomain.ru/services/seo/</loc>
    <lastmod>2026-01-10</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.9</priority>
  </url>
</urlset>

Поля:

  • <loc>обязательное, абсолютный URL
  • <lastmod> — желательное, дата последнего изменения в ISO 8601
  • <changefreq> — необязательное, частота изменений (always/hourly/daily/weekly/monthly/yearly/never)
  • <priority> — необязательное, относительный приоритет от 0.0 до 1.0

Google в 2023 году подтвердил, что в основном использует <loc> и <lastmod>. <changefreq> и <priority> — подсказки, не строгие правила.

Лимиты и sitemap-index

Один sitemap-файл может содержать до 50 000 URL или до 50 МБ несжатого размера — берёте меньшее из этих двух.

Если на сайте больше — нужен sitemap-index, файл-каталог, ссылающийся на несколько sitemap'ов:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://yourdomain.ru/sitemap-products.xml</loc>
    <lastmod>2026-01-15</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://yourdomain.ru/sitemap-blog.xml</loc>
    <lastmod>2026-01-12</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://yourdomain.ru/sitemap-categories.xml</loc>
    <lastmod>2026-01-10</lastmod>
  </sitemap>
</sitemapindex>

Sitemap-index сам не содержит URL страниц — только ссылки на другие sitemap'ы. Удобно для:

  • Разделения по типам контента (товары, статьи, категории) — каждый можно регенерировать независимо
  • Удобства мониторинга в Search Console — статистика по индексации каждого типа отдельно
  • Большим сайтам (>50 000 URL) — без вариантов

Что должно быть в sitemap

Sitemap — это список того, что вы хотите видеть в индексе. Поэтому туда попадают:

  • Главная страница
  • Все коммерческие посадочные (категории, услуги, карточки товаров)
  • Все статьи блога
  • Страницы с уникальным контентом (about, contacts, кейсы)
  • Локализованные версии (с правильным hreflang)

Чего не должно быть

  • Страницы с noindex — противоречивый сигнал, поисковик путается. Если страница не должна быть в индексе, её не должно быть в sitemap.
  • Редиректы (3xx) — sitemap должен содержать только конечные URL
  • Битые страницы (4xx, 5xx) — обычная ошибка, поисковик понижает доверие к sitemap
  • Дубли с canonical на другую страницу — пишите в sitemap только canonical-URL
  • Страницы пагинации — page/2/, page/3/ обычно не нужны в sitemap
  • Технические URL — корзина, авторизация, личный кабинет, страницы поиска
  • Фильтры каталога — каждая комбинация это технический URL
  • URL с параметрами — UTM-метки, sessionID, фильтры

Правило: если страница имеет <meta name="robots" content="noindex"> — её не должно быть в sitemap.

lastmod — частая зона ошибок

<lastmod> должен указывать на реальную дату последнего изменения контента страницы. Не дату генерации sitemap, не дату создания страницы.

Типичная ошибка: автоматическая генерация sitemap'а ставит <lastmod> = текущая дата на все URL. Получается «все страницы обновлены сегодня». Поисковик это видит и игнорирует lastmod — теряется полезный сигнал.

Правильно:

  • Если контент страницы реально обновился — <lastmod> = дата обновления
  • Если контент не изменился — <lastmod> остаётся прежним
  • Дата формата ISO 8601: 2026-01-15 или 2026-01-15T14:30:00+03:00

В CMS это нужно настроить — большинство дефолтных плагинов делают неправильно.

priority и changefreq — нужны ли

Google в 2017 году заявил, что игнорирует <priority>. Яндекс также практически не использует. То есть выставить всем priority=1.0 или всем 0.5 — не повлияет на ранжирование.

Тем не менее, заполнять стоит — для собственной аналитики и для мелких поисковиков (Bing, DuckDuckGo), которые ещё могут учитывать.

Реалистичная схема:

  • Главная: 1.0
  • Категории / разделы: 0.8-0.9
  • Карточки товаров / статьи: 0.6-0.7
  • Архивные материалы: 0.3-0.4

<changefreq> — то же самое, нестрогая подсказка. Адекватные значения:

  • Главная: weekly
  • Категории: monthly
  • Карточки товаров: monthly
  • Статьи блога: monthly (если обновляете), yearly (если статика)
  • Архив: yearly

Доставка sitemap'а до поисковиков

Три способа:

1. Через robots.txt

Sitemap: https://yourdomain.ru/sitemap.xml

Самый простой. Любой поисковик который читает robots.txt — увидит sitemap.

2. Через Search Console / Я.Вебмастер

Добавляется вручную в интерфейсе. Главное преимущество — детальная статистика по индексации в каждом сервисе.

3. Через ping (IndexNow и аналоги)

Когда что-то обновили, можно «пинговать» поисковики:

https://www.google.com/ping?sitemap=https://yourdomain.ru/sitemap.xml
https://webmaster.yandex.ru/ping?sitemap=https://yourdomain.ru/sitemap.xml

В 2024 году Google отключил этот эндпоинт. Используйте IndexNow для уведомления Яндекса, Bing, ChatGPT — он работает на текущий момент.

Sitemap для специфических типов контента

Изображения

<url>
  <loc>https://yourdomain.ru/products/sofa/</loc>
  <image:image>
    <image:loc>https://yourdomain.ru/img/sofa-front.jpg</image:loc>
    <image:caption>Угловой диван-кровать серый</image:caption>
  </image:image>
  <image:image>
    <image:loc>https://yourdomain.ru/img/sofa-side.jpg</image:loc>
  </image:image>
</url>

Помогает попаданию в Google Images и Я.Картинки.

Видео

<url>
  <loc>https://yourdomain.ru/video/demo/</loc>
  <video:video>
    <video:thumbnail_loc>...</video:thumbnail_loc>
    <video:title>Демо нашего продукта</video:title>
    <video:description>Краткое демо</video:description>
    <video:content_loc>...</video:content_loc>
    <video:duration>180</video:duration>
  </video:video>
</url>

Новости (для новостных сайтов)

<url>
  <loc>https://yourdomain.ru/news/article-1/</loc>
  <news:news>
    <news:publication>
      <news:name>Yourdomain News</news:name>
      <news:language>ru</news:language>
    </news:publication>
    <news:publication_date>2026-01-15T10:00:00+03:00</news:publication_date>
    <news:title>Заголовок новости</news:title>
  </news:news>
</url>

Только для сайтов с разделом Google News.

Типичные ошибки

  1. Sitemap содержит URL с другого домена — должно быть всё с одного хоста (включая совпадение www/non-www, http/https)
  2. Битый XML — пропущенные закрывающие теги, неправильное экранирование & в URL
  3. 404 при попытке открыть sitemap — банально, но проверять раз в месяц стоит
  4. Sitemap содержит больше 50 000 URL — поисковик прочитает только первые 50 000
  5. Sitemap-gzip без поддержки gzip-сервером — мало кому помогает, не обязательно
  6. Lastmod в формате DD.MM.YYYY или другом нестандартном — поисковик не парсит, игнорирует

Резюме

Sitemap.xml — простой инструмент, но требующий аккуратности. Большой сайт без правильного sitemap-index получает медленную индексацию. Sitemap с битыми ссылками — потерянное доверие.

Хотите аудит sitemap'а и индексации? Напишите нам. Бесплатный экспресс-аудит за 2 рабочих дня.

Веб-разработка

Это часть нашей услуги Разработка сайтов

Сайты под ключ, сразу готовые к SEO и AI-поиску

Перейти к услуге →
Идём дальше?

Нужна пара экспертных глаз на ваш проект?

Делаем экспресс-аудит за 2 рабочих дня: показываем где сайт теряет трафик и что исправить в первую очередь.

Обсудить проект