19 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Что значит файл sitemap недоступен. Детальное руководство по файлу Sitemap

Гугл не принимает xml сайтмап

В последнее время участились случаи когда Google отказывается принимать сайтмап длительное время.

В данном случае попробую расписать основные причины. Их можно разделить на 2 категории: ошибки на сайте и глюки новой гугл-консоли.

Чаще всего сопровождаются сообщениями:

Не получено – не удалось получить файл Sitemap

Первые действия

  • Убедитесь что сайтмап открывается в браузере и время открытия менее 10сек.
  • Необходимо подождать определенное время. Если краулинговый бюджет сайта израсходован, сразу индексация сайтмапа не пройдет, ожидайте от 1 до 10 дней.
  • Воспользуйтесь инструментом “Проверка URL” для анализа индексации сайтмапа и запроса на приоритетное сканирование (скрин ниже).
  • Отслеживайте по логам, обращался ли GoogleBot к сайтмапу.

Проверка сайтмапа

К сожалению гугл убрал инструмент проверки сайтмапа в новой Search Console. На данный момент такую возможность дает только Яндекс.

В Google можно проверить статус URL и ускорить индексацию единственным способом:

Ошибки на сайте

Ошибки загрузки

  • Сайтмап недоступен или генерируется с ошибками – Проверьте в браузере и используя сервис от Яндекс
  • Проблема с зеркалами сайта WWW/HTTPS – Сам сайтмап и содержимое должны принадлежать главному зеркалу
  • Сайтмап запрещен к индексации в robots.txt – Разрешите используя оператор “Allow:” в конце списка
  • Сайтмап отдается слишком долго (больше 15с)

Ошибки содержимого

  • Адресация в сайтмапе и на сайте отличается либо большое кол-во адресов с редиректами
  • В адресах используются спецсимволы – используйте только латинские буквы (a-z), цифры и тире (-)
  • Несоответствие стандарту XHTML, как правило не заменено & на &аmр;
  • Имеются пробелы в начале, либо кодировка отличная от UTF-8 (без BOM)

Глюки новой Google Search Console

Иногда возникают проблемы при следующих ситуациях

  • Кириллический домен (именно доменная зона) или новая доменная зона (.top, .moscow, . ) (под вопросом)
  • Использование знаков подчеркивания “_” в адресе сайтмапа – есть сообщения что замена на тире решила проблему
  • Заголовок “content-type: application/xml” – есть сообщение что замена на “text/xml“, “text/xml; charset=UTF-8“, “application/rss+xml; charset=UTF-8“, либо полностью убранный заголовок решили проблему
  • Используется gzip-сжатие – уберите сжатие для xml, это никак не повлияет на оценки Google Page Speed, т.к. на страницах сайта xml в 99.99% не грузится
  • Сложная структура адреса сайтмапа – я провел эксперименты и выявил влияние, результаты ниже

Прочие сайтмапы

Если ранее были отправлены иные сайтмапы, они могут задерживать обработку, отъедая краулинговый бюджет сайта. Недостаточно просто удалить сайтмап из консоли.

Если вы удалите файл Sitemap, он будет удален из соответствующего отчета, но останется в Google, как и все URL, которые были в нем указаны.
Чтобы удалить файл Sitemap, выполните следующие действия:

  • Выберите Sitemap который нужно удалить, нажав на него.
  • Нажмите на значок “три точки”.
  • Выберите Удалить файл Sitemap.
  • Чтобы роботы Google больше не обращались к файлу, удалите его с сайта или запретите доступ к нему с помощью файла robots.txt.

    Личный опыт

    • В 90% случаев если с самим сайтмапом всё в порядке, нужно просто подождать
    • В случаях когда ожидание не помогает, нужно делать адрес максимально простым. Для 0pencart FX Sitemap есть специальный патч в разделе поддержки

    Эксперименты

    Разные адреса и отметки принял (✅) или не принял (✖) Google

    Детальное руководство по файлу Sitemap

    В этом путеводителе мы рассмотрим следующие вопросы:

    Что такое Sitemap ?

    Это файл, который содержит в себе перечень ссылок на все важные страницы сайта. То есть, этот документ направляет поисковые системы на основной контент на сайте.

    Для чего нужна карта сайта

    Сайтмап нужен, если у сайта есть проблемы с индексацией, которые вызваны:
    1) большим количеством страниц;
    2) отсутствием ссылок (внутренних или внешних) на страницы;
    3) глубокой вложенностью на сайте (запутанной структурой).

    HTML vs XML-карта сайта

    Карты сайта бывают следующих типов:

    Самое простое объяснение разницы между этими форматами в том, что XML-карта в первую очередь предназначена для поисковых систем, а HTML – для пользователей.

    HTML-карта – это всего лишь общий обзор сайта, содержит только информацию и страницы, которые нужно видеть пользователям. Если вы находитесь на сайте и ищете определённый раздел, при переходе на Sitemap HTML легко его найдёте. Несмотря на то, что такой тип карт сайта ориентирован на пользователя, он также может помочь вашему ранжированию в поисковых системах. Это одно из свидетельств того, что вы заботитесь об удобстве сайта для пользователя.

    При составлении HTML-карты сайта важно учитывать:

    1. Структурированное содержание.

    Карта сайта должна быть понятна и удобна для восприятия пользователя. Желательно, чтобы она включала в себя разделы, категории, подкатегории и т. д.

    2. Анкоры ссылок.

    В отличие от XML-карты, каждая ссылка должна иметь название, чтобы пользователям было понятно, на какую страницу они перейдут.

    3. Ссылка на карту сайта должна быть доступна на всех страницах сайта. Обычно её размещают в футере страницы.

    Протокол XML-карты сайта предназначен для поисковых роботов. XML-файл содержит в себе информацию о том, когда последний раз обновлялся URL-адрес, насколько это важно и как часто происходят изменения.

    Обычно Sitemap состоит из следующих XML-тегов:

    Обязательные:
    – определяет стандарт протокола и инкапсулирует этот файл.
    – содержит в себе информацию о URL-адресе (является родительским тегом).
    – содержит абсолютный URL-адрес.

    Необязательные:
    – указывает дату последнего изменения файла.
    – указывает частоту смены файла.

    – указывает на значимость документа на сайте. Диапазон значений: от 0,1 до 1,0 (по умолчанию 0,5).

    Не устанавливайте для каждого URL-адреса слишком частую смену файла и максимальный приоритет. Если метки частоты и приоритета не отражают реальность, вероятнее всего, поисковые системы будут более склонны игнорировать всю карту XML.

    Другие форматы Sitemap

    Помимо вышеперечисленных карт сайта, поисковые системы также поддерживают следующие форматы:

    Для Google:
    — RSS, mRSS и Atom 1.0;
    RSS / Atom фиды должны содержать последние обновления вашего сайта. Обычно они небольшие и часто обновляются (что является плюсом).
    — Сайты Google.
    Для сайтов, созданных на платформе Google Сайты, Sitemap создаётся автоматически, и внести какие-то изменения невозможно.

    Для Google и Яндекс:
    — текстовый формат (TXT).
    Файл должен быть в кодировке UTF-8 и состоять только из URL-адресов.

    Требования Google и Яндекса к файлам Sitemap

    Общие рекомендации поисковых систем:

    1. Используйте кодировку UTF-8.
    2. Максимальное количество URL – 50 000.
    3. Ссылки в сайтмапе должны быть на том же домене, что и файл.

    Хотя это очевидная рекомендация, на практике встречаются случаи, когда у владельца несколько сайтов, и при переносе шаблона с файлом Sitemap, последний забывали заменить на актуальный.

    4. Если файл слишком большой, разделите его на несколько и укажите их в файле индекса Sitemap.
    5. Ответ сервера при обращении к файлу должен быть 200 ОК.
    6. Указывайте только канонические адреса страниц (без GET-параметров и идентификаторов сессий).

    Отличия:

    Рекомендации Яндекса к файлу:

    1. Максимальный размер – 10 МБ.
    2. Поддерживает кириллические URL.

    1. Максимальный размер – 50 МБ.
    2. Поддерживает только цифры и латинские буквы.

    Распространённая ошибка: чтобы уменьшить требования к пропускной способности канала, используют архиватор gzip. Размер сайтмапа должен быть 50 МБ (10 МБ) до сжатия, а не после.

    Совет: русские доменные имена можно преобразовать с помощью кодировки Punycode.

    Как создать XML Sitemap

    1. Чтобы создать карту сайта, в первую очередь нужно определить канонические адреса, которые будут добавлены в файл.

    2. Определить, какой формат файла будете использовать.

    3. Создать файл можно вручную или, воспользовавшись генератором Sitemap.

    Google в своей справке подготовил список онлайн и десктопных, платных и бесплатных генераторов карт сайта. Ознакомиться со всем списком можно, перейдя по ссылке.

    Сгенерировать Sitemap проще, чем кажется. Разберём, как сгенерировать сайтмап, на примере деcктопного приложения Majento:

    2. Переходим в раздел «Сайты» => «Генерировать Sitemap».

    3. Сохраняем в нужном нам формате.

    4. Карта сайта готова.

    Из online-генераторов XML-карты сайта заслуживает внимания XML Sitemap Generator.

    Расширенные возможности этого сервера позволяют установить определённые XML-теги, включить/исключить нужные документы.

    Исключить ненужные страницы можно и с помощью регулярных выражений.

    XML-карта для изображений

    Google поддерживает расширенный синтаксис для изображений. Для этого вы можете создать отдельную карту сайта для изображений или добавить синтаксис в существующую. Использование расширенного синтаксиса в Sitemap предоставляет поисковой системе дополнительную информацию об изображениях на сайте. Также это может помочь Google обнаружить и проиндексировать изображения, которые он не может найти при сканировании сайта.

    Как и в обычной карте сайта, есть обязательные и необязательные XML-теги.

    Обязательные:
    – аналогично тегу содержит в себе URL изображения и дополнительную информацию.
    – URL изображения.

    Необязательные:
    – подпись к изображению.
    – место съёмки фотографии.
    – название изображения.
    – URL-лицензии изображения.

    XML-карта для видео

    Ещё один расширенный синтаксис, который поддерживает Google, – XML-карта для видео.

    Плюсы добавления XML-тегов для видео:

    1) даёт понять Google, какой контент на сайте;
    2) даёт возможность предоставить детальное описание к файлу;
    3) станет доступным для поиска в Google Видео;
    4) в поисковой выдаче будет отображаться заставка видео (может повысить количество переходов из поисковой выдачи).

    Карта сайта для видеофайлов состоит из следующих обязательных элементов:

    – содержит URL-адрес страницы, на которой размещено видео; если на одной странице размещено более одного видео, не нужно каждый раз создавать тег , достаточно в одном теге несколько раз прописать для каждого видео на странице.
    – включает в себя всю информацию о видео.
    – URL к миниатюрному изображению (заставке) к видео. Рекомендованные размеры: от 160×90 пикселей до 1920×1080. Форматы изображения: .jpg, .png, or. gif
    – заголовок, который должен совпадать с названием страницы, на которой отображается видео.
    – описание видео. Должно соответствовать с метаописаниями страницы. Максимальное количество символов – 2048.

    Заголовок и описание видео должны быть экранированы или упакованы в блок CDATA.

    Со всеми XML-тегами карты сайта для видео можно ознакомиться в справке Google.

    Где разместить карту сайта

    Мы рекомендуем размещать XML-карту в корневом каталоге сайта. Ссылку на сайтмап нужно указать в файле robots.txt.

    Добавить и проверить Sitemap в Yandex.Webmaster

    Чтобы сообщить роботу Яндекса о наличии карты сайта, добавьте её в панель Яндекс.Вебмастера:

    1. Перейдите в раздел «Индексирование» – «Файлы Sitemap».

    2. Укажите ссылку на сайтмап.

    3. Нажмите кнопку «Добавить».

    4. Ниже будет отображаться список со всеми добавленными файлами.

    Прежде чем добавить файл, рекомендуем проверить его на наличие ошибок:

    1. В панели Яндекс.Вебмастера перейдите в раздел «Инструменты» – «Анализ файлов Sitemap».

    2. Укажите URL, загрузите файл или просто добавьте текст.

    3. Нажмите кнопку «Проверить».

    Добавить и проверить файл в Google Search Console

    Чтобы сообщить Googlebot о наличии этого файла, нужно добавить его в панель GSC:
    1. Перейдите в раздел «Сканирование» – «Файлы Sitemap».
    2. Нажмите кнопку «Добавление / проверка файла Sitemap».
    3. Укажите URL файла.
    4. Нажмите кнопку «Отправить».

    Чтобы проверить карту сайта на наличие ошибок, вместо кнопки «Отправить» нажмите «Тест». Если ошибок нет, будет отображаться следующее окно.

    При возникновении ошибок или предупреждений, Google сообщит об этом в соответствующей панели.

    Полный перечень ошибок и как их исправить описано в справке Google.

    Распространённые заблуждения о Sitemap

    Так как у многих этот файл вызывает трудности и является «тёмным лесом», возникают определённые мифы в отношении карт сайта. Рассмотрим некоторые из них:

    – «Включение URL-адреса в файл Sitemap для XML гарантирует, что он будет проиндексирован».
    Нет. Важно отметить, что XML-файлы Sitemap – это только рекомендации. Карта сайта XML не гарантирует индексацию поисковыми системами страниц, указанных в файле.

    – «Если я удалю URL из XML-карты, он будет удалён из индекса».
    Нет. Карта сайта XML не исключает индексацию страниц, не включённых в карту сайта XML.

    – «XML-файлы Sitemap трудно создавать и поддерживать»
    Нет. Небольшие сайты могут легко создавать и размещать собственные XML-файлы вручную, используя приведённые выше примеры в качестве руководства по форматированию. Для более крупных сайтов и сайтов, которые изменяются чаще, плагины или модули, доступные для большинства CMS, могут автоматизировать обновление XML-файлов.

    Заключение

    Файл Sitemap – полезный инструмент для передачи поисковым роботам информации о структуре сайта. Используйте это руководство, чтобы понять, как работает карта сайта, как она устроена, как сгенерировать, разместить и проверить файл.

    Ошибки в карте сайта sitemap.xml

    Небольшой пост по поводу ошибок в xml-карте сайта:

    • Почему возникают?
    • Насколько критично?
    • Всегда ли надо устранять?

    Файл sitemap — это файл с информацией о страницах сайта, подлежащих индексированию. Разместив этот файл на сайте, вы можете:

    • сообщить Яндексу, какие страницы вашего сайта нужно индексировать;
    • как часто обновляется информация на страницах;
    • индексирование каких страниц наиболее важно.

    О проблемах с сайтом можно узнать при помощи сервиса Яндекс.Вебмастер, для этого необходимо добавить сайт в Вебмастер.

    Яндекс.Вебмастер сигнализирует о возможной проблеме

    Сразу замечу, что в обязательном порядке необходимо реагировать на фатальные ошибки. К “самым фатальным ошибкам” относятся заражение сайта вирусами и полный запрет на индексирование сайта в файле robots.txt (Disallow: /).

    В конкретном случае сервис сообщает, что возможно есть какие-то проблемы с файлами Sitemap.

    В одном или нескольких файлах Sitemap обнаружены ошибки, которые могут повлиять на обработку файлов индексирующим роботом После щелчка по ссылке “Проверить” возникла ужасающая картина – почти 11 тыс. ошибок в файле Sitemap с постами сайта

    У особо впечатлительных веб-мастеров может подняться давление, но сперва следует разобраться в причине статуса.

    Как оказалось, проблема в теге image:image, который не смог распознать робот Яндекса

    Этот тег появился в картах Sitemap по той причине, что в качестве SEO-плагина на сайте установлен Yoast SEO, который создает Sitemap согласно пожеланиям Google.

    Тег содержит всю информацию об одном изображении. Он нужен для того, чтобы картинки были представлены в результатах поиска Google.

    Следуя рекомендациям для веб-мастеров и советам по публикации изображений, вы повысите вероятность того, что ваши картинки будут представлены в результатах поиска. Кроме того, можно предоставить Google дополнительную информацию о графических материалах, размещенных на вашем сайте, с помощью специальных функций файла Sitemap. Это поможет Google найти контент, который иначе нельзя было бы обнаружить (например, если он загружается с помощью JavaScript), а также позволит вам указать изображения, которые необходимо сканировать и индексировать.

    Получается, что хорошо для Google, то плохо для Яндекса. На некоторых блогах появились рекомендация убирать все лишнее из файлов Sitemap чтобы у Яндекса не было замечаний. Но надо ли на самом деле убирать то, что рекомендует Google? Насколько критичны данные ошибки для сайта? Чтобы ответить на этот вопрос, обратимся к справке Яндекса.

    Файл Sitemap может содержать различную информацию о страницах сайта, которая передаётся роботам с помощью тегов в файле. Робот Яндекса поддерживает следующие теги:

    • loc (адрес страницы);
    • lastmod (дату последнего обновления страницы);
    • changefreq (частоту изменения страницы);
    • priority (относительную значимость страницы).

    Если файл содержит другие теги, например, с указанием на мобильную или мультиязычную версию, а также с адресами картинок , в Яндекс.Вебмастере появится ошибка «Неизвестный тег». Неподдерживаемые теги игнорируются роботом при обработке Sitemap, при этом данные из поддерживаемых тегов учитываются, поэтому менять файл Sitemap необязательно . Если содержимое файла будет изменено, потребуется до двух недель на обновление информации в Яндекс.Вебмастере.

    Итак, согласно справки Яндекса, если ошибки связаны с тегом , то нет необходимости его удалять. Однако всегда терзают смутные сомнения. А может ошибки все же негативно влияют на продвижение сайта? Чтобы дать адекватный ответ на этот вопрос, я нашел несколько топовых сайтов строительной тематики на движке WordPress с установленным плагином Yoast SEO и посмотрел их параметры:

    Согласно выработанным мною метрикам, у изученных сайтов все замечательно. Для большей наглядности привожу статистику одного из них.

    Возраст сайта – 1,5 года, количество статей – 450, посещаемость более 15 тыс. человек в сутки. Плагин Yoast SEO был установлен с первых дней создания сайта

    голоса
    Рейтинг статьи
    Читать еще:  Почему долго грузится ноутбук при включении?
  • Ссылка на основную публикацию
    Статьи c упоминанием слов: