Що таке мапа сайту (файл Sitemap)?

XML-мапа — перелік сторінок сайту в форматі XML, доступних для сканування пошуковим роботам. Слід відрізняти XML-мапу від звичайної мапи сайту HTML.

XML-мапа сайту дозволяє:

  • визначити місцеперебування сторінок сайту;
  • вказати час останнього оновлення сторінок;
  • визначити частоту (періодичність) поновлення і важливість щодо інших сторінок сайту;
  • визначити пріоритет сторінок в структурі.

Визначити правильні установки мапи дозволяє підвищити індексацію сторінок веб-сайту.

У чому різниця між Sitemap.html і Sitemap.xml

Карта сайту HTML-сторінка sitemap.html з функцією спрощення навігації — вона дозволяє знайти будь-яку сторінку на великому сайті та скоротити кількість переходів під час її пошуку.

Карта сайту XML-файл з докладним переліком сторінок веб-сайту для пошукової системи.

Що таке html мапа сайту?

Мапа сайту HTML — це статична HTML-сторінка з посиланнями на всі основні сторінки сайту. Такий формат мапи більше орієнтований на відвідувачів сайту і дозволяє перейти на будь-яку сторінку в 1 клік.

Sitemap.html, в більшості випадків, представляє структуру дерева з розгорнутими розділами.

Карта сайту приклад

Найчастіше посилання на html-мапу сайту розташоване у футері:

HTML карта сайту

Якщо у сайту дуже складна структура, то HTML-мапа може складатися зі сторінок з додатковим рівнем вкладеності.

Що таке sitemap.xml?

Це файл xml-формату в кореневій папці сайту, який читається всіма існуючими пошуковими системами. Основна роль sitemap.xml — вказати пошуковим системам:

  • всі сторінки, які необхідно проіндексувати;
  • коли сторінки з’явилися або оновилися;
  • як часто перевіряти сторінки на оновлення.

Як виглядає sitemap.xml?

Приклад файлу — https://inweb.ua/sitemap.xml. Один файл sitemap.xml може містити не більше 50 000 посилань. Якщо їх понад 50 000, необхідно створити кілька таких файлів. Розширені можливості пошуку — можливість вказати частоту оновлення сторінок і пріоритет індексації. Коректне кодування файлу sitemap.xml повинна бути UTF-8, а розмір не більше 10 Мб.

Приклад мапи сайту в форматі .xml:

Структура sitemap.xml

Оголошення XML

У цьому рядку ми повідомляємо пошуковій системі, що вона має справу з XML-файлом. Тут же вказується версія XML і кодування, яка використовується (обов’язково використовувати UTF-8).

URL set

urlset — місце зберігання всіх URL-адрес мапи сайту. У цьому рядку краулер повідомляє стандарт протоколу, який використовується. Більшість мап вказують стандарт Sitemap 0.9.

URL

url — батьківський тег для кожної URL-адреси. Необхідно вказати URL-адресу у вкладеному тезі loc.

Важливо! Необхідно вказувати не відносні, а абсолютні URL-адреси.

У тезі url можна вказати додаткові теги:

  • lastmod — вказує дату внесення останніх змін. Формат дати повинен бути W3C Datetime . Наприклад, якщо сторінка оновлена 17 жовтня 2020 року, в атрибуті необхідно вказати значення 2020-10-17. Додатково також можна вказати час.
  • priority — вказує пріоритет URL-адреси щодо всіх інших. Діапазон значень від 0.0 до 1.0. Чим більше значення, тим вище пріоритет.
  • changefreq — вказує частоту змін сторінки. Мета даного властивості — повідомити пошуковій системі про те, як часто їм може знадобитися повторно сканувати URL-адреси. Допускаються значення: never (ніколи), always (завжди), hourly (щогодини), daily (щодня), weekly (щотижня), monthly (щомісяця) і yearly (щорічно).

Додаткові теги не особливо важливі для SEO. Гері Ілш з Google стверджує , що значення тега lastmod ігнорують, так як в більшості випадків« вебмайстри абсолютно не намагаються стежити за його точністю ».

Тег priority в Google, за їхніми словами, ігнорується, тому що це просто «зайвий шум».

Щодо тега changefreq Джон Мюллер говорить: «Пріоритет і зміна частоти насправді більше не грають такої великої ролі, коли мова йде про мапу сайту».

Обов’язкові теги

АтрибутOпис
urlsetІнкапсулюють цей файл і вказує стандарт поточного протоколу.
urlБатьківський тег для кожного запису URL-адреси. Решта теги є дочірніми для цього тега.
locURL-адресу сторінки. Цей URL-адреса має починатися з префікса (наприклад, HTTP) і закінчуватися косою рисою, якщо Ваш веб-сервер вимагає цього. Довжина цього значення не повинна перевищувати 2048 символів.

Необов’язкові теги

АтрибутOпис
lastmodДата внесення останніх змін. Формат дати: W3C Datetime (РРРР-ММ-ДД). Формат не зобов’язує використовувати сегмент часу. Даний тег не має відношення до заголовку If-Modified-Since (304).
changefreqЧастота зміни сторінки. Значення є підказкою і може не відповідати точної частоті зміни сторінки. Допустимі значення:
  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

Значення «always» необхідно використовувати для опису документів, які змінюються при кожному доступі до цих документів.

Значення «never» необхідно використовувати для опису архівних URL-адрес.

Слід розуміти, що якщо встановити частоту оновлень, наприклад, раз на годину hourly — робот не стане індексувати сторінку так часто.

priorityЗначення задає пріоритетність URL щодо інших URL на сайті. Допустимий діапазон значень – від 0,0 до 1,0. Значення є підказкою і не впливає на процедуру порівняння важливості сторінок (вказує пошуковій системі, які сторінки, на вашу думку, більш важливі для сканерів).

Значення за замовчуванням — 0,5.

Додавання високого пріоритету до всіх URL не має сенсу, так як пріоритетність — величина відносна, цей параметр використовується, щоб визначити черговість обробки URL в межах сайту.

Навіщо вам потрібна мапа сайту?

Пошукова система виявляє новий контент, скануючи веб-сторінки. Коли пошуковик сканує сторінку, то враховують і внутрішні, і зовнішні посилання на неї. Якщо виявлена URL-адреса не міститься в індексі, пошуковик, якщо йому потрібно, може спарсити і проіндексувати контент. Але таким чином Google не зможе знайти весь контент: якщо на сторінку не посилається жодна,з вже відомих йому, сторінок, він її навряд чи виявить. Ось тут і вступає в гру мапа сайту. Мапа сайту повідомляє Google (і іншим пошуковикам), де знайти найбільш важливі сторінки для сканування та індексування.

Чи потрібен мені файл Sitemap?

Якщо на сайті коректно вказані посилання на необхідні сторінки, роботи пошукових систем зможуть виявити більшу частину з них. За допомогою файлу Sitemap можна оптимізувати сканування великих або складних сайтів, а також спеціалізованих файлів.

Порядок сканування та індексування визначається складними алгоритмами і навіть якщо ви створили файл Sitemap, це не гарантує, що всі ваші сторінки будуть просканувати і індексовані. Найчастіше використання файлу Sitemap допомагає оптимізувати цей процес і запобігти помилок.

В яких випадках вам може знадобитися файл Sitemap

Файл Sitemap потрібен у випадках якщо:

  1. Великий сайт. Багатосторінковість може привести до того, що бот пошукової системи пропустить нові (змінені) сторінки.
  2. У сайта відсутня пов’язана структура сторінок. Напри