Що таке мапа сайту (файл Sitemap)?

XML-мапа — перелік сторінок сайту в форматі XML, доступних для сканування пошуковим роботам. Слід відрізняти XML-мапу від звичайної мапи сайту HTML.

XML-мапа сайту дозволяє:

  • визначити місцеперебування сторінок сайту;
  • вказати час останнього оновлення сторінок;
  • визначити частоту (періодичність) поновлення і важливість щодо інших сторінок сайту;
  • визначити пріоритет сторінок в структурі.

Визначити правильні установки мапи дозволяє підвищити індексацію сторінок веб-сайту.

У чому різниця між Sitemap.html і Sitemap.xml

Карта сайту HTML-сторінка sitemap.html з функцією спрощення навігації — вона дозволяє знайти будь-яку сторінку на великому сайті та скоротити кількість переходів під час її пошуку.

Карта сайту XML-файл з докладним переліком сторінок веб-сайту для пошукової системи.

Що таке html мапа сайту?

Мапа сайту HTML — це статична HTML-сторінка з посиланнями на всі основні сторінки сайту. Такий формат мапи більше орієнтований на відвідувачів сайту і дозволяє перейти на будь-яку сторінку в 1 клік.

Sitemap.html, в більшості випадків, представляє структуру дерева з розгорнутими розділами.

мапа сайту

Найчастіше посилання на html-мапу сайту розташоване у футері:

футер

Якщо у сайту дуже складна структура, то HTML-мапа може складатися зі сторінок з додатковим рівнем вкладеності.

Що таке sitemap.xml?

Це файл xml-формату в кореневій папці сайту, який читається всіма існуючими пошуковими системами. Основна роль sitemap.xml — вказати пошуковим системам:

  • всі сторінки, які необхідно проіндексувати;
  • коли сторінки з’явилися або оновилися;
  • як часто перевіряти сторінки на оновлення.

Як виглядає sitemap.xml?

Приклад файлу — https://inweb.ua/sitemap.xml. Один файл sitemap.xml може містити не більше 50 000 посилань. Якщо їх понад 50 000, необхідно створити кілька таких файлів. Розширені можливості пошуку — можливість вказати частоту оновлення сторінок і пріоритет індексації. Коректне кодування файлу sitemap.xml повинна бути UTF-8, а розмір не більше 10 Мб.

Приклад мапи сайту в форматі .xml:

Структура sitemap.xml

Оголошення XML

У цьому рядку ми повідомляємо пошуковій системі, що вона має справу з XML-файлом. Тут же вказується версія XML і кодування, яка використовується (обов’язково використовувати UTF-8).

URL set

urlset — місце зберігання всіх URL-адрес мапи сайту. У цьому рядку краулер повідомляє стандарт протоколу, який використовується. Більшість мап вказують стандарт Sitemap 0.9.

URL

url — батьківський тег для кожної URL-адреси. Необхідно вказати URL-адресу у вкладеному тезі loc.

Важливо! Необхідно вказувати не відносні, а абсолютні URL-адреси.

У тезі url можна вказати додаткові теги:

  • lastmod — вказує дату внесення останніх змін. Формат дати повинен бути W3C Datetime . Наприклад, якщо сторінка оновлена 17 жовтня 2020 року, в атрибуті необхідно вказати значення 2020-10-17. Додатково також можна вказати час.
  • priority — вказує пріоритет URL-адреси щодо всіх інших. Діапазон значень від 0.0 до 1.0. Чим більше значення, тим вище пріоритет.
  • changefreq — вказує частоту змін сторінки. Мета даного властивості — повідомити пошуковій системі про те, як часто їм може знадобитися повторно сканувати URL-адреси. Допускаються значення: never (ніколи), always (завжди), hourly (щогодини), daily (щодня), weekly (щотижня), monthly (щомісяця) і yearly (щорічно).

Додаткові теги не особливо важливі для SEO. Гері Ілш з Google стверджує , що значення тега lastmod ігнорують, так як в більшості випадків« вебмайстри абсолютно не намагаються стежити за його точністю ».

Тег priority в Google, за їхніми словами, ігнорується, тому що це просто «зайвий шум».

Щодо тега changefreq Джон Мюллер говорить: «Пріоритет і зміна частоти насправді більше не грають такої великої ролі, коли мова йде про мапу сайту».

Обов’язкові теги

АтрибутOпис
urlsetІнкапсулює цей файл і вказує стандарт поточного протоколу.
urlБатьківський тег для кожного запису URL-адреси. Решта теги є дочірніми для цього тега.
locURL-адресу сторінки. Цей URL-адреса має починатися з префікса (наприклад, HTTP) і закінчуватися косою рисою, якщо Ваш веб-сервер вимагає цього. Довжина цього значення не повинна перевищувати 2048 символів.

Необов’язкові теги

АтрибутOпис
lastmodДата внесення останніх змін. Формат дати: W3C Datetime (РРРР-ММ-ДД). Формат не зобов’язує використовувати сегмент часу. Даний тег не має відношення до заголовку If-Modified-Since (304).
changefreqЧастота змін сторінки. Значення є підказкою і може не відповідати точної частоті зміни сторінки. Допустимі значення:
  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

Значення «always» необхідно використовувати для опису документів, які змінюються при кожному доступі до цих документів.

Значення «never» необхідно використовувати для опису архівних URL-адрес.

Слід розуміти, що якщо встановити частоту оновлень, наприклад, раз на годину hourly — робот не стане індексувати сторінку так часто.

priorityЗначення задає пріоритетність URL щодо інших URL на сайті. Допустимий діапазон значень – від 0,0 до 1,0. Значення є підказкою і не впливає на процедуру порівняння важливості сторінок (вказує пошуковій системі, які сторінки, на вашу думку, більш важливі для сканерів).

Значення за замовчуванням — 0,5.

Додавання високого пріоритету до всіх URL не має сенсу, так як пріоритетність — величина відносна, цей параметр використовується, щоб визначити черговість обробки URL в межах сайту.

Навіщо вам потрібна мапа сайту?

Пошукова система виявляє новий контент, скануючи веб-сторінки. Коли пошуковик сканує сторінку, то враховують і внутрішні, і зовнішні посилання на неї. Якщо виявлена URL-адреса не міститься в індексі, пошуковик, якщо йому потрібно, може спарсити і проіндексувати контент. Але таким чином Google не зможе знайти весь контент: якщо на сторінку не посилається жодна,з вже відомих йому, сторінок, він її навряд чи виявить. Ось тут і вступає в гру мапа сайту. Мапа сайту повідомляє Google (і іншим пошуковикам), де знайти найбільш важливі сторінки для сканування та індексування.

Чи потрібен мені файл Sitemap?

Якщо на сайті коректно вказані посилання на необхідні сторінки, роботи пошукових систем зможуть виявити більшу частину з них. За допомогою файлу Sitemap можна оптимізувати сканування великих або складних сайтів, а також спеціалізованих файлів.

Порядок сканування та індексування визначається складними алгоритмами, і навіть якщо ви створили файл Sitemap, це не гарантує, що всі ваші сторінки будуть просканувати і індексовані. Найчастіше використання файлу Sitemap допомагає оптимізувати цей процес і запобігти помилок.

В яких випадках вам може знадобитися файл Sitemap

Файл Sitemap потрібен у випадках, якщо:

  1. Великий сайт. Багатосторінковість може призвести до того, що бот пошукової системи пропустить нові (змінені) сторінки.
  2. У сайту відсутня пов’язана структура сторінок. Наприклад, є великий архів сторінок, які не пов’язані між собою.
  3. Сайт молодий — містить невелику кількість зовнішніх посилань.
  4. На сайті присутній великий обсяг мультимедійного (відео та картинки) або контенту новин. З файлів мап сайту xml пошукова система може отримувати додаткову інформацію для показу результатів пошуку.

В яких випадках вам не потрібний файл Sitemap

Файл Sitemap не потрібен, якщо:

  1. Сайт малий.
  2. Сайт максимально структурований, тобто реалізовано детальну систему внутрішніх посилань. Роботи пошукових систем можуть перейти на всі значущі сторінки за посиланнями з головної.
  3. На сайті є багато медіафайлів (наприклад, відео та зображень) або сторінок новин.

Які бувають карти сайту?

XML-sitemap для зображень

Крім XML-карт для сторінок, можна створювати окремі карти сайту для зображень, які допомагають пошуковим системам знайти контент, який неможливо виявити іншими способами (наприклад, контент, який завантажується за допомогою JavaScript).

У картах зображень використовуються теги:

image:imageВся інформація про одне зображення. Тег може включати до 1000 тегів image:image.
image:locURL зображення.

У картах зображень можна використовувати необов’язкові теги:

image:captionПідпис до зображення.
image:geo_locationМісце зйомки.
image:titleНазва зображення.
image:licenseURL ліцензії зображення.

Приклад XML sitemap для зображень:

XML sitemap для відео

Як і у випадку із зображеннями, якщо на сайті є унікальні відеозаписи, — для них можна створити окрему XML-карту.

За допомогою карти сайту для відео можна повідомити пошукову систему:

  • назва;
  • опис,
  • тривалість;
  • мініатюру та ін.

Обов’язкові теги:

  • <loc> — сторінка з відеозаписом;
  • <video:title> — назва відео завдовжки не більше 100 символів;
  • <video:player_loc> – де знаходиться плеєр для відео;
  • <video:content_loc> — де знаходиться конкретне відео;
  • <video:thumbnail_loc> — мініатюра відео розміром більше 120х90px;
  • <video:video> — контейнер із описом відео;
  • <video:description> — опис відео до 2000 символів.

До карти сайту для відео можна додати необов’язкові теги:

  • <video:duration> — тривалість відео в секундах, максимум 8 годин;
  • <video:category> — до якої категорії відноситься відео;
  • <video:uploader> – хто додав відео. Дозволяється вказати одне ім’я для одного файлу;
  • <video:requires_subscription> — чи потрібна для перегляду відео передплата (і платна та безкоштовна). Доступні значення: yes, no;
  • <video:publication_date> — дата публікації у форматі YYYY-MM-DD або YYYY-MM-DDThh:mm:ss+TZD;
  • <video:family_friendly> — чи є відео для безпечного пошуку чи ні;
  • <video:restriction> — список країн, де відтворюється або не відтворюється відео. Вказується як коди країн у форматі ISO 3166. Для кожного відео допускається лише один тег, передбачається можливість відтворювати на всіх територіях;
  • <video:gallery_loc> — посилання на галерею;
  • <video:expiration_date> — дата та час, коли відео стає неактуальним;
  • <video:price> — вартість (вказується валюта у форматі ISO 4217);
  • <video:rating> – рейтинг відео. Доступні значення: від 0 до 5;
  • <video:tag> – теги відео;
  • <video:platform> — список платформ, на яких можна відтворити відео. Доступні значення: mobile, web, tv. За відсутності тега передбачається, що відео можна відтворювати на всіх платформах;
  • <video:view_count> — кількість переглядів;
  • <video:live> — вказує на те, чи відео є прямою трансляцією (live). Доступні значення: yes, no.

Приклад:

Google «підтримує» такі формати:

  • .mpg, .mpeg, .mp4, .m4v;
  • .wmv?
  • .asf, .avi;
  • .ra, .ram, .rm;
  • .mov;
  • .flv.

XML-карта для Google Новин

Для сайтів-новинників доцільно створити окрему sitemap новинних публікацій з динамічною генерацією та щоденним оновленням. Ці файли будуть працювати тільки для ресурсів, доданих до Google Новини.

Файл sitemap новин має містити лише URL-статей, опублікованих за останні два дні. Статті, опубліковані більше двох днів тому, можна видалити з файлу, при цьому вони залишаться в індексі Google Новин протягом 30 днів. Карта сайту новин може містити не більше 1000 URL-адрес. Якщо на сайті за два дні з’являється більше новин, можна створити файл індексу sitemap для кількох мап.

Обов’язкові теги:

  • <news:publication> — загальний тег, вказуємо видання. Цей тег має два обов’язкові дочірні теги:
    • <news:name> — Назва видання;
    • <news:language> — мова у форматі ISO 639;
  • <publication_date> — дата публікації у форматі W3C (вказуємо повну дату. Пошуковий робот Google розуміє дати аж до часток секунд, наприклад: РРРР-ММ-ДДTчч:мм:cc.с±чч:мм (2017-05-10T19:20 :30.45+01:00);
  • <news:title> — назва статті, аналогічна назві на сайті.

Крім цього, існують необов’язкові теги:

  • <news:genres> — властивості статті. Допустимі значення:
    • PressRelease — прес-реліз;
    • Satire — стаття, яка виставляє предмет обговорення у комічній формі.
    • Blog — стаття опублікована у форматі блогу.
    • OpEd — стаття, яка виражає особисту думку та розміщена в колонці редактора.
    • Opinion — стаття, яка висловлює особисту думку та не розміщена в колонці редактора. Цей тег включає рецензії колумністів та інтерв’ю.
    • UserGenerated — будь-який матеріал, створений користувачем, що пройшов редакторську правку.
  • <keywords> — ключові слова;
  • <stock_tickers> – список біржових/фінансових символів (не більше п’яти, через кому). Перед кожним символом необхідно вказувати назву відповідної біржі, яка співпадає із записом у Google Фінансах, наприклад NASDAQ:AMAT або BOM:500325. Використовується для статей про бізнес.

Приклад sitemap для Google Новин:

Як створити карту сайту?

Деякі CMS за замовчуванням генерують мапу сайту. Вона буде оновлюватися автоматично, якщо ви додаватимете або прибиратимете сторінки. Якщо CMS цього не робить, швидше за все, є можливість встановити для неї відповідний плагін.

Створення картки сайту в WordPress

Один із способів згенерувати мапу сайту для WordPress це скористатися плагіном Yoast SEO. Щоб встановити Yoast SEO, перейдіть в консоль WordPress.

Виберіть Плагіни > Додати новий.

Знайдіть “Yoast SEO”. Натисніть кнопку “Встановити”, а потім – “Активувати”.

Перейдіть до розділу SEO > Загальні > Можливості та переконайтеся, що XML-карта сайту включена.

Створення мапи сайту без CMS

Згенерувати XML-карту сайту можна за допомогою програм краулерів, наприклад Screaming Frog або Netpeak Spider.

Створення карки сайту за допомогою Screaming Frog

Відкрийте розділ Mode > Spider

Відкрийте розділ Mode

Вставте URL-адресу головної сторінки в поле з підписом “Enter URL to spider”.

Натисніть кнопку “Start”.

Вставте URL-адресу головної сторінки в поле з підписом Enter URL to spider

Після завершення сканування перейдіть до розділу Sitemaps > XML sitemap.

Після завершення сканування перейдіть до розділу Sitemaps

Оскільки теги <lastmod>, <changefreq> та <priority> є несуттєвими, їх можна не включати до файлу sitemap.xml.

Як створити карту сайту Sitemap XML

Натисніть «Export» та збережіть файл sitemap.xml на комп’ютері. Готово.

Важливо. Вищеописана інструкція підходить для платної версії Screaming Frog, або безкоштовної, якщо на сайті менше 500 сторінок (ліміт використання безкоштовної версії). При досягненні ліміту не всі сторінки сайту будуть проскановані та можуть не потрапити до експортованого файлу картки сайту. Що робить його непридатним для використання.

Створення мапи сайту за допомогою Netpeak Spider

  1. Вставте URL-адресу головної сторінки у поле з підписом «Початковий URL».
  2. Натисніть кнопку “Старт”.
  3. Після завершення сканування перейдіть до розділу Інструменти > Генератор Sitemap.
  4. Як і у випадку з Screaming Frog, теги lastmod, changefreq і priority можна не включати до файлу sitemap.xml.
  5. Натисніть кнопку «Згенерувати…» та збережіть файл sitemap.xml на комп’ютері. Готово.

Як перевірити коректність мапи сайту

Для перевірки коректності XML-карти сайту можна скористатися інструментом Netpeak Spider. Детальний мануал з перевірки за допомогою валідатора XML описаний у статті .

Основні помилки при складанні мапи сайту

При складанні карти сайту найпоширенішими помилками є:

  • редиректи;
  • биті посилання;
  • некоректні дати публікації або оновлення контенту.

Помилки не є критичними для пошукових систем, але їх усунення дозволить направити ресурси пошукового робота, що вивільнилися, на переобхід важливих сторінок.

Як правильно вказати посилання на sitemap.xml у robots.txt

По-перше, XML-карту сайту необхідно створити та завантажити на сервер, потім необхідно додати вказівку про наявність файлу. Для цього пропишіть у robots.txt наступний рядок:

Sitemap: {url-файла-sitemap},

де {url-файла-sitemap} — це повна URL-адреса вашої карти сайту.

Як побудувати XML-карту для мультимовних сайтів

За допомогою файлу sitemap.xml можна передати Google атрибут rel=”alternate” hreflang=”x”.

Простір імен XHTML повинен бути вказаний так:

xmlns:xhtml=”http://www.w3.org/1999/xhtml”

Для кожної адреси необхідно створити окремий елемент URL, який повинен містити:

  1. Тег loc, який вказує на URL-адресу;
  2. Поділемент xhtml:link rel=”alternate” hreflang=”XX” для кожної альтернативної версії сторінки, обов’язково включаючи поточну версію.

Наприклад, на сайті існують 3 мовні версії:

  • українська (mysite.com/ua/);
  • російська (mysite.com/ru/);
  • англійська (mysite.com/en/).

Нижче наведено приклад карти сайту, яка повідомляє, що сторінка mysite.com/ru/ має відповідну версію англійською та українською мовами:

Як повідомити пошуковій системі про мапу сайту

Насамперед необхідно визначити, де знаходиться карта сайту. Найчастіше при використанні плагіна, згенерована мапа сайту буде за URL-адресою domain.com/sitemap.xml. Якщо ви генеруєте картку сайту вручну, назвіть її sitemap.xml і завантажте її в кореневий каталог вашого веб-сайту. Після цього картка сайту буде доступна за адресою domain.com/sitemap.xml.

Немає жодних правил найменування карти сайту XML. Можна вибрати будь-яке ім’я для карти сайту, але найкращою практикою буде дотримуватися назви sitemap.xml. Якщо у вас кілька карток, можна використовувати просту схему найменування з додатковою нумерацією, наприклад sitemap-1.xml, sitemap-2.xml і подібні.

Як надіслати мапу сайту в Google

Щоб надіслати карту сайту через Google Search Console, необхідно:

  1. Вибрати сайт в Google Search Console.
  2. Вибрати «Файли Sitemap».
  3. Додати URL-адресу файлу Sitemap та натиснути на кнопку «Надіслати».

Готово.

Як часто має оновлюватися мапа сайту?

Стандартизованого нормативу щодо кількості оновлень немає. Все залежить від частоти створення нових сторінок на сайті, змін адрес або контенту, а також зв’язків вже існуючих сторінок.

Не варто забувати, що дані, зазначені в Sitemap, пошуковий робот сприймає як рекомендації: якщо встановити частоту оновлень, наприклад, раз на годину — робот не індексуватиме сторінку так часто.

Рекомендації Google

Обов’язково:

  • мапа містить не більше 50 000 URL;
  • загальний розмір до 50 Мб (у стислому вигляді).

Формати, які підтримує Google як sitemap:

  • XML — це стандартний файл;
  • RSS, media RSS та Atom 1.0 — підходить для блогів з фідом RSS або Atom;
  • текстовий файл .txt.

Основні вимоги до текстових файлів:

  • використовується кодування UTF-8;
  • файл не містить нічого, крім списку URL;
  • текстовому файлу можна дати будь-яке ім’я, але з розширенням .txt (наприклад, sitemap.txt).

Які можливості дає мапа сайту?

Пошуковики здатні просканувати всі адреси сайту самостійно, але створення карти сайту допоможе їм дізнатися, як це краще зробити.

Мапа сайту дозволяє:

  1. Знайти нові сторінки на ресурсі та проіндексувати їх.
  2. Розставити пріоритетність сторінок.
  3. Відстежити зміни на сторінках, що індексуються.
  4. Контролювати індексацію сторінок (наприклад, за допомогою звіту про індексування у розділі Файли Sitemap у Google Search Console).
  5. Запам’ятати частоту оновлення сторінок, що індексуються.

Чи впливає Sitemap на просування?

Мапа сайту – зручний інструмент для спрощення передачі структури сайту пошуковій системі. При цьому варто не забувати, що мапа сайту ніяк не взаємопов’язана з ранжуванням. Без неї можна обійтись. Пошуковик і так рано чи пізно дістанеться більшості веб-сторінок, але з картою сайту переобхід або індексація нових сторінок будуть більш ефективними.