Що таке мапа сайту (файл Sitemap)?
XML-мапа — перелік сторінок сайту в форматі XML, доступних для сканування пошуковим роботам. Слід відрізняти XML-мапу від звичайної мапи сайту HTML.Зміст статті
- Sitemap.html і Sitemap.xml: в чому різниця
- Що таке карта сайту?
- Як виглядає sitemap.xml?
- Структура sitemap.xml
- Навіщо вам потрібна карта сайту?
- Чи потрібен мені файл Sitemap?
- Які бувають карти сайту?
- Як створити карту сайту?
- Як перевірити коректність карти сайту
- Основні помилки при складанні карти сайту
- Як правильно вказати посилання на sitemap.xml в robots.txt
- Як побудувати XML-карту для багатомовних сайтів
- Як повідомити пошуковику про карту сайту
- Як часто повинна оновлюватися карта сайту?
- Рекомендації Google
- Які можливості дає карта сайту?
- Чи впливає Sitemap на просування?
XML-мапа сайту дозволяє:
- визначити місцеперебування сторінок сайту;
- вказати час останнього оновлення сторінок;
- визначити частоту (періодичність) поновлення і важливість щодо інших сторінок сайту;
- визначити пріоритет сторінок в структурі.
Визначити правильні установки мапи дозволяє підвищити індексацію сторінок веб-сайту.
У чому різниця між Sitemap.html і Sitemap.xml
Карта сайту HTML-сторінка sitemap.html з функцією спрощення навігації — вона дозволяє знайти будь-яку сторінку на великому сайті та скоротити кількість переходів під час її пошуку.
Карта сайту XML-файл з докладним переліком сторінок веб-сайту для пошукової системи.
Що таке html мапа сайту?
Мапа сайту HTML — це статична HTML-сторінка з посиланнями на всі основні сторінки сайту. Такий формат мапи більше орієнтований на відвідувачів сайту і дозволяє перейти на будь-яку сторінку в 1 клік.
Sitemap.html, в більшості випадків, представляє структуру дерева з розгорнутими розділами.
Найчастіше посилання на html-мапу сайту розташоване у футері:
Якщо у сайту дуже складна структура, то HTML-мапа може складатися зі сторінок з додатковим рівнем вкладеності.
Що таке sitemap.xml?
Це файл xml-формату в кореневій папці сайту, який читається всіма існуючими пошуковими системами. Основна роль sitemap.xml — вказати пошуковим системам:
- всі сторінки, які необхідно проіндексувати;
- коли сторінки з’явилися або оновилися;
- як часто перевіряти сторінки на оновлення.
Як виглядає sitemap.xml?
Приклад файлу — https://inweb.ua/sitemap.xml. Один файл sitemap.xml може містити не більше 50 000 посилань. Якщо їх понад 50 000, необхідно створити кілька таких файлів. Розширені можливості пошуку — можливість вказати частоту оновлення сторінок і пріоритет індексації. Коректне кодування файлу sitemap.xml повинна бути UTF-8, а розмір не більше 10 Мб.
Приклад мапи сайту в форматі .xml:
https://site.com.ua/</loc> 2020-12-18T18:54:13+04:00 always 1.0 https://site.com.ua/category/</loc> 2020-12-18T18:57:09+04:00 hourly 0.8 https://site.com.ua/page/</loc> 2020-12-18T18:59:37+04:00 daily 0.6
Структура sitemap.xml
Оголошення XML
У цьому рядку ми повідомляємо пошуковій системі, що вона має справу з XML-файлом. Тут же вказується версія XML і кодування, яка використовується (обов’язково використовувати UTF-8).
URL set
urlset — місце зберігання всіх URL-адрес мапи сайту. У цьому рядку краулер повідомляє стандарт протоколу, який використовується. Більшість мап вказують стандарт Sitemap 0.9.
URL
https://site.com.ua/</loc> 2020-12-21T16:12:20+03:00
url — батьківський тег для кожної URL-адреси. Необхідно вказати URL-адресу у вкладеному тезі loc.
У тезі url можна вказати додаткові теги:
- lastmod — вказує дату внесення останніх змін. Формат дати повинен бути W3C Datetime . Наприклад, якщо сторінка оновлена 17 жовтня 2020 року, в атрибуті необхідно вказати значення 2020-10-17. Додатково також можна вказати час.
- priority — вказує пріоритет URL-адреси щодо всіх інших. Діапазон значень від 0.0 до 1.0. Чим більше значення, тим вище пріоритет.
- changefreq — вказує частоту змін сторінки. Мета даного властивості — повідомити пошуковій системі про те, як часто їм може знадобитися повторно сканувати URL-адреси. Допускаються значення: never (ніколи), always (завжди), hourly (щогодини), daily (щодня), weekly (щотижня), monthly (щомісяця) і yearly (щорічно).
Додаткові теги не особливо важливі для SEO. Гері Ілш з Google стверджує , що значення тега lastmod ігнорують, так як в більшості випадків« вебмайстри абсолютно не намагаються стежити за його точністю ».
Тег priority в Google, за їхніми словами, ігнорується, тому що це просто «зайвий шум».
Щодо тега changefreq Джон Мюллер говорить: «Пріоритет і зміна частоти насправді більше не грають такої великої ролі, коли мова йде про мапу сайту».
Обов’язкові теги
Атрибут | Oпис |
urlset | Інкапсулює цей файл і вказує стандарт поточного протоколу. |
url | Батьківський тег для кожного запису URL-адреси. Решта теги є дочірніми для цього тега. |
loc | URL-адресу сторінки. Цей URL-адреса має починатися з префікса (наприклад, HTTP) і закінчуватися косою рисою, якщо Ваш веб-сервер вимагає цього. Довжина цього значення не повинна перевищувати 2048 символів. |
Необов’язкові теги
Атрибут | Oпис |
lastmod | Дата внесення останніх змін. Формат дати: W3C Datetime (РРРР-ММ-ДД). Формат не зобов’язує використовувати сегмент часу. Даний тег не має відношення до заголовку If-Modified-Since (304). |
changefreq | Частота змін сторінки. Значення є підказкою і може не відповідати точної частоті зміни сторінки. Допустимі значення:
Значення «always» необхідно використовувати для опису документів, які змінюються при кожному доступі до цих документів. Значення «never» необхідно використовувати для опису архівних URL-адрес. Слід розуміти, що якщо встановити частоту оновлень, наприклад, раз на годину hourly — робот не стане індексувати сторінку так часто. |
priority | Значення задає пріоритетність URL щодо інших URL на сайті. Допустимий діапазон значень – від 0,0 до 1,0. Значення є підказкою і не впливає на процедуру порівняння важливості сторінок (вказує пошуковій системі, які сторінки, на вашу думку, більш важливі для сканерів).
Значення за замовчуванням — 0,5. Додавання високого пріоритету до всіх URL не має сенсу, так як пріоритетність — величина відносна, цей параметр використовується, щоб визначити черговість обробки URL в межах сайту. |
Навіщо вам потрібна мапа сайту?
Пошукова система виявляє новий контент, скануючи веб-сторінки. Коли пошуковик сканує сторінку, то враховують і внутрішні, і зовнішні посилання на неї. Якщо виявлена URL-адреса не міститься в індексі, пошуковик, якщо йому потрібно, може спарсити і проіндексувати контент. Але таким чином Google не зможе знайти весь контент: якщо на сторінку не посилається жодна,з вже відомих йому, сторінок, він її навряд чи виявить. Ось тут і вступає в гру мапа сайту. Мапа сайту повідомляє Google (і іншим пошуковикам), де знайти найбільш важливі сторінки для сканування та індексування.
Чи потрібен мені файл Sitemap?
Якщо на сайті коректно вказані посилання на необхідні сторінки, роботи пошукових систем зможуть виявити більшу частину з них. За допомогою файлу Sitemap можна оптимізувати сканування великих або складних сайтів, а також спеціалізованих файлів.
Порядок сканування та індексування визначається складними алгоритмами, і навіть якщо ви створили файл Sitemap, це не гарантує, що всі ваші сторінки будуть просканувати і індексовані. Найчастіше використання файлу Sitemap допомагає оптимізувати цей процес і запобігти помилок.
В яких випадках вам може знадобитися файл Sitemap
Файл Sitemap потрібен у випадках, якщо:
- Великий сайт. Багатосторінковість може призвести до того, що бот пошукової системи пропустить нові (змінені) сторінки.
- У сайту відсутня пов’язана структура сторінок. Наприклад, є великий архів сторінок, які не пов’язані між собою.
- Сайт молодий — містить невелику кількість зовнішніх посилань.
- На сайті присутній великий обсяг мультимедійного (відео та картинки) або контенту новин. З файлів мап сайту xml пошукова система може отримувати додаткову інформацію для показу результатів пошуку.
В яких випадках вам не потрібний файл Sitemap
Файл Sitemap не потрібен, якщо:
- Сайт малий.
- Сайт максимально структурований, тобто реалізовано детальну систему внутрішніх посилань. Роботи пошукових систем можуть перейти на всі значущі сторінки за посиланнями з головної.
- На сайті є багато медіафайлів (наприклад, відео та зображень) або сторінок новин.
Які бувають карти сайту?
XML-sitemap для зображень
Крім XML-карт для сторінок, можна створювати окремі карти сайту для зображень, які допомагають пошуковим системам знайти контент, який неможливо виявити іншими способами (наприклад, контент, який завантажується за допомогою JavaScript).
У картах зображень використовуються теги:
image:image | Вся інформація про одне зображення. Тег <loc> може включати до 1000 тегів image:image. |
image:loc | URL зображення. |
У картах зображень можна використовувати необов’язкові теги:
image:caption | Підпис до зображення. |
image:geo_location | Місце зйомки. |
image:title | Назва зображення. |
image:license | URL ліцензії зображення. |
Приклад XML sitemap для зображень:
https://site.com.ua/page.html https://site.com.ua/pic1.jpg https://site.com.ua/pic2.jpg
XML sitemap для відео
Як і у випадку із зображеннями, якщо на сайті є унікальні відеозаписи, — для них можна створити окрему XML-карту.
За допомогою карти сайту для відео можна повідомити пошукову систему:
- назва;
- опис,
- тривалість;
- мініатюру та ін.
Обов’язкові теги:
- <loc> — сторінка з відеозаписом;
- <video:title> — назва відео завдовжки не більше 100 символів;
- <video:player_loc> – де знаходиться плеєр для відео;
- <video:content_loc> — де знаходиться конкретне відео;
- <video:thumbnail_loc> — мініатюра відео розміром більше 120х90px;
- <video:video> — контейнер із описом відео;
- <video:description> — опис відео до 2000 символів.
До карти сайту для відео можна додати необов’язкові теги:
- <video:duration> — тривалість відео в секундах, максимум 8 годин;
- <video:category> — до якої категорії відноситься відео;
- <video:uploader> – хто додав відео. Дозволяється вказати одне ім’я для одного файлу;
- <video:requires_subscription> — чи потрібна для перегляду відео передплата (і платна та безкоштовна). Доступні значення: yes, no;
- <video:publication_date> — дата публікації у форматі YYYY-MM-DD або YYYY-MM-DDThh:mm:ss+TZD;
- <video:family_friendly> — чи є відео для безпечного пошуку чи ні;
- <video:restriction> — список країн, де відтворюється або не відтворюється відео. Вказується як коди країн у форматі ISO 3166. Для кожного відео допускається лише один тег <video: restriction. За відсутності тега <video: restriction>, передбачається можливість відтворювати на всіх територіях;
- <video:gallery_loc> — посилання на галерею;
- <video:expiration_date> — дата та час, коли відео стає неактуальним;
- <video:price> — вартість (вказується валюта у форматі ISO 4217);
- <video:rating> – рейтинг відео. Доступні значення: від 0 до 5;
- <video:tag> – теги відео;
- <video:platform> — список платформ, на яких можна відтворити відео. Доступні значення: mobile, web, tv. За відсутності тега передбачається, що відео можна відтворювати на всіх платформах;
- <video:view_count> — кількість переглядів;
- <video:live> — вказує на те, чи відео є прямою трансляцією (live). Доступні значення: yes, no.
Приклад:
https://site.com.ua/videos/video_1.html/</loc> https://site.com.ua/thumbs/video_1.jpg Огляд смартфона Apple iPhone 12 mini Детальний огляд зовнішнього вигляду та функцій смартфона Apple iPhone 12 mini від інтернет-магазину site.com.ua. https://site.com.ua/videoplayer.swf?video=123 600 4.3 1223 2020-12-22T19:20:30+03:00 yes no
Google «підтримує» такі формати:
- .mpg, .mpeg, .mp4, .m4v;
- .wmv?
- .asf, .avi;
- .ra, .ram, .rm;
- .mov;
- .flv.
XML-карта для Google Новин
Для сайтів-новинників доцільно створити окрему sitemap новинних публікацій з динамічною генерацією та щоденним оновленням. Ці файли будуть працювати тільки для ресурсів, доданих до Google Новини.
Файл sitemap новин має містити лише URL-статей, опублікованих за останні два дні. Статті, опубліковані більше двох днів тому, можна видалити з файлу, при цьому вони залишаться в індексі Google Новин протягом 30 днів. Карта сайту новин може містити не більше 1000 URL-адрес. Якщо на сайті за два дні з’являється більше новин, можна створити файл індексу sitemap для кількох мап.
Обов’язкові теги:
- <news:publication> — загальний тег, вказуємо видання. Цей тег має два обов’язкові дочірні теги:
- <news:name> — Назва видання;
- <news:language> — мова у форматі ISO 639;
- <publication_date> — дата публікації у форматі W3C (вказуємо повну дату. Пошуковий робот Google розуміє дати аж до часток секунд, наприклад: РРРР-ММ-ДДTчч:мм:cc.с±чч:мм (2017-05-10T19:20 :30.45+01:00);
- <news:title> — назва статті, аналогічна назві на сайті.
Крім цього, існують необов’язкові теги:
- <news:genres> — властивості статті. Допустимі значення:
- PressRelease — прес-реліз;
- Satire — стаття, яка виставляє предмет обговорення у комічній формі.
- Blog — стаття опублікована у форматі блогу.
- OpEd — стаття, яка виражає особисту думку та розміщена в колонці редактора.
- Opinion — стаття, яка висловлює особисту думку та не розміщена в колонці редактора. Цей тег включає рецензії колумністів та інтерв’ю.
- UserGenerated — будь-який матеріал, створений користувачем, що пройшов редакторську правку.
- <keywords> — ключові слова;
- <stock_tickers> – список біржових/фінансових символів (не більше п’яти, через кому). Перед кожним символом необхідно вказувати назву відповідної біржі, яка співпадає із записом у Google Фінансах, наприклад NASDAQ:AMAT або BOM:500325. Використовується для статей про бізнес.
Приклад sitemap для Google Новин:
https://site.com.ua/news/wow55.html Новини ru Blog 2020-12-27 Вартість біткоіна вперше перевищила $25 тыс. біткоін, крипта, гроші, курс
Як створити карту сайту?
Деякі CMS за замовчуванням генерують мапу сайту. Вона буде оновлюватися автоматично, якщо ви додаватимете або прибиратимете сторінки. Якщо CMS цього не робить, швидше за все, є можливість встановити для неї відповідний плагін.
Створення картки сайту в WordPress
Один із способів згенерувати мапу сайту для WordPress це скористатися плагіном Yoast SEO. Щоб встановити Yoast SEO, перейдіть в консоль WordPress.
Виберіть Плагіни > Додати новий.
Знайдіть “Yoast SEO”. Натисніть кнопку “Встановити”, а потім – “Активувати”.
Перейдіть до розділу SEO > Загальні > Можливості та переконайтеся, що XML-карта сайту включена.
Створення мапи сайту без CMS
Згенерувати XML-карту сайту можна за допомогою програм краулерів, наприклад Screaming Frog або Netpeak Spider.
Створення карки сайту за допомогою Screaming Frog
Відкрийте розділ Mode > Spider
Вставте URL-адресу головної сторінки в поле з підписом “Enter URL to spider”.
Натисніть кнопку “Start”.
Після завершення сканування перейдіть до розділу Sitemaps > XML sitemap.
Оскільки теги <lastmod>, <changefreq> та <priority> є несуттєвими, їх можна не включати до файлу sitemap.xml.
Натисніть «Export» та збережіть файл sitemap.xml на комп’ютері. Готово.
Створення мапи сайту за допомогою Netpeak Spider
- Вставте URL-адресу головної сторінки у поле з підписом «Початковий URL».
- Натисніть кнопку “Старт”.
- Після завершення сканування перейдіть до розділу Інструменти > Генератор Sitemap.
- Як і у випадку з Screaming Frog, теги lastmod, changefreq і priority можна не включати до файлу sitemap.xml.
- Натисніть кнопку «Згенерувати…» та збережіть файл sitemap.xml на комп’ютері. Готово.
Як перевірити коректність мапи сайту
Для перевірки коректності XML-карти сайту можна скористатися інструментом Netpeak Spider. Детальний мануал з перевірки за допомогою валідатора XML описаний у статті .
Основні помилки при складанні мапи сайту
При складанні карти сайту найпоширенішими помилками є:
- редиректи;
- биті посилання;
- некоректні дати публікації або оновлення контенту.
Помилки не є критичними для пошукових систем, але їх усунення дозволить направити ресурси пошукового робота, що вивільнилися, на переобхід важливих сторінок.
Як правильно вказати посилання на sitemap.xml у robots.txt
По-перше, XML-карту сайту необхідно створити та завантажити на сервер, потім необхідно додати вказівку про наявність файлу. Для цього пропишіть у robots.txt наступний рядок:
Sitemap: {url-файла-sitemap},
де {url-файла-sitemap} — це повна URL-адреса вашої карти сайту.
User-Agent: * Карта сайту: httрs://mysite.com/sitemap.xml
Як побудувати XML-карту для мультимовних сайтів
За допомогою файлу sitemap.xml можна передати Google атрибут rel=”alternate” hreflang=”x”.
Простір імен XHTML повинен бути вказаний так:
xmlns:xhtml=”http://www.w3.org/1999/xhtml”
Для кожної адреси необхідно створити окремий елемент URL, який повинен містити:
- Тег loc, який вказує на URL-адресу;
- Поділемент xhtml:link rel=”alternate” hreflang=”XX” для кожної альтернативної версії сторінки, обов’язково включаючи поточну версію.
Наприклад, на сайті існують 3 мовні версії:
- українська (mysite.com/ua/);
- російська (mysite.com/ru/);
- англійська (mysite.com/en/).
Нижче наведено приклад карти сайту, яка повідомляє, що сторінка mysite.com/ru/ має відповідну версію англійською та українською мовами:
https://mysite.com/ru/ https://mysite.com/ua/ https://mysite.com/en/
Як повідомити пошуковій системі про мапу сайту
Насамперед необхідно визначити, де знаходиться карта сайту. Найчастіше при використанні плагіна, згенерована мапа сайту буде за URL-адресою domain.com/sitemap.xml. Якщо ви генеруєте картку сайту вручну, назвіть її sitemap.xml і завантажте її в кореневий каталог вашого веб-сайту. Після цього картка сайту буде доступна за адресою domain.com/sitemap.xml.
Як надіслати мапу сайту в Google
Щоб надіслати карту сайту через Google Search Console, необхідно:
- Вибрати сайт в Google Search Console.
- Вибрати «Файли Sitemap».
- Додати URL-адресу файлу Sitemap та натиснути на кнопку «Надіслати».
Готово.
Як часто має оновлюватися мапа сайту?
Стандартизованого нормативу щодо кількості оновлень немає. Все залежить від частоти створення нових сторінок на сайті, змін адрес або контенту, а також зв’язків вже існуючих сторінок.
Не варто забувати, що дані, зазначені в Sitemap, пошуковий робот сприймає як рекомендації: якщо встановити частоту оновлень, наприклад, раз на годину — робот не індексуватиме сторінку так часто.
Рекомендації Google
Обов’язково:
- мапа містить не більше 50 000 URL;
- загальний розмір до 50 Мб (у стислому вигляді).
Формати, які підтримує Google як sitemap:
- XML — це стандартний файл;
- RSS, media RSS та Atom 1.0 — підходить для блогів з фідом RSS або Atom;
- текстовий файл .txt.
Основні вимоги до текстових файлів:
- використовується кодування UTF-8;
- файл не містить нічого, крім списку URL;
- текстовому файлу можна дати будь-яке ім’я, але з розширенням .txt (наприклад, sitemap.txt).
Які можливості дає мапа сайту?
Пошуковики здатні просканувати всі адреси сайту самостійно, але створення карти сайту допоможе їм дізнатися, як це краще зробити.
Мапа сайту дозволяє:
- Знайти нові сторінки на ресурсі та проіндексувати їх.
- Розставити пріоритетність сторінок.
- Відстежити зміни на сторінках, що індексуються.
- Контролювати індексацію сторінок (наприклад, за допомогою звіту про індексування у розділі Файли Sitemap у Google Search Console).
- Запам’ятати частоту оновлення сторінок, що індексуються.
Чи впливає Sitemap на просування?
Мапа сайту – зручний інструмент для спрощення передачі структури сайту пошуковій системі. При цьому варто не забувати, що мапа сайту ніяк не взаємопов’язана з ранжуванням. Без неї можна обійтись. Пошуковик і так рано чи пізно дістанеться більшості веб-сторінок, але з картою сайту переобхід або індексація нових сторінок будуть більш ефективними.