Jesteś kretynem, jeśli nie poświęciłeś wtedy odpowiedniej uwagi mapie witryny. Wystarczy raz zrozumieć zagadnienie i uniknąć dużej liczby błędów w przyszłości, co też zrobimy teraz.
Twój pokorny sługa też był kretynem w młodości, kiedy zaczął promować strony internetowe w jednym biurze. W tamtym czasie natknąłem się na jedną stronę internetową z promocją, która, trzeba powiedzieć, była po prostu bzdurą. A to gówno miało problemy z indeksowaniem. Naturalnie, gdyby strona była odpowiedniej jakości, obie wyszukiwarki zaindeksowałyby ją bez względu na problemy, ale właściciele zdali się na zwykłego projektanta, projektanta układu i programistę, a w tym przypadku specjalista SEO może jedynie, że tak powiem, otwórz butelkę nożyczkami. Próbowałem na nim wszystkiego - i ostatnio modyfikowane ustawienie oraz przyspieszenie indeksowania za pomocą modnego wówczas fastbota i zakup linków. I dopiero wtedy okazało się, że problem polegał na tym, że mapa witryny nie aktualizowała się automatycznie! Kiedy go zaktualizowałem, wszystkie strony wleciały do indeksu.
Co to jest mapa witryny? Jest to plik zawierający informacje o stronach serwisu, które wymagają zaindeksowania. Zwykle tworzona jest mapa witryny dla Yandex i Google, aby powiadamiać roboty wyszukiwania o stronach, które muszą zostać uwzględnione w indeksie. Korzystając z mapy witryny, możesz także sprawdzić, jak często pojawiają się aktualizacje i które dokumenty internetowe są najważniejsze do zaindeksowania. Ogólnie rzecz biorąc, bardzo dobrze mówili o tym u webmastera Yandex:
Jeśli nie masz mapy witryny, nie oznacza to, że wyszukiwarki nie będą indeksować zasobu. Roboty wyszukujące często bez tego skanują witryny całkiem dobrze i uwzględniają je w wyszukiwaniu. Czasami jednak mogą wystąpić usterki, przez które czasami nie można znaleźć wszystkich dokumentów internetowych. Główne powody to:
Dlatego utworzenie pliku sitemap.xml pomaga rozwiązać ten problem na wiele sposobów. Plik ten wpływa na SEO jedynie w zakresie, w jakim ułatwia/przyspiesza indeksowanie stron. Zwiększa także szansę, że strony internetowe zostaną zaindeksowane, zanim konkurencja będzie mogła skopiować treść i opublikować ją na swojej stronie.
Dlaczego potrzebujesz mapy witryny, zrozumieliśmy to. Przyjrzyjmy się teraz, w jakich formatach można to zrobić:
Oto więcej informacji o tym pliku:
Przyjrzyjmy się, jak utworzyć odpowiednią mapę XML. Muszą zostać spełnione następujące wymagania:
Podam prosty przykład mapy:
< url > < loc >http://site.ru/ < lastmod >2016 - 11 - 20T19: 45: 08 + 03: 00< / lastmod > < changefreq >zawsze< / changefreq > < priority > 0 , 9 < / priority > < / url > < url > < loc >http : //site.ru/category/ < lastmod >2016 - 11 - 20T19: 46: 38 + 03: 00< / lastmod > < changefreq >miesięczny< / changefreq > < priority > 0 , 6 < / priority > < / url > < url > < loc >http : //site.ru/page/ < lastmod >2016 - 11 - 20T19: 48: 41 + 03: 00< / lastmod > < changefreq >rocznie< / changefreq > < priority > 0.4 < / priority > < / url > |
Wymagane są tagi url i loc. Pierwsza zawiera wszystkie informacje o konkretnym adresie URL. Drugi zawiera sam adres.
Tagi priorytetowe lastmod,changefreq i nie są obowiązkowe, ale nadal zaleca się ich używanie.
Za datę odpowiada Lastmod w mapie witryny ostatnia aktualizacja.
Changefreq wskazuje częstotliwość zmian stron. Wartości mogą być następujące:
Priorytet informuje wyszukiwarki, jak ważna jest dana strona w porównaniu z innymi. Priorytet można ustawić w zakresie od 0,1 (niski) do 1 (wysoki).
To była tylko przykładowa mapa, nie musisz podawać tych dokładnych wartości. Ogólnie zaleca się ustawienie priorytetu w następujący sposób: maksymalny dla strona główna(1), dla nagłówków średnia (0,6), a dla wpisów minimalna (0,4).
Spójrzmy teraz na przykład, w którym jest ponad 50 tysięcy linków. W tym przypadku plik zawiera inne mapy:
< sitemap > < loc >http: //site.ru/sitemaps/sitemap01.xml < lastmod >2016 - 11 - 20T21: 37: 28 + 03: 00< / lastmod > < / sitemap > < sitemap > < loc >http: //site.ru/sitemaps/sitemap02.xml < lastmod >2016 - 11 - 20T21: 37: 29 + 03: 00< / lastmod > < / sitemap > |
Mapę XML można utworzyć na kilka sposobów, przyjrzyjmy się im:
Oto opcja tworzenia mapy witryny bez pomocy wtyczek:
Możesz utworzyć mapę witryny w WordPress za pomocą specjalnej wtyczki o nazwie Google XML Sitemaps. Tutaj wszystko jest proste: pobierz wtyczkę, zainstaluj ją, a następnie rozpocznij tworzenie pliku. Aby to zrobić, otwórz Ustawienia konsoli i wybierz mapę witryny XML. Następnie ustalamy ustawienia. Priorytet pozostawiamy domyślny.
Witam, drodzy czytelnicy bloga. Postanowiłem podsumować w jednym artykule wszystko, co już napisałem na temat mapy witryny (Sitemap xml), która jest przede wszystkim potrzebna do wskazania wyszukiwarkom tych stron, które powinny zaindeksować w pierwszej kolejności. Jest to bardzo ważny i w rzeczywistości obowiązkowy atrybut każdego projektu internetowego, ale wielu albo o tym nie wie, albo nie przywiązuje dużej wagi do mapy witryny.
Od razu kropkujmy całe „i” i spróbujmy rozdzielić dwa pojęcia – mapy witryny w formacie xml i w formacie HTML (istnieje też geograficzna interpretacja tego słowa, o której pisałem w artykule „”). Druga opcja to zwykła lista wszystkie materiały zasobu internetowego, które będą dostępne dla każdego po kliknięciu odpowiedniej pozycji menu. Ta opcja jest również przydatna i pomaga przyspieszyć i usprawnić indeksowanie zasobów przez wyszukiwarki.
Ale głównym narzędziem zaprojektowanym do bezpośredniego wskazywania wyszukiwarkom stron zasobów, które będą wymagały zaindeksowania, jest plik o nazwie Sitemap.xml (jest to jego najczęstsza nazwa, ale teoretycznie można go nazwać dowolną, nie ma to znaczenia) , które nie będą widoczne dla osób odwiedzających Twój projekt internetowy.
Jest on kompilowany przy użyciu specjalnej składni zrozumiałej dla wyszukiwarek, gdzie zostaną wymienione wszystkie strony do zaindeksowania, ze wskazaniem ich ważności, daty ostatniej aktualizacji i przybliżonej częstotliwości aktualizacji.
Istnieją dwa główne pliki, które powinien zawierać każdy projekt internetowy - robots.txt i sitemap.xml. Jeśli w Twoim projekcie ich nie ma lub nie są one poprawnie wypełnione, z dużym prawdopodobieństwem poważnie szkodzisz swoim zasobom i nie pozwalasz im ujawnić się w pełni.
Ty oczywiście możesz mnie nie słuchać (bo nie jestem autorytetem, ze względu na stosunkowo niewielki zgromadzony materiał merytoryczny), ale myślę, że nie będziesz bezkrytycznie polemizować ze specjalistami, którzy mają pod ręką statystyki z dziesiątek tysięcy projektów .
Na tę okazję miałem na stanie „fortepian w krzakach”. Tuż przed napisaniem tego artykułu natknąłem się na publikację specjalistów ze znanego automatycznego systemu promocji pod nietypową nazwą „Hands” (jest to odpowiednik MegaIndexu, o którym pisałem).
Oczywiste jest, że każdy podobny do nich system jest zainteresowany zapewnieniem pomyślnego postępu projektów swoich klientów, ale może on jedynie pompować zasoby klientów masą łączy, wpływać na treść i poprawność konfiguracja techniczna Witryny niestety nie mogą.
W związku z tym przeprowadzono bardzo ciekawe i odkrywcze badanie, które miało na celu identyfikację 10 najpopularniejszych powodów utrudniających promocję projektów i skierowanie tych danych bezpośrednio do klientów...
Na pierwszym miejscu oczywiście była „nie unikalna treść” (albo ją skopiowałeś, albo ją masz, co nie zmienia istoty). Ale na drugim miejscu znalazła się właśnie mapa witryny w formacie xml, a raczej jej brak lub niezgodność z uznanym formatem kreacji. Otóż na trzecim miejscu znalazł się wspomniany wcześniej plik robots.txt (jego brak lub nieprawidłowe utworzenie):
Kiedy bezpodstawnie twierdzisz, że Twój projekt musi mieć mapę (w przeciwnym razie jest to marnotrawstwo), nie brzmi to tak przekonująco, jakby to stwierdzenie było poparte realnymi faktami z dość reprezentatywnego badania.
OK, załóżmy, że Cię przekonałem i zobaczmy, jak możesz samodzielnie stworzyć mapę witryny (składnia formatu), jak zrobić ją dla Joomla i WordPress, a także zobaczmy, jak możesz ją stworzyć za pomocą specjalnych generatorów online.
Jednak samo utworzenie mapy witryny nie wystarczy, aby mieć pewność, że Twój projekt zostanie poprawnie zaindeksowany przez wyszukiwarki. Konieczne będzie również zadbanie o to, aby wyszukiwarki (w naszym przypadku Google i Yandex) dowiedziały się o tej właśnie mapie witryny. Można to zrobić na dwa sposoby, ale porozmawiamy o tym nieco później (musi istnieć przynajmniej jakaś intryga, która przykuwa uwagę czytelników).
Spróbujmy najpierw uzasadnić logiczną konieczność wykorzystania zarówno pliku robots.txt, który zabrania indeksowania niektórych elementów Twojego projektu internetowego, jak i pliku mapy witryny, który wymaga zaindeksowania niektórych stron. Aby to zrobić, cofnijmy się pięć, dziesięć lat temu, kiedy większość zasobów w Internecie była po prostu zbiorem plików HTML, które zawierały teksty wszystkich artykułów.
Robot wyszukiwania Google lub Yandex po prostu poszedł do takiego projektu HTML i zaczął indeksować wszystko, co wpadło mu w ręce, ponieważ prawie wszystko zawierało treść projektu. Ale co dzieje się teraz, w warunkach powszechnego stosowania CMS (systemów zarządzania treścią)? Tak naprawdę, nawet zaraz po zainstalowaniu silnika, robot wyszukiwania znajdzie na Tobie już kilka tysięcy plików i to pomimo tego, że być może nie masz jeszcze żadnej treści (no cóż, nie napisałeś jeszcze ani jednego artykułu).
I ogólnie rzecz biorąc, treści we współczesnych CMS-ach z reguły są przechowywane nie w plikach, ale w bazie danych, której robot wyszukiwania oczywiście nie może bezpośrednio indeksować (do pracy z bazami danych polecam to za darmo).
Oczywiste jest, że po przeszukaniu tu i ówdzie roboty wyszukiwania Yandex i Google nadal znajdą Twoje treści i zaindeksują je, ale jak szybko to się stanie i Jak kompletne będzie indeksowanie? Twój projekt to bardzo duże pytanie.
Właśnie w celu uproszczenia i przyspieszenia indeksowania projektów przez wyszukiwarki w kontekście powszechnego wykorzystania CMS-u należy stworzyć pliki robots.txt i sitemap.xml. Za pomocą pierwszego pliku możesz powiedzieć robotom wyszukiwarek, które pliki nie powinny tracić czasu na indeksowanie (na przykład obiekty silnika), a także możesz go użyć do zablokowania indeksowania niektórych stron, aby wyeliminować efekt powielania treści, który jest nieodłączny w wielu CMS-y (więcej szczegółów przeczytasz w artykule o).
Za pomocą pliku mapy witryny jasno i wyraźnie mówisz robotom Yandex i Google, jakie dokładnie treści zawiera Twój projekt, aby nie grzebały na próżno w rogach zarządzania plikami używanego silnika. Nie zapominaj, że boty mają pewne ograniczenia dotyczące czasu i liczby przeglądanych dokumentów. Będzie wędrować po plikach silnika i wychodzić, ale zawartość pozostanie niezindeksowana od dawna. Och, jak.
Pamiętacie, jak w słynnej komedii jedna barwna postać powiedziała: „Nie idź tam, idź tutaj, bo inaczej…”. To właśnie funkcję tego znaku pełni plik robots.txt oraz witryna mapowa z rozszerzeniem XML, które regulują poruszanie się robotów wyszukujących po zakamarkach Twojego projektu internetowego. Oczywiste jest, że boty mogą się uruchomić, ale najprawdopodobniej posłusznie zastosują się do dobrze napisanych instrukcji zakazujących i nakazowych (w mapie witryny).
To jasne? Następnie przejdźmy bezpośrednio do rozwiązania pytania, jak utworzyć plik sitemap.xml na różne sposoby i jak poinformować o jego istnieniu dwa filary wyszukiwania w RuNet - Google i Yandex, aby nie grzebały w Twoim projekcie na próżno, jednocześnie tworząc dodatkowe obciążenie na Twoim serwerze hostingowym, ale jest to jednak bardzo sprawa drugorzędna, najważniejsze, że to właśnie indeksowanie (szybkie i kompleksowe).
W przeciwieństwie do pliku robots.txt, który najprawdopodobniej będziesz musiał napisać sam, plik mapy witryny w formacie xml z reguły próbują utworzyć w jakiś automatyczny sposób. Jest to zrozumiałe, bo kiedy duże ilości strony w często aktualizowanym projekcie, ręczne tworzenie go może uszkodzić umysł webmastera.
Tak, to wcale nie jest konieczne, ponieważ... Prawie dla każdego CMS-a dostępne jest rozszerzenie, które pozwoli Ci stworzyć, a gdy pojawią się nowe materiały, odtworzyć plik mapy witryny. No cóż, zawsze możesz użyć jakiegoś generatora map witryn online jako gotowego rozwiązania.
Mimo to wydaje mi się, że przydatne byłoby zapoznanie się z prostą (co mogę powiedzieć - najprostszą) składnią tworzenia mapy witryny. Ponadto w przypadku małych i rzadko aktualizowanych projektów można to szkicować ręcznie.
Zwykle dyrektywa „Mapa witryny” jest napisana na samym końcu. Następnym razem, gdy roboty wyszukujące odwiedzą Twój projekt internetowy, z pewnością przejrzą zawartość pliku robots.txt i pobiorą Twoją mapę do przestudiowania. Jednak w ten sposób wszelkiego rodzaju rzodkiewki mogą dowiedzieć się o jej istnieniu, a mapa witryny pomoże ukraść Twoją zawartość.
Istnieje jednak inny sposób bezpośredniego przesyłania informacji o lokalizacji mapy witryny do wyszukiwarek bez pośrednictwa pliku robots.txt. Odbywa się to poprzez interfejs i panele Yandex Webmaster Narzędzia Google chociaż można go używać. Czy znasz już te narzędzia? wyszukiwarki?
Jeśli nie, pamiętaj o dodaniu swojego projektu zarówno do , jak i do , a następnie w odpowiednich zakładkach wskaż ścieżkę do mapy witryny w formacie XML.
Tak wygląda formularz dodania mapy witryny dla webmastera Yandex:
A tak wygląda podobny formularz wpisania ścieżki w pasku narzędzi Google:
Jeśli nie chcesz szukać rozszerzeń dla swojego CMS-a, które pozwalają na automatyczne tworzenie strony z mapą, możesz w tym przypadku skorzystać z generatorów online. Jest tu jednak jedna wada w porównaniu do automatyczne tworzenie karty w samym CMS-ie - po dodaniu nowych materiałów będziesz musiał się do nich udać usługa internetowa i utwórz ponownie ten plik, a następnie prześlij go na swój serwer.
Prawdopodobnie jednym z najbardziej znanych generatorów map witryn online jest Generator map witryn. Ma całkiem sporo funkcjonalności i pozwala wygenerować mapę witryny na 1500 stron za darmo, czyli całkiem sporo.
Generator map witryn uwzględni zawartość pliku robots.txt, dzięki czemu strony, których indeksowanie nie jest możliwe, nie zostaną uwzględnione na mapie. To samo w sobie nie jest straszne, ponieważ zakaz robotów i tak będzie miał wyższy priorytet, ale uratuje cię przed niepotrzebne informacje V utworzony plik Mapa serwisu. Aby zrobić mapę wystarczy podać adres URL strony głównej oraz podać swój E-mail, po czym zostaniesz umieszczony w kolejce do wygenerowania:
Kiedy nadejdzie Twoja kolej, otrzymasz powiadomienie e-mailem o tej sytuacji, a klikając link z listu, będziesz mógł pobrać plik, który przygotował dla Ciebie Sitemap Generator. Wystarczy, że wgrasz go w odpowiednie miejsce na swoim serwerze. Cóż, będziesz musiał od czasu do czasu powtarzać tę procedurę, aby mapa witryny była aktualna.
Istnieje podobna anglojęzyczna usługa generatora online, którą można znaleźć pod tym linkiem - Mapy witryn XML. Ma limit 500 stron, ale poza tym wszystko jest prawie takie samo, jak opisano powyżej.
Powodzenia! Do zobaczenia wkrótce na stronach bloga
Możesz być zainteresowany
Co się stało Adresy URL, jaka jest różnica między absolutnym a powiązania względne dla witryny
Co to jest Chmod, jakie uprawnienia nadawać plikom i folderom (777, 755, 666) i jak to zrobić poprzez PHP
Wyszukiwanie Yandex według witryny i sklepu internetowego
OpenServer - nowoczesny serwer lokalny i przykład jego użycia Instalacje WordPressa do komputera
Jak zwiększyć ruch na stronie do 300 osób dziennie?
Korzystając z pliku mapy witryny, możesz poinformować Yandex o aktualnej strukturze witryny, określając specjalną dyrektywę w pliku robots.txt lub dodając ją do Yandex.Webmaster.
Webmaster umożliwia:
Wybierz witrynę z listy.
W polu wpisz adres URL, pod którym plik jest dostępny. Na przykład, https://example.com/sitemap.xml.
Kliknij przycisk Dodaj.
Po dodaniu plik trafia do kolejki do przetworzenia. Robot pobierze go w ciągu dwóch tygodni. Każdy dodany plik, także ten dołączony do pliku indeksu mapy witryny, jest przetwarzany przez robota osobno.
Po pobraniu przy każdym pliku zobaczysz jeden ze statusów:
Status | Opis | Notatka |
---|---|---|
"OK" | ||
"Przeadresować" | Usuń przekierowanie i powiadom robota o aktualizacji | |
"Błąd" | Plik nie jest poprawnie utworzony | poinformuj robota o aktualizacji |
„Nieindeksowane” | Sprawdzanie odpowiedzi serwera |
|
Uniemożliwić | poinformuj robota o aktualizacji |
Status | Opis | Notatka |
---|---|---|
"OK" | Plik jest poprawnie utworzony i załadowany do bazy danych robota | Data ostatniego pobrania zostanie wyświetlona obok pliku. Zaindeksowane strony pojawią się w wynikach wyszukiwania w ciągu dwóch tygodni |
"Przeadresować" | Podany adres URL przekierowuje na inny adres | Usuń przekierowanie i powiadom robota o aktualizacji |
"Błąd" | Plik nie jest poprawnie utworzony | Aby uzyskać szczegółowe informacje, kliknij łącze Błąd. Po dokonaniu zmian w pliku powiadom robota o aktualizacji |
„Nieindeksowane” | Podczas uzyskiwania dostępu do mapy witryny serwer zwraca kod HTTP inny niż 200 | Sprawdź, czy plik jest dostępny dla robota za pomocą narzędzia Sprawdź odpowiedź serwera, podając pełna ścieżka do pliku. Jeżeli plik nie jest dostępny skontaktuj się z administratorem serwisu lub serwera na którym się on znajduje. |
Odmowa dostępu do pliku w pliku robots.txt za pomocą dyrektywy Disallow | Zezwól na dostęp do mapy witryny i powiadom robota o aktualizacji |
Jeśli zmieniłeś plik mapy witryny dodany do Yandex.Webmaster, nie musisz go usuwać i przesyłać ponownie - robot regularnie sprawdza plik pod kątem aktualizacji i błędów.
Aby przyspieszyć indeksowanie pliku, kliknij ikonę. Jeśli korzystasz z pliku indeksu mapy witryny, możesz uruchomić przetwarzanie każdego wymienionego w nim pliku. Robot pobierze dane w ciągu trzech dni. Możesz użyć tej funkcji do 10 razy dla jednego hosta.
Po wykorzystaniu wszystkich prób, następna będzie dostępna 30 dni po pierwszej. Dokładna data jest wyświetlana w interfejsie webmastera.
W interfejsie Yandex.Webmaster możesz usunąć pliki, które zostały dodane na stronie Pliki mapy witryny: Jeśli w pliku robots.txt dodano dyrektywę dotyczącą mapy witryny, usuń ją. Po dokonaniu zmian informacja o mapie witryny zniknie z robota i bazy danych Yandex.Webmaster w ciągu kilku tygodni.
Plik sitemap.xml to narzędzie, które pozwala webmasterom informować wyszukiwarki o stronach w ich witrynie, które są dostępne do zaindeksowania. Ponadto na mapie XML możesz określić dodatkowe parametry strony: datę ostatniej aktualizacji, częstotliwość aktualizacji oraz priorytet w stosunku do innych stron. Informacje zawarte w pliku sitemap.xml mogą mieć wpływ na zachowanie robota wyszukiwania i ogólnie na proces indeksowania nowych dokumentów. Mapa witryny zawiera wytyczne dotyczące umieszczania stron w kolejce do indeksowania i stanowi uzupełnienie pliku robots.txt, który zawiera wytyczne dotyczące wykluczania stron.
W tym przewodniku znajdziesz odpowiedzi na wszystkie pytania dotyczące korzystania z sitemap.xml.
Wyszukiwarki korzystają z mapy witryny, aby znaleźć w witrynie nowe dokumenty (mogą to być dokumenty HTML lub treści multimedialne), do których nie można uzyskać dostępu poprzez nawigację, ale które należy przeszukać. Posiadanie łącza do dokumentu w pliku sitemap.xml nie gwarantuje, że zostanie on przeszukany lub zindeksowany, ale najczęściej plik pomoże lepiej zaindeksować duże witryny. Dodatkowo do określenia stron kanonicznych wykorzystywane są dane z mapy XML, chyba że w tagu rel=canonical wyraźnie wskazano.
Plik Sitemap.xml jest ważny w przypadku witryn, w których:
Jeśli tak nie jest w Twoim przypadku, najprawdopodobniej nie potrzebujesz pliku sitemap.xml. Dla witryn, w których każda ważna dla indeksowania strona jest dostępna w ciągu 2 kliknięć, gdzie do wyświetlania treści nie są wykorzystywane technologie JavaScript lub Flash, gdzie w razie potrzeby stosuje się tagi kanoniczne i regionalne, a nowa treść pojawia się nie częściej niż robot odwiedza witrynę, w pliku sitemap.xml nie jest konieczne.
W przypadku małych projektów, jeśli pojawia się jedynie problem z dużym poziomem zagnieżdżenia dokumentów, można go łatwo rozwiązać za pomocą HTML mapy witryny bez uciekania się do za pomocą XML-a karty. Jeśli jednak zdecydujesz, że nadal potrzebujesz pliku sitemap.xml, przeczytaj ten przewodnik w całości.
Wyszukiwarki obsługują prosty format tekstowej mapy witryny, który po prostu wyświetla adresy URL stron bez dodatkowych parametrów. W takim przypadku plik musi być zakodowany w formacie UTF-8 i mieć rozszerzenie .txt.
Wyszukiwarki obsługują również standardowy protokół XML. Google dodatkowo obsługuje mapy witryn dla obrazów, filmów i wiadomości.
Przykładowa mapa witryny zawierająca tylko jeden adres.
Tagi XML
zestaw url
adres URL(wymagane) — tag nadrzędny dla każdego adresu URL.
lok(wymagane) - Adres URL dokumentu, musi być bezwzględny.
ostatnimod- data ostatnia zmiana dokument w formacie DateTime.
częstotliwość zmian- częstotliwość zmian strony (zawsze, co godzinę, codziennie, co tydzień, co miesiąc, co rok, nigdy). Znaczenie tego tagu jest rekomendacją dla wyszukiwarek, a nie poleceniem.
priorytet- Priorytet adresu URL w stosunku do innych adresów (od 0 do 1) dla kolejności skanowania. Jeśli nie określono, wartość domyślna to 0,5.
Niektóre optymalizatory wstawiają łącza do obrazów do pliku sitemap.xml w taki sam sposób, jak łącza do dokumentów HTML. Można to zrobić, ale lepiej, aby Google użył rozszerzenia standardowy protokół i wyślij wraz z adresami URL dodatkowe informacje o obrazach. Tworzenie map obrazów XML przydaje się, jeśli obrazy wymagają skanowania i indeksowania, a jednocześnie nie są one bezpośrednio dostępne dla bota (wykorzystywany jest np. JavaScript).
Przykład mapy witryny zawierającej jedną stronę i powiązane z nią obrazy
Tagi XML
obraz: obraz(wymagane) - informacja o jednym obrazie. Można użyć maksymalnie 1000 obrazów.
obraz:lok(wymagane) - ścieżka do pliku obrazu. W przypadku korzystania z CDN dopuszczalne jest linkowanie do innej domeny, jeśli zostanie to zweryfikowane w panelu webmastera.
obraz: podpis- podpis do obrazu (może zawierać długi tekst).
obraz: tytuł- obraz tytułowy (zwykle krótki tekst).
obraz:geo_lokalizacja- miejsce strzelania.
obraz: licencja- Adres URL licencji obrazu. Służy do zaawansowanego wyszukiwania obrazów.
Podobnie jak mapa obrazu, Google ma również rozszerzenie mapy witryny wideo, w którym możesz określić szczegółowe informacje o treści wideo, co wpływa na wyświetlanie w wyszukiwarce wideo. Mapa witryny wideo jest konieczna, gdy witryna korzysta z filmów hostowanych lokalnie, a indeksowanie tych filmów jest utrudnione ze względu na stosowane technologie. Jeśli osadzasz wideo z YouTube na swojej stronie internetowej, mapa witryny wideo nie jest tutaj potrzebna.
Jeśli w Twojej witrynie znajdują się treści związane z wiadomościami i uczestniczysz w serwisie Google News, warto skorzystać z mapy witryny dla wiadomości, dzięki czemu Google szybko znajdzie Twoje najnowsze materiały i zindeksuje wszystkie artykuły z wiadomościami. W takim przypadku Mapa witryny powinna zawierać wyłącznie adresy stron opublikowanych w ciągu ostatnich 2 dni i zawierać nie więcej niż 1000 adresów URL.
W razie potrzeby możesz użyć kilku map witryn, łącząc je w jedną indeksowaną mapę witryny. Wiele plików sitemap.xml jest używanych w przypadkach, gdy:
W tym drugim przypadku każda duża sekcja serwisu ma swój własny plik sitemap.xml i wszystkie są dodawane do panelu dla webmasterów, gdzie wygodnie jest sprawdzić, która sekcja zawiera najwięcej błędów (zobacz sekcję dotyczącą wyszukiwania błędów w pliku mapa witryny).
Jeśli masz 2 lub więcej map witryn, należy je połączyć w mapę witryny indeksowanej, która wygląda tak samo jak zwykła mapa witryny (z wyjątkiem obecności znaczników sitemapindex i mapy witryny zamiast urlset i url), ma podobne ograniczenia i może zawierać tylko linki do zwykłych map XML (nie map indeksowych).
Przykładowy indeks mapy witryny:
mapa witryny(obowiązkowe) - określa aktualny standard protokołu.
mapa witryny(obowiązkowe) - zawiera informację o osobnej mapie serwisu.
lok(wymagane) - lokalizacja mapy witryny (w formacie xml, txt lub rss dla Google).
ostatnimod- czas zmiany mapy witryny. Umożliwia wyszukiwarkom szybkie odkrywanie nowych adresów URL w dużych witrynach.
Metody tworzenia mapy witryny XML:
Umożliwia pobranie pliku sitemap.xml za pomocą kilku kliknięć. Obsługuje formaty XML, HTML, TXT i GZ. Wygodny w użyciu dla małych witryn (do 500 stron).
Podobny generator, ale ma trochę więcej ustawień i pozwala za darmo stworzyć mapę do 2000 stron.
Posiada wiele ustawień, umożliwia import adresów URL z pliku CSV. Skanuje do 500 adresów URL za darmo.
Nie ma ograniczeń co do liczby stron do zeskanowania. Jednak w przypadku dużych witryn proces generowania może zostać zawieszony na kilkadziesiąt minut.
Bezpłatna wersja komputerowa generatora map witryn dla systemu Windows.
Elastyczne narzędzie do generowania mapy witryny z wieloma ustawieniami. Wygodne, jeśli używasz już krzyczącej żaby do innych zadań SEO. Po zeskanowaniu witryny skorzystaj z pozycji menu Sitemaps -> Create XML Sitemap.
Mniej elastyczne, ale także wygodne rozwiązanie do szybkiego generowania sitemap.xml. Po zeskanowaniu witryny należy skorzystać z opcji menu Narzędzia -> Generuj mapę witryny.
Plik Sitemap.xml, taki sam jak zwykła karta Witryna to zbiór stron sformatowanych w znacznikach XML. Używając ten plik, wyszukiwarki wiedzą, które strony Twojej witryny powinny zostać zaindeksowane w pierwszej kolejności.
Regularny Mapa HTML strona internetowa:
Mapa witryny w formacie XML:
Każda opcja ma swoje zalety i wady. Kluczową zaletą mapy witryny w formacie XML jest to, że eliminuje ona możliwość rozmycia statycznej wagi stron w witrynie.
W tym artykule powiem Ci jak stworzyć poprawny plik Sitemap.xml.
Jeżeli wiesz już wszystko o tworzeniu mapy witryny, przejdź od razu do ostatniego rozdziału, który nosi tytuł „Sztuczki”.
Istnieją 3 obowiązkowe dyrektywy, które należy wypełnić w każdym przypadku, są to tagi:
A także 3 opcjonalne tagi:
Oto przewodnik dotyczący odszyfrowania każdego tagu z oficjalnej strony internetowej http://www.sitemaps.org/ru/protocol.html:
Atrybut |
Status |
Opis |
wymagany |
Hermetyzuje ten plik i określa bieżący standard protokołu. |
|
wymagany |
Tag nadrzędny dla każdego adresu URL. Inne tagi są podporządkowane temu tagowi. |
|
wymagany |
Adres URL samej strony. Zawsze zaczyna się od prefiksu (np. HTTP) i kończy ukośnikiem (jeśli serwer Twojej witryny tego wymaga). Uwaga: długość adresu URL nie może przekraczać 2048 znaków. |
|
|
fakultatywny |
Data ostatniej modyfikacji pliku. Określone ściśle w formacie daty i godziny W3C. Pozwala w razie potrzeby zignorować odcinek czasu i zastosować format RRRR-MM-DD. |
|
fakultatywny |
Pozwala określić jak często mają się zmieniać informacje na stronie. Wartość ta jest przybliżona. Prawidłowe wartości:
Jeśli strona zmienia się przy każdym otwarciu, użyj wartości „zawsze”. Jeśli jest to strona archiwum, wpisz nigdy. Należy pamiętać, że ten atrybut służy jako wskazówka dla robota wyszukiwania, a nie reguła. Dlatego związek pomiędzy nią a rzeczywistą częstotliwością odwiedzin strony przez robota wyszukującego jest nieliniowy. |
|
fakultatywny |
Umożliwia określenie priorytetu niektórych stron witryny nad innymi. Zakres wartości wynosi od 0,0 do 1,0. Domyślnie każda strona ma priorytet 0,5. Wartość atrybutu służy wyłącznie do porównywania priorytetów stron w Twojej witrynie. Oznacza to, że nie wpływa to na porównanie Twojej witryny z witrynami konkurencji w sieci wyszukiwania. Co więcej, ustawianie wszystkich stron na maksymalny priorytet również nie ma sensu. Bo wtedy wartości będą takie same dla robota i atrybut po prostu nie będzie działał. Nie szukaj więc luk, ale wskaż obiektywne priorytety stron. |
Zapisz to przypomnienie. Na pewno Ci się to na początku przyda. Warto zwrócić uwagę na jeszcze jedną zaletę mapy witryny XML – jest ona elastyczna. Elastyczność polega na połączeniu różnych dyrektyw fakultatywnych.
Teraz, gdy masz już jasność co do tego, czym jest mapa witryny XML i znasz podstawowe dyrektywy dotyczące tego pliku, możesz przejść do jej kompilacji.
Istnieją 3 sposoby tworzenia mapy witryny:
Proces przygotowania mapy witryny wygląda następująco:
Spójrzmy na przykład ręcznej kompilacji pliku. Jeśli chcesz dodać 5 stron swojej witryny do mapy witryny:
Tak powinna wyglądać mapa witryny w formacie XML:
|
Jeśli to konieczne, dodaj opcjonalne tagi z notatki, którą podałem powyżej. Dodatkowe tagi są zapisywane w kontenerze
|
Powyższy kod wskazuje wyszukiwarce, że strona to http://site.ru/
ostatnia modyfikacja 1 stycznia 2005 r. Aktualizowane raz w miesiącu. Priorytet tej strony wynosi 0,8 (maksymalny możliwy to 1).
Szczególnie wygodna jest funkcja podświetlania sparowanych tagów.
Jeśli Twoja witryna zawiera wiele przydatnych stron i nie chcesz tracić czasu na ręczne kompilowanie pliku, poniższe usługi Ci pomogą:
Jest wiele takich usług. Używam https://www.xml-sitemaps.com/.
Pokrótce wyjaśnię wszystkie ustawienia:
Istnieje ogromna liczba wtyczek i gotowych rozwiązań do systemów zarządzania stronami internetowymi. Na przykład:
Wtyczka |
|
Po utworzeniu mapy witryny należy sprawdzić ją pod kątem błędów. Aby to sprawdzić, skorzystaj z usługi https://webmaster.yandex.ru/sitemaptest.xml
Po pomyślnej weryfikacji przesyłamy nasz plik do serwisu.
W przeciwieństwie do pliku robots.txt, plik sitemap.xml można umieścić w dowolnym miejscu witryny. Przykładowo w folderze głównym serwisu plik będzie dostępny pod adresem:
Jeśli umieściłeś plik w folderze /files/, będzie on dostępny pod tym adresem:
Po pomyślnym pobraniu pliku pamiętaj o wskazaniu wyszukiwanie robotów jak znaleźć ten plik. Odbywa się to bardzo prosto. W pliku robots.txt() w dyrektywie Sitemap wpisz pełny adres pliku. Na przykład plik robots.txt może wyglądać następująco:
Ważny! W przeciwieństwie do pliku robots.txt może istnieć kilka plików map witryn. W takim przypadku musisz podać pełny adres wszystkich plików map witryn w robotach i webmasterach.
Pozostaje ostatni etap. Określ ścieżkę do mapy witryny w panelach webmasterskich wyszukiwarek.
Mapa witryny XML ma pewne ograniczenia:
W tym momencie główne etapy są zakończone. Postępuj zgodnie ze wszystkim, co opisano proste zasady i nie będziesz miał żadnych błędów. Druga część artykułu poświęcona jest bardziej szczegółowym ustawieniom, subtelnościom i funkcjom sitemap.xml, których będziesz potrzebować do stworzenia profesjonalnej mapy witryny dla sklepów internetowych.
Jeśli przekroczysz limit 50 000 adresów URL, musisz użyć struktury zagnieżdżonej i utworzyć grupę kilku map witryn. Oznacza to, że twórz mapy witryn w mapie witryny!
W przypadku zwykłej witryny internetowej (a nie dużego portalu czy sklepu internetowego) taka ilość stron jest rzadkością, dlatego większość specjalistów SEO dla wygody korzysta z grupowania map witryn, na przykład do grupowania stron produktów lub sekcji.
Składnia jest następująca:
|
Definicja tagów XML:
Atrybut |
|
Opis |
|
wymagany |
Hermetyzuje informacje o wszystkich mapach witryn w tym pliku. |
|
wymagany |
Hermetyzuje informacje o pojedynczym pliku mapy witryny. |
wymagany |
Określa lokalizację pliku mapy witryny. |
|
|
fakultatywny |
Wskazuje czas modyfikacji odpowiedniego pliku mapy witryny. Robot wykorzystuje te informacje, aby zrozumieć, które pliki map witryn uległy zmianie. Pośrednio tag ten pozwala robotowi szybko odkrywać nowe strony w serwisie. |
Spowoduje to utworzenie zgrupowanej mapy witryny. Wszystkie pozostałe procedury są takie same, jak opisano powyżej. Nie zapomnij wskazać prawidłowego linku do swojego pliku w pliku robots.txt, w dyrektywie Sitemap.
Pod koniec 2014 roku przeprowadziłem małe badanie mające na celu analizę efektywności posiadania pliku sitemap.xml na stronie internetowej.
Wystąpił problem z zaindeksowaniem grupy produktów na stronie sklepu internetowego (około 10 000 produktów). Jednocześnie nic nie stało na przeszkodzie ich indeksowaniu. Skompilowano plik mapy witryny, zawierający wyłącznie łącza do produktów witryny. Mapa witryny została zaktualizowana automatycznie. W ciągu 2 miesięcy ponad 70% adresów URL znalazło się w bazie danych indeksów wyszukiwarki Yandex. Duża część stron ujętych w indeksie to strony z mapy serwisu. Pragnę zaznaczyć, że w tym okresie nie podjęto żadnych innych działań mających na celu przyspieszenie indeksowania strony (np. dodanie linków).
Oto same wyniki:
Wniosek: Mapa witryny nadal wpływa na indeksowanie Twojej witryny. Konieczne jest regularne aktualizowanie i aktualizacja tego pliku.
Aby ten artykuł nie stał się nudny dla doświadczonych specjalistów SEO, sugeruję zapoznanie się z poniższymi „trikami”.
Przyciągnąć dodatkowy ruch z wyszukiwarek (być może nie do końca konwertujących), możesz utworzyć dodatkową mapę witryny dla obrazów.
Składnia mapy witryny z obrazem wygląda następująco:
xmlns:image="http://www.google.com/schemas/sitemap-image/1.1"> |
Przypomnienie o tagach XML:
Koniecznie? |
Opis |
|
|
Zawiera wszystkie informacje o jednym obrazie. Każdy adres URL (tag |
|
|
Adres URL obrazu. W w niektórych przypadkach Domena adresu URL obrazu może różnić się od domeny używanej przez stronę główną. Jeśli obie domeny zostaną zweryfikowane w Search Console, nie będzie problemu. Jeśli jednak zdjęcia zostaną opublikowane przy użyciu systemu zarządzania treścią, np. Usługa Google'a Witryny, musisz zweryfikować swoją witrynę hostingową w Search Console. Ponadto plik robots.txt nie powinien uniemożliwiać indeksowania treści wymagających zaindeksowania. |
|
|
Podpis obrazu. |
|
|
Miejsce filmowania. Na przykład, |
|
|
Tytuł obrazu. |
|
|
Adres URL licencji obrazu. |
Wielu specjalistów SEO generuje pliki map witryn już na początku projektu. Potem zapominają o mapie witryny. Strony zostały zaindeksowane – dobrze. Nie - ale co możesz zrobić?! Zwykle zapominają o dodaniu nowych stron do mapy witryny.
W swoich badaniach stwierdziłem, że jak najbardziej w wygodny sposób rozwiązaniem tego problemu jest osobny plik sitemap.xml, który będzie zawierał tylko te strony serwisu, które nie zostały jeszcze uwzględnione w indeksie.
I to pozwoliło na uwzględnienie w indeksie Yandex ponad 70% nowych adresów URL.