Csak egy majom vagy, ha akkoriban nem figyeltél kellőképpen az oldaltérképre. Elég egyszer megérteni a kérdést, és a jövőben elkerülni a sok hibát, amit most meg fogunk tenni.
Engedelmes szolgád fiatalkorában is akkora kretén volt, amikor éppen egy irodában kezdett oldalakat reklámozni. Akkoriban ráakadtam egy oldalra promóció céljából, ami, mondjuk, csak szar volt. És ennek a szarnak voltak problémái az indexeléssel. Természetesen, ha az oldal megfelelő minőségű lett volna, mindkét kereső indexelte volna, bármilyen probléma is volt, de a tulajdonosok ragaszkodtak egy normális tervezőhöz, tördelőkészítőhöz és programozóhoz, és ebben az esetben a SEO szakember csak beszélni, nyissa ki az üveget ollóval. Mindent kipróbáltam rajta - mind az utoljára módosított beállítást, mind az indexelés gyorsítását az akkoriban divatos fastbottal, és a linkek vásárlását is. És csak akkor derült ki, hogy a lényeg az, hogy ott nem frissült automatikusan az oldaltérkép! Frissítéskor minden oldal berepült az indexbe.
Mi az oldaltérkép? Ez egy olyan fájl, amely információkat tartalmaz a webhely indexelendő oldalairól. Általában webhelytérképet készítenek a Yandex és a Google számára, hogy értesítsék a keresőrobotokat az indexelendő oldalakról. Az oldaltérkép azt is ellenőrzi, hogy milyen gyakran történnek frissítések, és mely webdokumentumok indexelése a legfontosabb. Általában nagyon jól beszéltek róla a Yandex Webmasternél:
Ha nem rendelkezik webhelytérképpel, ez nem jelenti azt, hogy a keresőmotorok ne indexelnék az erőforrást. A keresőrobotok gyakran jó munkát végeznek a webhelyek feltérképezésével és a keresésbe való bevonásával. De néha hibák léphetnek fel, amelyek miatt néha nem lehet megtalálni az összes webes dokumentumot. A fő okok a következők:
Tehát a sitemap.xml fájl létrehozása sokat segít a probléma megoldásában. Ez a fájl csak annyiban érinti a SEO-t, amennyiben megkönnyíti/gyorsítja az oldalak indexelését. Ez növeli annak esélyét is, hogy a weboldalak indexelésre kerüljenek, mielőtt a versenytársak másolhatnák a tartalmat azáltal, hogy közzéteszik azt a webhelyükön.
Miért van szükségünk oldaltérképre, rájöttünk. Most nézzük meg, milyen formátumokban lehet ezt megtenni:
Itt található további információ erről a fájlról:
Fontolja meg, hogyan készítheti el a megfelelő xml-térképet. Itt a következő követelményeknek kell megfelelni:
Íme egy egyszerű térképpélda:
< url > < loc >http://site.ru/ < lastmod >2016-11-20T19:45:08+03:00< / lastmod > < changefreq >mindig< / changefreq > < priority > 0 , 9 < / priority > < / url > < url > < loc >http://site.ru/category/ < lastmod >2016 - 11 - 20T19 : 46 : 38 + 03: 00< / lastmod > < changefreq >havi< / changefreq > < priority > 0 , 6 < / priority > < / url > < url > < loc >http://site.ru/page/ < lastmod >2016 - 11 - 20T19 : 48 : 41 + 03: 00< / lastmod > < changefreq >évi< / changefreq > < priority > 0.4 < / priority > < / url > |
Az url és loc címkék kötelezőek. Az első előírja az összes információt egy adott URL-ről. A második magát a címet tartalmazza.
A lastmod, changefreq, priority címkék nem kötelezőek, de továbbra is ajánlottak.
Az oldaltérképben szereplő Lastmod felelős az utolsó frissítés dátumáért.
A Changefreq azt jelzi, hogy milyen gyakran változik az oldal. Az értékek lehetnek:
A prioritás megmondja a keresőmotoroknak, hogy egy oldal mennyire fontos a többihez képest. A prioritás 0,1 (alacsony) és 1 (magas) között állítható be.
Ez csak egy példa volt egy térképre, nem kell pontosan megadni ezeket az értékeket. A prioritást általában a következőképpen javasoljuk beállítani: a főoldalra a maximum (1), a címsorokra - közepes (0,6), a bejegyzésekre pedig - a minimumra (0,4).
Most vegyünk egy példát, amikor több mint 50 ezer link van. Ebben az esetben a fájl más térképeket is tartalmaz:
< sitemap > < loc >http : //site.ru/sitemaps/sitemap01.xml < lastmod >2016 - 11 - 20T21 : 37 : 28 + 03: 00< / lastmod > < / sitemap > < sitemap > < loc >http : //site.ru/sitemaps/sitemap02.xml < lastmod >2016 - 11 - 20T21 : 37 : 29 + 03: 00< / lastmod > < / sitemap > |
Számos módja van az xml-térkép létrehozásának, fontolja meg ezeket:
Íme egy lehetőség, hogyan készíthet webhelytérképet pluginok nélkül:
Webhelytérképet készíthet a WordPressben a Google XML webhelytérképek nevű speciális bővítmény segítségével. Itt minden egyszerű: töltse le a bővítményt, telepítse, majd folytassa a fájl létrehozásával. Ehhez nyissa meg a Console-Settings menüt, és válassza az XML-sitemap lehetőséget. Ezután állítsa be a beállításokat. Hagyja a prioritást az alapértelmezetten.
Sziasztok, a blogoldal kedves olvasói. Úgy döntöttem, hogy egy cikkben összefoglalom mindazt, amit az oldaltérképről (Sitemap xml) írtam, ami elsősorban azért szükséges, hogy jelezze a keresők számára azokat az oldalakat, amelyeket elsősorban indexelni kell. Nagyon fontos és tulajdonképpen kötelező attribútuma minden webprojektnek, de sokan ezt vagy nem tudják, vagy nem tulajdonítanak különösebb jelentőséget az oldaltérképnek.
Azonnal jelöljük be az „i”-t, és próbáljunk meg elkülöníteni két fogalmat – az oldaltérképeket xml formátumban és HTML formátumban (van ennek a szónak egy földrajzi értelmezése is, amelyről a „” cikkben írtam). A második lehetőség az összes webes forrásanyag rendszeres listája, amely a megfelelő menüpontra kattintva bárki számára elérhető lesz. Ez a lehetőség is hasznos, és segít felgyorsítani és javítani az erőforrás keresőmotorok általi indexelését.
De a fő eszköz, amelyet arra terveztek, hogy közvetlenül jelezze a keresőmotorok számára az erőforrás azon oldalait, amelyeket indexelni kell, egy Sitemap.xml nevű fájl (ez a leggyakoribb neve, de elméletileg bárhogyan hívhatja, nem nem számít), amely nem lesz látható a webprojekt látogatói számára.
Egy speciális, a keresőmotorok számára érthető szintaxissal áll össze, amely felsorolja az összes indexelendő oldalt, feltüntetve azok fontossági fokát, az utolsó frissítés dátumát és a hozzávetőleges frissítési gyakoriságot.
Két fő fájlnak kell lennie minden webprojektnek - robots.txt és sitemap.xml. Ha a projektje nem rendelkezik ilyenekkel, vagy nincs megfelelően kitöltve, akkor nagy valószínűséggel nagymértékben károsítja az erőforrást, és nem engedi, hogy száz százalékig megnyíljon.
Persze lehet, hogy nem hallgat rám (mert nem vagyok tekintély, a viszonylag kevés felhalmozott tényanyag miatt), de úgy gondolom, hogy nem fog válogatás nélkül vitatkozni olyan szakemberekkel, akiknek több tízezer projekt statisztikája van kéznél.
Ebben az esetben egy „zongorát a bokrokban” tartogattam. Közvetlenül a cikk megírása előtt a jól ismert automatikus promóciós rendszer szakembereinek publikációja szokatlan „Hands” néven felkeltette a figyelmemet (ez a MegaIndex analógja, amelyről írtam).
Nyilvánvaló, hogy minden hozzájuk hasonló rendszer érdekelt ügyfelei projektjeinek sikeres lebonyolításában, de csak referenciatömeggel tudják felpumpálni a kliensek erőforrásait, és sajnos nem tudják befolyásolni a tartalmat és a helyes műszaki konfigurációt. oldalak közül.
Ezért egy nagyon érdekes és leleplező tanulmányt készítettek, amelynek célja, hogy azonosítsa a 10 legnépszerűbb okot, amelyek megnehezítik a projektek népszerűsítését és ezeknek az adatoknak az ügyfeleknek való behatolását...
Az első helyen természetesen a „nem egyedi tartalom” szerepelt (vagy másoltad, vagy megvan, ami a lényegen nem változtat). De a második helyen csak az xml formátumú oldaltérkép, vagy inkább annak hiánya vagy az elismert létrehozási formátummal való eltérése állt. Nos, a harmadik helyen a korábban említett robots.txt fájl végzett (annak hiánya vagy hibás létrehozása):
Amikor alaptalanul állítod, hogy a projektednek rendelkeznie kell térképpel (egyébként kirdykkel), akkor ez nem hangzik olyan meggyőzően, mintha ezt az állítást valós tények támasztják alá egy meglehetősen reprezentatív tanulmányból.
Oké, tegyük fel, hogy meggyőztelek, és nézzük meg, hogyan hozhatsz létre saját oldaltérképet (formátum szintaxist), hogyan készítheted el a Joomla és a WordPress számára, és nézzük meg azt is, hogyan hozhatod létre speciális online generátorok (generátor) segítségével.
De pusztán egy webhelytérkép létrehozása nem elegendő ahhoz, hogy a keresőmotorok megfelelően indexeljék projektjét. Továbbra is gondoskodni kell arról, hogy a keresőmotorok tájékozódjanak erről az oldaltérképről (esetünkben ezek a Google és a Yandex). Ezt kétféleképpen lehet megtenni, de erről egy kicsit később lesz szó (legalább kell lennie valami intrikának, ami leköti az olvasók figyelmét).
Először próbáljuk meg indokolni mind a robots.txt fájl használatának logikai szükségességét, amely tiltja a webprojekt egyes elemeinek indexelését, valamint a webhelytérképfájlt, amely bizonyos oldalak indexelését írja elő. Ehhez térjünk vissza öt-tíz évvel ezelőttre, amikor az interneten található források nagy része csak HTML-fájlok halmaza volt, amely az összes cikk szövegét tartalmazta.
A Google vagy a Yandex keresőrobotja egyszerűen elment egy ilyen HTML-projekthez, és elkezdett mindent indexelni, ami csak a keze ügyébe került, mert szinte mindenhol a projekt tartalma volt. És mi történik most, a CMS (tartalomkezelő rendszerek) széles körű elterjedésével összefüggésben? Valójában a keresőrobot azonnal a motor telepítése után is több ezer fájlt talál benned, és ez annak ellenére, hogy lehet, hogy még mindig nincs tartalom (jó, még egy cikket sem írtál).
És általában a modern CMS-ben a tartalmat általában nem fájlokban tárolják, hanem egy adatbázisban, amelyet természetesen a keresőrobot nem tud közvetlenül indexelni (javaslom, hogy ingyenesen dolgozzon adatbázisokkal).
Nyilvánvaló, hogy a Yandex és a Google keresőrobotjai továbbra is megtalálják az Ön tartalmát és indexelik, ha itt bökdösnek, de ez milyen gyorsan fog megtörténni, és Mennyire lesz teljes az indexelés? a projekted egy nagyon nagy kérdés.
Pontosan a projektek keresőmotorok általi indexelésének egyszerűsítése és felgyorsítása a CMS széleskörű használatának körülményei között elengedhetetlen a robots.txt és a sitemap.xml létrehozása. Az első fájl segítségével megmondja a keresőrobotoknak, hogy mely fájlokat nem szabad indexelni (például motorobjektumokat), és néhány oldalt bezárhat az indexelésből, hogy kiküszöbölje a velejáró tartalomduplikáció hatását. sok CMS-ben (erről bővebben a cikkben olvashat).
A sitemap fájl segítségével pedig világosan és érthetően megmondja a Yandex és a Google robotjainak, hogy pontosan mi is tartalmaz tartalmat a projektjében, hogy ne turkálják fölöslegesen a használt motor fájlgazdaságának sarkait. Ne felejtse el, hogy a robotok bizonyos korlátokkal rendelkeznek a megtekintett dokumentumok idejére és számára vonatkozóan. Végigjárja a motorfájljait, és távozik, a tartalom pedig hosszú ideig indexeletlen marad. Oh hogy.
Emlékezzen, hogyan mondta egy színes szereplő egy jól ismert vígjátékban: „Nem oda mész, hanem ide, különben ...”. Pontosan ennek a karakternek a funkcióját látja el a robots.txt és az xml kiterjesztésű oldaltérkép, hogy szabályozza a keresőrobotok mozgását a webprojekt zugában. Egyértelmű, hogy a botok becsatolhatnak, de nagy valószínűséggel engedelmesen követik az Ön jól megírt tiltó és előíró (az oldaltérképen) utasításait.
Ez egyértelmű? Ezután közvetlenül folytatjuk annak a kérdésnek a megoldását, hogy hogyan hozhatunk létre egy sitemap.xml fájlt különféle módokon, és hogyan jelenthetjük be a létezését két keresőbálnának a Runetben - a Google-nak és a Yandexnek, hogy ne turkáljanak semmiért a projektje körül, miközben létrehozzák. további terhelést jelent a szerver tárhelyén, de ez már nagyon csekély dolog, a lényeg az indexelés (gyors és átfogó).
Ellentétben a robots.txt fájllal, amelyet nagy valószínűséggel magának kell megírnia, a sitemap fájlt xml formátumban általában valamilyen automatikus módon próbálják létrehozni. Érthető, mert egy gyakran frissített projekt nagyszámú oldala esetén a manuális létrehozása a webmester elméjének károsodásához vezethet.
Igen, ez egyáltalán nem szükséges, mert. szinte minden CMS-hez van egy kiterjesztés, amellyel létrehozhat, és amikor új anyagok jelennek meg, újra létrehozhatja a webhelytérképfájlt. Nos, vagy kész megoldásként mindig használhat valamilyen online oldaltérkép generátort.
De mégis úgy tűnik számomra, hogy nem lenne felesleges megismerkedni az oldaltérkép létrehozásának egyszerű (mit mondjak - a legegyszerűbb) szintaxisával. Ezenkívül a kicsi és ritkán frissített projekteknél manuálisan is vázlatot készíthet.
Általában a "Sitemap" direktíva a legvégére van írva. Amikor legközelebb a keresőrobotok felkeresik webprojektjét, biztosan átnézik a robots.txt fájl tartalmát, és letöltik a térképet tanulmányozás céljából. Viszont így mindenféle retek tájékozódhat a létezéséről, amit a térképes oldal segít ellopni tőled.
De van egy másik módja is a webhelytérkép helyinformációinak a keresőmotorokhoz való közvetlen átvitelének a robots.txt közvetítése nélkül. Ez a Yandex Webmester felületen és a Google eszköztáron keresztül történik, bár használhatja. Ismeri már ezeket a keresőeszközöket?
Ha nem, feltétlenül adja hozzá projektjét mind a , mind a -hoz, majd adja meg a webhelytérkép elérési útját Xml formátumban a megfelelő lapokon.
Így néz ki a Yandex Webmaster webhelytérképének hozzáadására szolgáló űrlap:
És így néz ki egy hasonló űrlap az útvonal beállításához a Google eszköztárban:
Ha nem szeretne olyan bővítményeket keresni a CMS-hez, amelyek lehetővé teszik webhelytérkép automatikus létrehozását, akkor ebben az esetben használhat online generátorokat. Itt azonban van egy hátránya a térkép automatikus létrehozásához a CMS-ben - az új anyagok hozzáadása után vissza kell mennie az online szolgáltatáshoz, és újra létre kell hoznia ezt a fájlt, majd feltöltenie kell a szerverére. .
Valószínűleg az egyik leghíresebb online oldaltérkép generátor a Sitemap Generator. Meglehetősen nagy funkcionalitással rendelkezik, és lehetővé teszi ingyenes webhelytérkép létrehozását 1500 oldalra, ami elég sok.
A Webhelytérkép-generátor figyelembe veszi a robots.txt fájl tartalmát, hogy az indexelésre tiltott oldalak ne kerüljenek a térképre. Önmagában ez nem ijesztő, mert a robotok tiltásának magasabb prioritása lesz, de megóvja Önt a felesleges információktól a generált Site map fájlban. A térkép elkészítéséhez csak meg kell adnia a főoldal URL-jét és meg kell adnia az e-mail címét, amely után sorba kerül a generáláshoz:
Amikor rád kerül a sor, erről e-mailben értesítünk, és a levélben található linkre kattintva letöltheted a Sitemap Generator által készített fájlt. Csak el kell dobnia a megfelelő helyre a szerveren. Nos, ezt az eljárást időről időre meg kell ismételnie, hogy webhelytérképe naprakész legyen.
Van egy hasonló angol nyelvű online generátor szolgáltatás, amelyet ezen a linken talál - XML Sitemaps. 500 oldal korlát van rajta, de egyébként minden majdnem ugyanaz, mint a fent leírtakban.
Sok szerencsét! Hamarosan találkozunk a blogoldalak oldalán
Lehet, hogy érdekel
Mi az URL, mi a különbség a webhely abszolút és relatív hivatkozásai között
Mi az a Chmod, milyen engedélyeket kell hozzárendelni a fájlokhoz és mappákhoz (777, 755, 666), és hogyan kell ezt megtenni PHP-n keresztül
Yandex keresés a webhelyen és az online áruházban
OpenServer - egy modern helyi szerver és egy példa a WordPress számítógépre történő telepítésére
Hogyan növeltem a webhely forgalmát napi 300 főre?
A Webhelytérkép fájl segítségével tájékoztathatja a Yandexet az aktuális webhelyszerkezetről egy speciális direktíva megadásával a robots.txt fájlban, vagy hozzáadhatja a Yandex.Webmasterhez.
A webmester lehetővé teszi:
Válasszon ki egy webhelyet a listából.
A mezőbe írja be azt az URL-t, ahol a fájl elérhető. Például, https://example.com/sitemap.xml.
Kattintson a Hozzáadás gombra.
A hozzáadást követően a fájl feldolgozásra várólistára kerül. A robot két héten belül letölti. A robot minden hozzáadott fájlt külön-külön dolgoz fel, beleértve a webhelytérkép-indexfájlhoz csatolt fájlokat is.
A feltöltés után az egyes fájlok mellett egy állapotot fog látni:
Állapot | Leírás | jegyzet |
---|---|---|
rendben | ||
"Átirányítás" | Törölje az átirányítást, és értesítse a robotot a frissítésről | |
"Hiba" | A fájl nincs jól formázva | értesítse a robotot a frissítésről |
"Nincs indexelve" | Szerver válasz ellenőrzése |
|
Letiltás | értesítse a robotot a frissítésről |
Állapot | Leírás | jegyzet |
---|---|---|
rendben | A fájl megfelelően van kialakítva és feltöltődik a robot adatbázisba | A fájl mellett megjelenik az utolsó feltöltés dátuma. Az indexelt oldalak két héten belül megjelennek a keresési eredmények között |
"Átirányítás" | A megadott URL egy másik címre irányít át | Törölje az átirányítást, és értesítse a robotot a frissítésről |
"Hiba" | A fájl nincs jól formázva | Kattintson a Hiba hivatkozásra a részletekért. A fájl módosítása után értesítse a robotot a frissítésről |
"Nincs indexelve" | A webhelytérkép elérésekor a szerver 200-tól eltérő HTTP-kódot ad vissza | Ellenőrizze, hogy a fájl elérhető-e a robot számára a Check Server Response eszközzel a fájl teljes elérési útjának megadásával. Ha a fájl nem érhető el, forduljon annak a helynek vagy kiszolgálónak a rendszergazdájához, ahol az található. |
A fájlhoz való hozzáférés megtagadva a robots.txt fájlban a Disallow utasítással | Engedélyezze a hozzáférést a webhelytérképhez, és mondja meg a robotnak, hogy frissítse |
Ha módosította a Yandex.Webmasterhez hozzáadott webhelytérkép-fájlt, akkor nem kell törölnie, majd újra feltöltenie – a robot rendszeresen ellenőrzi a fájlban frissítéseket és hibákat.
A fájlok áthidalásának felgyorsításához kattintson az ikonra. Ha webhelytérkép-indexfájlt használ, megkezdheti az abban felsorolt fájlok feldolgozását. A robot három napon belül letölti az adatokat. A funkciót legfeljebb 10 alkalommal használhatja egy gazdagéphez.
Ha minden próbálkozást felhasznál, a következő az első után 30 nappal lesz elérhető. A pontos dátum a Webmester felületén jelenik meg.
A Yandex.Webmaster felületen törölheti a Webhelytérkép-fájlok oldalon hozzáadott fájlokat: Ha a robots.txt fájlban direktívát adtak a webhelytérképhez, törölje azt. A változtatások elvégzése után a Webhelytérképre vonatkozó információk néhány héten belül eltűnnek a robot és a Yandex.Webmaster adatbázisából.
A sitemap.xml fájl egy olyan eszköz, amely lehetővé teszi a webmesterek számára, hogy tájékoztassák a keresőmotorokat a webhely indexelhető oldalairól. Az XML térképen további oldalparamétereket is megadhat: az utolsó frissítés dátumát, a frissítések gyakoriságát és a többi oldalhoz viszonyított prioritást. A sitemap.xml fájlban található információk befolyásolhatják a keresőrobot viselkedését és általában az új dokumentumok indexelésének folyamatát. A Webhelytérkép utasításokat tartalmaz az oldalak feltérképezési sorba való felvételéhez, és kiegészíti a robots.txt fájlt, amely az oldalak kizárására vonatkozó utasításokat tartalmaz.
Ebben az útmutatóban választ talál a sitemap.xml használatával kapcsolatos minden kérdésre.
A keresőmotorok webhelytérképeket használnak, hogy új dokumentumokat találjanak az oldalon (ezek lehetnek html dokumentumok vagy médiatartalmak), amelyek nem érhetők el navigáción keresztül, de fel kell térképezni őket. Ha a sitemap.xml fájlban található egy dokumentumra mutató hivatkozás, az nem garantálja, hogy feltérképezi vagy indexeli, de a fájl gyakran segít a nagyobb webhelyek jobb indexelésében. Ezenkívül az XML-leképezés adatait használják a kanonikus oldalak meghatározásakor, kivéve, ha ez kifejezetten meg van adva a rel=canonical címkében.
A Sitemap.xml olyan webhelyeknél fontos, ahol:
Ha ez nem az Ön esete, akkor valószínűleg nincs szüksége a sitemap.xml fájlra. Azoknál a webhelyeknél, ahol az indexelés szempontjából fontos oldalak 2 kattintáson belül elérhetők, ahol nem JavaScript vagy Flash technológiát használnak a tartalom megjelenítésére, ahol szükség esetén kanonikus és regionális címkéket használnak, és friss tartalom nem jelenik meg gyakrabban, mint egy robot felkeresi az oldalt, a sitemap.xml fájlban nincs szükség.
Kis projektek esetén, ha a probléma csak a dokumentumok nagymértékű egymásba ágyazása, könnyen megoldható egy HTML oldaltérkép segítségével anélkül, hogy XML oldaltérképet kellene használni. De ha úgy dönt, hogy továbbra is szüksége van a sitemap.xml fájlra, akkor olvassa el ezt az útmutatót teljes egészében.
A keresőmotorok támogatják az egyszerű szöveges webhelytérkép-formátumot, amely egyszerűen felsorolja az oldalak URL-címeit további paraméterek nélkül. Ebben az esetben a fájlnak UTF-8 kódolásúnak kell lennie, és rendelkeznie kell a kiterjesztéssel .txt.
A szabványos XML protokollt a keresőmotorok is támogatják. A Google emellett támogatja a képek, videók és hírek webhelytérképeit.
Példa egyetlen URL-t tartalmazó webhelytérképre.
XML címkék
urlset
url(kötelező) – szülőcímke minden URL-hez.
loc(kötelező) – A dokumentum URL-je abszolút legyen.
lastmod- a dokumentum utolsó módosításának dátuma Datetime formátumban.
változásfrekv- oldalváltás gyakorisága (mindig, óránként, naponta, hetente, havonta, évente, soha). A címke értéke egy ajánlás a keresőmotoroknak, nem pedig parancs.
kiemelten fontos- URL-prioritás a többi címhez képest (0-tól 1-ig) a feltérképezési sorrendben. Ha nincs megadva, az alapértelmezett érték 0,5.
Egyes optimalizálók a képekre mutató hivatkozásokat ugyanúgy szúrják be a sitemap.xml fájlba, mint a html dokumentumokra mutató hivatkozásokat. Ezt megteheti, de jobb, ha a Google a szabványos protokoll kiterjesztését használja, és további információkat küld a képekről az URL-ekkel együtt. Az XML képtérképek létrehozása akkor hasznos, ha a képeket fel kell térképezni és indexelni kell, ugyanakkor a bot nem fér hozzá közvetlenül (például JavaScriptet használ).
Példa egy oldalt és a hozzá tartozó képeket tartalmazó webhelytérképre
XML címkék
kép:kép(kötelező) - információ egy képről. Maximum 1000 kép használható fel.
kép:loc(kötelező) - a képfájl elérési útja. Ha CDN-t használnak, akkor elfogadható egy másik tartományra való hivatkozás, ha azt a webmesterpanel megerősíti.
kép: felirat- képaláírás (hosszú szöveget tartalmazhat).
kép:cím- a kép címe (általában rövid szöveg).
image:geo_location- a forgatás helye.
kép:licenc- Kép licenc URL-je. Speciális képkereséshez használatos.
A képek térképéhez hasonlóan a Google is rendelkezik egy webhelytérkép-kiterjesztéssel a videoprotokollhoz, ahol részletes információkat adhat meg a videótartalomról, amely befolyásolja, hogyan jelenjenek meg a videókeresésekben. Video-webhelytérképre akkor van szükség, ha a webhely helyben tárolt videókat használ, és amikor ezeknek a videóknak az indexelése nehézkes a használt technológia miatt. Ha YouTube-videót ágyaz be webhelyére, akkor itt nincs szükség video-webhelytérképre.
Ha webhelyén van hírtartalom, és részt vesz a Google Hírekben, hasznos Hírek-webhelytérképet használni, hogy a Google gyorsabban megtalálja a legfrissebb tartalmat, és indexelje az összes hírcikket. Ebben az esetben a Webhelytérképnek csak az elmúlt 2 napban közzétett oldalak címét kell tartalmaznia, és legfeljebb 1000 URL-t tartalmazhat.
Ha szükséges, több webhelytérképet is használhat, kombinálva őket egyetlen index-webhelytérképben. A rendszer több sitemap.xml fájlt használ, ha:
Ez utóbbi esetben a webhely minden nagyobb részének saját sitemap.xml-je van, és mindegyik hozzáadódik a webmesterek panelhez, ahol kényelmesen megtekinthető, hogy melyik szakaszban van a legtöbb hiba (lásd a hibakeresésről szóló részt a oldaltérkép).
Ha 2 vagy több webhelytérképe van, azokat index-webhelytérképpé kell kombinálni, amely ugyanúgy néz ki, mint a normál (kivéve a sitemapindex és a sitemap címkék jelenlétét az urlset és az url helyett), hasonló korlátozásokkal rendelkezik, és csak a normál XML leképezések (nem indexek) .
Példa webhelytérkép-indexre:
sitemapindex(kötelező) – Megadja az aktuális protokoll szabványát.
oldaltérkép(kötelező) – információkat tartalmaz egy adott webhelytérképről.
loc(kötelező) - webhelytérkép helye (xml, txt vagy rss formátumban a Google számára).
lastmod- oldaltérkép váltás ideje. Lehetővé teszi a keresőmotorok számára, hogy gyorsan felfedezzenek új URL-eket nagy webhelyeken.
XML webhelytérkép létrehozási módszerek:
Lehetővé teszi, hogy néhány kattintással letöltse a sitemap.xml fájlt. Támogatja az XML, HTML, TXT és GZ formátumokat. Kényelmes kis oldalakon (legfeljebb 500 oldal) használható.
Hasonló generátor, de kicsit több beállítással, és akár 2000 oldalas térkép létrehozását is lehetővé teszi ingyenesen.
Számos beállítással rendelkezik, lehetővé teszi URL-ek importálását CSV-fájlból. Akár 500 URL-t is beolvas ingyen.
Nincs korlátozva a beolvasandó oldalak száma. De nagy webhelyek esetén a generálási folyamat több tíz percig is lefagyhat.
A webhelytérkép-generátor ingyenes asztali verziója Windowshoz.
Rugalmas oldaltérkép-generáló eszköz sok beállítással. Ez akkor hasznos, ha már használ képernyőbékát más SEO-feladatokhoz. A webhely átvizsgálása után használja a Webhelytérképek -> XML webhelytérkép létrehozása menüpontot.
Kevésbé rugalmas, de kényelmes megoldás a sitemap.xml gyors generálására. Az oldal átvizsgálása után az Eszközök -> Oldaltérkép generálása menüpontot kell használni.
A sitemap.xml fájl, csakúgy, mint egy normál webhelytérkép, XML-címkékkel formázott oldalak halmaza. Ennek a fájlnak a segítségével a keresőmotorok megértik, hogy webhelyének mely oldalait kell először indexelni.
Alap HTML oldaltérkép:
Webhelytérkép XML formátumban:
Mindegyik lehetőségnek megvannak a maga előnyei és hátrányai. Az XML-webhelytérkép fő előnye, hogy kiküszöböli a webhelyen belüli oldalak statikus súlyának elmosódásának lehetőségét.
Ebben a cikkben elmondom, hogyan hozhat létre érvényes Sitemap.xml fájlt.
Ha már mindent tud a webhelytérkép elkészítésével kapcsolatban, ugorjon az utolsó fejezetre, melynek neve „Chips”.
3 kötelező utasítást mindenképpen ki kell tölteni, ezek a címkék:
És még 3 opcionális címke:
Íme egy emlékeztető az egyes címkék dekódolásáról a hivatalos webhelyről: http://www.sitemaps.org/ru/protocol.html:
Tulajdonság |
Állapot |
Leírás |
kívánt |
Beágyazza ezt a fájlt, és meghatározza az aktuális protokollszabványt. |
|
kívánt |
Szülőcímke minden URL-hez. Más címkék ennek a címkének vannak alárendelve. |
|
kívánt |
Magának az oldalnak az URL-je. Mindig előtaggal kezdődik (például HTTP), és perjelre végződik (ha a webhely szervere ezt megköveteli). Megjegyzés: Az URL hossza nem haladhatja meg a 2048 karaktert. |
|
|
választható |
A fájl utolsó módosításának dátuma. Szigorúan W3C Datetime formátumban van megadva. Lehetővé teszi az időszegmens figyelmen kívül hagyását, ha szükséges, és az ÉÉÉÉ-HH-NN formátumot használja. |
|
választható |
Lehetővé teszi annak megadását, hogy az oldalon lévő információk milyen gyakran változzanak. Ez az érték hozzávetőlegesen van beállítva. Érvényes értékek:
Ha az oldal minden megnyitáskor megváltozik - használja az "always" (mindig) értéket. Ha ez egy archív oldal - tegye soha (soha). Kérjük, vegye figyelembe, hogy ez az attribútum tippként szolgál a bejáró számára, nem pedig szabályként. Ezért a kapcsolat közte és az oldal keresőrobot általi tényleges látogatási gyakorisága között nem lineáris. |
|
választható |
Lehetővé teszi, hogy megadja webhelye egyes oldalainak prioritását másokkal szemben. Az értéktartomány 0,0 és 1,0 között van. Alapértelmezés szerint minden oldal 0,5 prioritást kap. Az attribútumérték csak a webhelyen belüli oldalak prioritásának összehasonlítására szolgál. Vagyis nem befolyásolja, hogy webhelye hogyan viszonyul a versenytársakhoz a keresési hálózaton. Ráadásul értelmetlen az összes oldalt a maximális prioritásra állítani. Mert akkor az értékek ugyanazok lesznek a robot számára, és az attribútum egyszerűen nem fog működni. Tehát ne keressen kiskapukat, hanem jelölje meg az oldalak objektív prioritását. |
Mentse el ezt a jegyzetet. Biztosan jól fog jönni az első alkalommal. Érdemes megjegyezni az XML-oldaltérképek másik előnyét – ez a rugalmasság. A rugalmasság a különböző választható direktívák kombinációjában rejlik.
Most, hogy tisztában van azzal, hogy mi az XML-webhelytérkép, és megtanulta ennek a fájlnak az alapvető utasításait, folytathatja a fordítását.
Háromféleképpen hozhat létre webhelytérképet:
Az oldaltérkép elkészítésének folyamata a következő:
Nézzünk egy példát egy fájl manuális fordítására. Ha webhelyének 5 oldalát szeretné hozzáadni a webhelytérképhez:
Így kell kinéznie az XML webhelytérképnek:
|
Ha szükséges, adjon hozzá opcionális címkéket a fent megadott emlékeztetőből. További címkék vannak írva a tárolóban
|
A fenti kód közli a keresőmotorral, hogy a http://site.ru/ oldal
legutóbb 2005. január 1-jén változott. Frissítve havonta egyszer. Ennek az oldalnak a prioritása pedig 0,8 (a maximálisan lehetséges 1).
A párosított címkék kiemelésének funkciója különösen kényelmes.
Ha webhelyén sok hasznos oldal található, és nem szeretne időt pazarolni egy fájl manuális összeállítására, akkor a következő szolgáltatások segítenek Önnek:
Sok ilyen szolgáltatás létezik. A https://www.xml-sitemaps.com/ oldalt használom.
Hadd magyarázzam el röviden az összes beállítást:
A webhelykezelő rendszerekhez rengeteg beépülő modul és kész megoldás létezik. Például:
csatlakoztat |
|
Az oldaltérkép összeállítása után ellenőriznie kell, hogy nincs-e benne hiba. Az ellenőrzéshez használja a https://webmaster.yandex.ru/sitemaptest.xml szolgáltatást
Sikeres ellenőrzés után töltse fel fájlunkat az oldalra.
A robots.txt fájltól eltérően a sitemap.xml fájl bárhol megtalálható a webhelyen. Például a webhely gyökérmappájában a fájl a következő címen lesz elérhető:
Ha a fájlt a /files/ mappába helyezte, akkor a következő címen lesz elérhető:
A fájl sikeres feltöltése után feltétlenül mondja el a keresőrobotoknak, hogyan találják meg ezt a fájlt. Ez nagyon egyszerűen történik. A robots.txt () fájlban, a Sitemap direktívában írja be a teljes címet a fájlba. Például egy robots.txt fájl így nézhet ki:
Fontos! A robots.txt-től eltérően több webhelytérképfájl is lehet. Ebben az esetben meg kell adnia a robotokban és a webmesterekben az összes webhelytérkép-fájl teljes címét.
Marad az utolsó szakasz. Adja meg a webhelytérkép elérési útját a keresőmotorok webmesteri paneljén.
Vegye figyelembe az XML webhelytérkép korlátozásait:
Ezzel befejeződik a fő lépések. Kövesse az összes leírt egyszerű szabályt, és nem fog hibázni. A cikk második része a sitemap.xml részletesebb beállításaival, finomságaival és funkcióival foglalkozik, ezekre az ismeretekre szüksége lesz egy professzionális webhelytérkép online áruházak számára történő összeállításához.
Ha túllépi az 50 000 URL-es korlátot, beágyazott struktúrát kell használnia, és több webhelytérképből álló csoportot kell létrehoznia. Ez azt jelenti, hogy webhelytérképeket hozzon létre az oldaltérképben!
Egy normál webhelyen (nem egy nagy portálon vagy online áruházon) ritka az ilyen oldalak mennyisége, ezért a legtöbb SEO-szakértő a kényelem kedvéért használja a Webhelytérkép-csoportosítást, például termékoldalak vagy -részek csoportosítására.
A szintaxis így néz ki:
|
Az XML címkék meghatározása:
Tulajdonság |
|
Leírás |
|
kívánt |
Az ebben a fájlban lévő összes webhelytérképről szóló információkat tartalmaz. |
|
kívánt |
Egyedi webhelytérképre vonatkozó információkat tartalmaz. |
kívánt |
Meghatározza a webhelytérkép fájl helyét. |
|
|
nem szükséges |
Azt jelzi, amikor a megfelelő webhelytérkép módosult. A robot ezeket az információkat arra használja fel, hogy megértse, mely webhelytérkép-fájlok változtak. Közvetve ez a címke lehetővé teszi a robot számára, hogy gyorsan felfedezzen új oldalakat a webhelyen. |
Így egy csoportos oldaltérkép kerül összeállításra. Az összes többi eljárás megegyezik a fent leírtakkal. Ne felejtse el feltüntetni a robots.txt fájlban, a Sitemap direktívában a fájlra mutató megfelelő hivatkozást.
2014 végén egy kis tanulmányt végeztem, hogy elemezzem a sitemap.xml fájl hatékonyságát az oldalon.
Probléma lépett fel egy webáruház weboldalán található termékcsoport indexelésével (kb. 10 000 termék). Ugyanakkor semmi sem akadályozta az indexelésüket. Oldaltérkép fájlt állítottak össze, amely csak az oldal termékeire mutató hivatkozásokat tartalmaz. Az oldaltérkép automatikusan frissült. 2 hónapig az URL-ek több mint 70%-a bekerült a Yandex keresőmotor index adatbázisába. Az indexelt oldalak nagy része a webhelytérkép oldalai. Megjegyzem, ebben az időszakban semmilyen egyéb intézkedés nem történt az oldal indexelésének felgyorsítására (például linkelés).
Íme maguk az eredmények:
Következtetés: a webhelytérkép továbbra is befolyásolja webhelyének indexelését. Ezt a fájlt rendszeresen frissíteni és frissíteni kell.
Annak érdekében, hogy a cikk ne legyen unalmas a tapasztalt SEO szakemberek számára, azt javaslom, hogy ismerkedjen meg a következő „trükkökkel”.
Ha további forgalmat szeretne vonzani a keresőmotorokból (talán nem egészen konverzió), létrehozhat egy további webhelytérképet a képekhez.
A kép-webhelytérkép szintaxisa így néz ki:
xmlns:image="http://www.google.com/schemas/sitemap-image/1.1"> |
Megjegyzés az XML-címkékkel kapcsolatban:
Szükségszerűen? |
Leírás |
|
|
Minden információt tartalmaz egyetlen képről. Minden URL (címke |
|
|
Kép URL-je. Egyes esetekben a kép URL-jének domainje eltérhet a fő webhely által használt domaintől. Ha mindkét domaint ellenőrizte a Search Console-ban, akkor nem lesz probléma. Ha azonban a képeket egy tartalomkezelő rendszer, például a Google Webhelyek segítségével tárolja, igazolnia kell a tárhelyet a Search Console-ban. Ezenkívül a robots.txt fájl nem akadályozhatja meg az indexelendő tartalom feltérképezését. |
|
|
Képaláírás. |
|
|
A forgatás helye. Például, |
|
|
Kép címe. |
|
|
Képlicenc URL. |
Sok keresőoptimalizáló egyszer egy projekt elején hoz létre webhelytérkép fájlokat. Felejtsd el az oldaltérképet. Indexelt oldalak – jó. Nem – mit tehetsz? Általában elfelejtenek új oldalakat hozzáadni a webhelytérképhez.
Kutatásaim során azt tapasztaltam, hogy a probléma legkényelmesebb megoldása egy külön sitemap.xml fájl, amely csak az oldalnak azokat az oldalait tartalmazza, amelyek még nincsenek indexelve.
És ez tette lehetővé, hogy az új URL-ek több mint 70%-a bekerüljön a Yandex indexébe.