Šta je mapa sajta (sitemap)?
Sitemap ili mapu sajta generišemo kako bismo Google-u saopštili sa čime sve želimo da ga upoznamo. Cilj je efikasnije popisivanje web stranica. Sitemap je, zapravo, popis svih URL-ova sajta. Taj popis se sortira na osnovu nekog parametra, recimo, prema važnosti, datumu ili se jednostavno ne sortira. Na ovaj način kažemo Google-u koje su nam stranice zapravo najvažnije, ali pružamo i druge bitne podatke, kao što je, na primer, vreme poslednjeg ažuriranja.
Sitemap pruža podatke i o određenim vrstama sadržaja, kao što su slike, vesti, video snimci i slično. Unos slike može obuhvatati lokaciju slike, a unos video snimka može obuhvatati prikladnost za uzrast, vreme prikazivanja i slično. Kada je reč o unosu vesti, on može obuhvatati datum prikaza i naslov članka.
Da li je mapa sajta uvek potrebna?
U slučaju adekvatne povezanosti podstranica sajta putem neke vrste navigacije, Google će moći da popiše većinu važnih landing stranica. Ipak, ako je reč o većim i složenijim sajtovima, kao i specijalizovanim datotekama, sitemap će definitivno poboljšati popisivanje.
Sitemap – mali web sajtovi
„Mali“ web sajtovi su oni koji imaju ispod 500 podstranica. Moramo imati u vidu da su u ovaj broj uključene samo stranice za koje želimo da se nađu u rezultatima pretrage. Ako je sajt interno dobro povezan, počevši od početne stranice, i ako nema mnogo medijskih sadržaja, možda sitemap i nije neophodan. Ipak, ako je potrebno da se medijski sadržaji nađu u rezultatima pretrage i ako nismo sigurni u adekvatnu povezanost stranica, bolje bi bilo koristiti mapu sajta u cilju pomoći Google-u da što efikasnije obavi popisivanje URL-ova.
Međutim, u slučaju ovako malih sajtova, prilikom generisanja sitemap nije potrebno obaviti nikakvo sortiranje URL-ova jer će Google do svih lako doći. Ako imamo preko 500 URL-ova, poželjna je mapa sajta, ali sve do 1000 URL-ova ne moramo raditi bilo koju vrstu sortiranja istih.
Sitemap – srednji web sajtovi
Međutim, ako imamo 1000 podstranica, odnosno veći broj istih, sortiranje je važno. U tom slučaju bi trebalo postaviti najnoviji sadržaj na vrh popisa. Zašto? Google botovi prilikom popisivanja kreću od početka. Oni popisuju sve dok se ne potroši određeni budžet i odjednom se zaustave. Ako se na vrhu popisa nalaze najnovije landing stranice, osiguravamo da će bot kroz njih proći i indeksirati ih. Kroz stare stranice je već prošao ranije i obavio indeksiranje.
Sitemap – veliki web sajtovi
U slučaju ogromnog web sajta, od preko 50 000 podstranica, rukovodimo se drugačijim pravilima. Ograničenje veličine mape sajta je 50MB (nekompresovana) ili 50000 URL-ova. Tada pravimo glavni sajtmap i manje sajtmap-ove koji su povezani sa glavnim. Drugim rečima, glavna mapa sajta se razbija na više mapa sajta. Može se napravitii indeksna datoteka koju šaljemo Google-u. Takođe se Google-u može poslati više sitemap-ova i indeksna datoteka. Na ovaj način možemo pratiti učinak pretrage svake pojedinačne mape sajta u Search Console.
Sa gore navedenim u vezi, možemo generisati satemap kategorija, satemap podkategorija te kategorije, satemap blog članci, satemap wiki članci….Najbolje bi bilo da granica bude 10 000 podstranica, odnosno u jedan sajtmap fajl ubaciti 10000 URL-ova.
Sitemap – kakve URL-ove uključuje
U sitemap bi trebalo da se nalaze isključivo „čisti“ URL-ovi, odnosno samo oni koje želimo videti u rezultatima pretrage. Nikakvi URL sa redirekcijama ne bi smeli da se nađu u ovoj mapi jer će ih Google uzalud obilaziti i nepotrebno rasipati svoje resurse. Takođe se moraju navesti apsolustne putanje URL-ova, nikako skraćene.
Ako imamo isti sadržaj koji je dostupan u različitim URL-ovima, potrebno je izabrati samo jedan za sitemap.
Kako napraviti mapu sajta?
Ako je reč o manjim sajtovima, od nekoliko desetina UJRL-ova, možemo ih ručno napraviti pomoću tekst editora, kao što je, na primer Notepad. Kada je reč o velikim sajtovima, postoji mogućnost automatskog generisanja mape sajta pomoću oodređenih alata.
Ako koristimo neki CMS, na primer, WordPress, takođe je moguće automtsko generisanje mape sajta uz pomoć određenih alatki.
Ukoliko sajt postane preveliki, moramo voditi računa o tome da glavnu mapu sajta podelimo na manje mape sajta.
Da li Google uvek poštuje naše preporuke?
Sve gore navedeno sačuvamo kao xml document i postavimo u root dokumenta. Potom prijavimo sitemap Search Console-i i posle nekog vremena Google bi trebalo da “pokupi” URL-ove. Ustvari, posle nekoliko dana možemo videte koliko je URL-ova koje smo preporučili Google-u, on zaista prihvatio da indeksira. Znači, URL-ove koje smo ubacili u sitemap, Google tretira kao preporuke ili sugestije, nikako kao naredbe.
Na ovaj način ćemo saznati i koje stranice uopšte ne postoje, na kojima imamo 404 grešku, gde imamo problem sa serverom, itd. Na osnovu sitemap ćemo dobiti informaciju da li nam web sajt uopšte radi kako bi trebalo.
TXT mapa sajta
Ukoliko se mapa sajta sastoji samo od URL-ova web stranica, možemo sačiniti jednostavan txt fajl. U okviru njega bi svaki red bio jedna URL adresa. Ako se sajt sastoji od 3 stranice, txt sitemap bi izgledao ovako:
https://www.primer.com/dokument1.html
https://www.primer.com/dokument1.html
https://www.primer.com/dokument1.html
U ovaj fajl se ne stavlja ništa osim URL adresa. Naziv fajla je nebitan, samo je važno da ima txt ekstenziju.
Upravljanje sitemap-ama pomoću sitemap indeksne datoteke
Ako imao sajt čiji broj stranica premašuje ograničenja veličine, delitmo svoju veliku mapu sajta na više mapa sajta. Svaka nova mapa sajta biće u dozvoljenim granicama. Indeksna datoteka mape sajta je način da se pošalje više mapa sajta odjednom.
Xml format indeksne datoteke mape sajta je sličan xml formatu datoteke mape sajta.
Sitemap-ovi koji se navode u indeksnoj datoteci mape sajta moraju biti u istom direktorijumu kao i indeksna datoteka mape sajta ili niže u hijerarhiji sajta. Na primer, ako se indeksna datoteka mape sajta nalazi na:
https://primer.com/public/sitemap_index.xml
ona može da sadrži samo mape sajta koji se nalaze u istom ili dubljem direktorijumu, kao što je:
https://primere.com/public/shared /….
Možete da pošaljete do 500 indeksnih datoteka mape sajta za svaki sajt na svom Search Console nalogu.
Mapa sajta je bitna kako bismo obezbedili indeksiranje u slučaju da ponestane crawler budget-a kada je reč o veliki sajtovima.
Iako se za manje sajtove mogu koristiti alatke, a za veće takođe automatska generiosanja, najbolje bi bilo za njih obaviti ručno generisanje sitemap-ova. Ako sajt ima preko 500000 URL-ova, a nema veliki autoritet, sigurno je da Google neće sve stranice indeksirati. Prilikom automatskog generisanja, program neće znati šta je nama bitno, a šta ne, pa se može desiti da neke bitne stranice ostanu nepopisane. Ručnom izradom mape sajta možemo kontrolisati prioritete.