Et sitemap giver et samlet overblik over indholdet på et website. Det er typisk en fil eller en oversigt, der samler sidens vigtigste adresser og viser, hvordan indholdet hænger sammen.
For søgemaskiner fungerer et sitemap som en hjælp til at finde og gennemgå sider, som ellers kan være svære at opdage. Det gør det lettere at forstå website-strukturen, herunder hvilke sider der findes, og hvordan de er organiseret i forhold til hinanden.
Et sitemap bruges især på større websites med mange undersider, men kan også være nyttigt på mindre sider. Kort sagt hjælper det både søgemaskine og website med at skabe bedre overblik og en mere tydelig struktur.
Forskellen på XML-sidekort og HTML-oversigt
Et sitemap kan have to forskellige funktioner, og det er netop her, mange forveksler begreberne. Et XML-sidekort er først og fremmest lavet til søgemaskiner. Det er en teknisk fil, som hjælper Google og andre søgemaskiner med at finde og forstå et websites sider, billeder eller andre filer. Et konkret eksempel er et XML-sidekort, der oplister alle produktkategorier og varesider i en webshop, så nye og opdaterede sider bliver lettere at opdage.
En HTML-oversigt er derimod synlig for brugerne og fungerer som en navigationsside. Formålet er at give besøgende et samlet overblik over indholdet, især på store websites med mange undersider. Et typisk eksempel er en side, der viser hovedkategorier, services og vigtige informationssider i en logisk struktur, så brugeren hurtigt kan klikke sig videre.
Forskellen ligger altså i både formål, målgruppe og placering. XML-sidekortet ligger som en teknisk fil i websiteets opsætning og bruges primært af søgemaskiner, mens HTML-oversigten er en almindelig side på websitet, som mennesker kan se og bruge. De kan supplere hinanden, men de er ikke det samme.
Sådan hjælper oversigten med crawling og indeksering
Et sitemap gør det lettere for søgemaskiner at opdage sider, som ellers kan være svære at finde via interne links alene. Det gælder især nye sider, dybtliggende indhold, store websteder og sektioner med mange filtreringer eller svag intern linkstruktur. Når relevante URL’er er samlet ét sted, får crawleren et tydeligere overblik over, hvad der findes, og hvad der bør besøges.
Det kan også støtte selve crawlprocessen. På større sites med begrænset crawlbudget kan et sitemap hjælpe søgemaskinen med hurtigere at finde vigtige sider og opdateret indhold. Felter som seneste opdateringsdato kan være et signal om, at en side bør crawles igen, men det er kun vejledende. Et sitemap er ikke en ordre, og det erstatter ikke god intern linkning, teknisk tilgængelighed eller klar informationsarkitektur.
For indeksering er sitemaps nyttige, fordi de peger på de URL’er, du selv anser som de rigtige. Derfor bør de normalt kun indeholde den kanoniske URL og ikke dubletter, parametervarianter eller sider, der er blokeret eller sat til ikke at blive indekseret. Det øger chancen for, at søgemaskinen forstår den ønskede version. Men et sitemap garanterer ikke indeksering. Hvis indholdet er tyndt, duplikeret, utilgængeligt eller vurderes som mindre relevant, kan siden stadig blive fravalgt.
Krav til format og opbygning
Et sitemap skal som udgangspunkt oprettes i XML-format og følge den gældende specifikation fra sitemaps.org. Strukturen er fast: Filen skal have et rootelement, og hver side angives som en separat post med et felt til sidens adresse. Det centrale og påkrævede felt er loc, som indeholder den kanoniske webadresse. Adresserne skal være fuldt kvalificerede, bruge korrekt protokol og pege på sider, der faktisk kan crawles. Relative stier, ugyldige tegn og inkonsekvent kodning bør undgås.
Ud over den obligatoriske adresse kan et sitemap indeholde supplerende felter som lastmod, der angiver seneste væsentlige ændring. Felterne changefreq og priority findes også i standarden, men søgemaskiner tillægger dem begrænset betydning, så de bør kun bruges, hvis oplysningerne er reelle og vedligeholdes konsekvent. Indholdet i filen skal afspejle virkeligheden på sitet; kun indeksérbare og relevante sider bør medtages.
Der gælder også tekniske grænser. En enkelt sitemap-fil må højst indeholde 50.000 webadresser og må ikke overstige 50 MB ukomprimeret. Ved større websites opdeles indholdet derfor i flere sitemaps, som samles i et sitemap-indeks. Har sitet flere sprog- eller landeversioner, kan hreflang-relationer i nogle tilfælde angives i XML-sitemappet, men de skal være præcise og gensidige for at fungere korrekt.
Opret, find og indsend i Google Search Console
Et sitemap gør det lettere for Google at opdage og forstå dine vigtigste sider. I mange CMS-systemer kan du oprette et sitemap automatisk med en indbygget funktion eller et SEO-plugin. Har du ikke den mulighed, kan det laves manuelt som en XML-fil med adresserne på de sider, du vil have søgemaskiner til at gennemgå. Som hovedregel skal filen kun indeholde kanoniske, indeksérbare sider og holdes opdateret, når du tilføjer, ændrer eller fjerner indhold.
Når sitemapet er oprettet, ligger det typisk i roden af domænet som /sitemap.xml. Nogle løsninger laver også flere sitemaps, for eksempel for sider, billeder eller produkter, samlet i et sitemap-indeks. Det er også almindeligt at henvise til sitemapet i robots.txt, så søgemaskiner hurtigt kan finde filen. Hvis du er i tvivl om placeringen, kan du ofte se den i dit CMS, dit plugin eller i kildefilerne på serveren.
Indsendelse i Google Search Console er enkel. Åbn den relevante ejendom, gå til sektionen for sitemaps, og indtast stien til dit sitemap, for eksempel /sitemap.xml. Send derefter filen til Google. Når den er registreret, kan du se, om sitemapet kunne hentes, hvornår det sidst blev læst, og hvor mange sider der er fundet. Hvis der opstår fejl, bør du kontrollere, at filen findes, returnerer korrekt statuskode, og kun indeholder sider, som ikke er blokeret af robots.txt eller noindex.
Hvilke sider bør medtages?
Et sitemap bør kun indeholde sider, som du faktisk vil have søgemaskiner til at crawle og indeksere. Det betyder typisk vigtige landingssider, kategorier, produkter, artikler og andre kanoniske versioner af dit indhold. Hvis en side ikke har selvstændig SEO-værdi, bør den som udgangspunkt ikke med.
Udelad sider med noindex, fordi de ikke er beregnet til indeksering. Det samme gælder dubletter og filtrerede URL’er, som ofte skaber mange varianter af næsten samme indhold. Har du for eksempel en kategori med sortering, prisfiltre eller pagination, er det normalt kun den primære, kanoniske version, der skal stå i sitemapet.
Et sitemap skal altså afspejle det bedste og mest stabile udvalg af sider. Hvis et produkt findes i flere versioner med parametre, bør kun den kanoniske side medtages. Tilsvarende bør interne søgeresultater, tagsider med tyndt indhold og testsider som regel holdes ude, så crawlbudgettet bruges på de sider, der virkelig betyder noget.
Typiske fejl og misforståelser
En sitemap-fil virker kun godt, hvis indholdet er korrekt og opdateret. En klassisk fejl er at medtage forældede sider, omdirigeringer eller adresser, der returnerer fejlstatuskoder som 404 og 500. Det svækker signalet til søgemaskinerne og gør det sværere at pege dem mod de vigtigste, aktive sider.
Mange forveksler også sitemap med robots.txt, men de to filer løser forskellige opgaver. Et sitemap fortæller, hvilke sider der findes og bør crawles, mens robots.txt bruges til at styre, hvad crawlere må eller ikke må tilgå. En side bliver derfor ikke automatisk blokeret, fordi den mangler i et sitemap, og den bliver heller ikke nødvendigvis indekseret, bare fordi den står der.
Det er en udbredt misforståelse, at alle sider automatisk bliver indekseret, når de er sendt ind via sitemap. Indeksering afhænger også af kvalitet, intern linkstruktur, dubletindhold og tekniske forhold. Et sitemap hjælper søgemaskiner med at finde indholdet hurtigere, men det er ikke en garanti for placeringer eller indeksering.
Ofte stillede spørgsmål om Sitemap
Hvad er et sitemap?
Et sitemap er en fil eller oversigt, der viser, hvilke sider og adresser et website består af. I SEO mener man oftest et XML-sitemap, som er lavet til søgemaskiner.
Formålet er at gøre det lettere for Google og andre søgemaskiner at finde indhold og forstå website-strukturen. Det er især nyttigt på større websites eller sider med indhold, der ikke er let at opdage via interne links alene.
Hvad er forskellen på et XML-sitemap og et HTML-sitemap?
Et XML-sitemap er en teknisk fil til søgemaskiner. Det indeholder typisk URL’er og kan også have oplysninger om, hvornår en side sidst er opdateret.
Et HTML-sitemap er derimod en almindelig side på websitet, som hjælper besøgende med at finde rundt. Det ene er altså lavet til crawling, det andet til navigation for brugere.
Hvorfor er et sitemap vigtigt for SEO?
Et sitemap kan hjælpe søgemaskiner med hurtigere at opdage nye, opdaterede eller dybtliggende sider. Det kan være en fordel på websites med mange undersider, svag intern linkning eller komplekse strukturer.
Det er dog kun et hjælpesignal. Et sitemap erstatter ikke god informationsarkitektur, intern linkning eller stærkt indhold, og det garanterer ikke indeksering.
Har alle websites brug for et sitemap?
Nej, ikke alle websites er afhængige af et sitemap. Et lille website med få sider og tydelig intern linkstruktur kan ofte crawles fint uden.
Alligevel er det som regel en god idé at have et XML-sitemap, fordi det er en enkel måde at hjælpe søgemaskiner med at finde de vigtigste URL’er. På større websites er det ofte klart mere værdifuldt.
Hvordan opretter man et sitemap?
De fleste CMS-løsninger og SEO-plugins kan oprette et sitemap automatisk. Det er den letteste løsning, fordi filen ofte bliver opdateret løbende, når du tilføjer eller fjerner sider.
Alternativt kan du lave et sitemap manuelt i XML-format. Uanset metode bør filen kun indeholde kanoniske, indeksérbare og relevante sider, som returnerer korrekt statuskode.
Hvordan finder jeg et websites sitemap?
Det ligger ofte på en adresse som /sitemap.xml eller i et sitemap-indeks på domænets rod. Du kan derfor starte med at prøve den placering direkte i browseren.
Du kan også tjekke websiteets robots.txt, hvor der ofte står en henvisning til sitemapet. Hvis sitet bruger et CMS eller plugin, kan placeringen desuden fremgå af systemets indstillinger.
Hvordan indsender man et sitemap til Google?
Gå ind i Google Search Console, vælg den relevante ejendom, og åbn sektionen for sitemaps. Indtast derefter stien til filen, for eksempel /sitemap.xml, og send den ind.
Når Google har læst filen, kan du se status, eventuelle fejl og hvor mange URL’er der er fundet. Hvis der er problemer, bør du kontrollere, at filen kan hentes, og at indholdet ikke er blokeret eller sat til noindex.
Hvor ofte skal et sitemap opdateres?
Et sitemap bør opdateres, når du publicerer nye sider, ændrer væsentligt i eksisterende indhold eller fjerner URL’er. På websites med hyppige ændringer er det bedst, at opdateringen sker automatisk.
Det vigtigste er, at filen afspejler den aktuelle version af sitet. Et forældet sitemap med gamle eller ugyldige adresser giver et svagere og mindre brugbart signal til søgemaskiner.
Kan et sitemap forbedre indeksering?
Ja, et sitemap kan gøre det lettere for søgemaskiner at opdage relevante sider og dermed støtte indeksering. Det gælder især nye sider eller indhold, som ikke er stærkt forbundet via interne links.
Det er dog ikke en garanti. Hvis en side har tyndt indhold, er duplikeret, teknisk utilgængelig eller vurderes som mindre relevant, kan den stadig blive fravalgt i indekset.
Hvilke sider skal med i et sitemap?
Du bør medtage de sider, du ønsker crawlet og indekseret, typisk kanoniske landingssider, kategorier, produkter, artikler og andre vigtige indholdssider. Kun URL’er med reel SEO-værdi bør være med.
Undgå noindex-sider, dubletter, filtrerede adresser, omdirigeringer og fejlramte URL’er. Sitemapet skal pege på de bedste og mest stabile versioner af dit indhold.
Hvad er forskellen på sitemap og robots.txt?
Et sitemap er en oversigt over URL’er, som hjælper søgemaskiner med at finde indhold. robots.txt bruges derimod til at styre, hvilke områder crawlere må eller ikke må tilgå.
De to filer har altså forskellige roller. Sitemapet peger på indhold, mens robots.txt giver adgangsregler. De supplerer hinanden, men den ene kan ikke erstatte den anden.