Log file analysis

Hvad er log file analysis?

I SEO bruges log file analysis til at undersøge et websites serverlogfiler og se, hvad der faktisk sker, når siden bliver besøgt af søgemaskiner og andre bots. Metoden kaldes også loganalyse og giver et mere præcist billede end antagelser eller simulerede crawl-data.

Ved at analysere logfiler kan man se, hvilke URL’er der bliver crawlet, hvor ofte de besøges, hvilke statuskoder serveren returnerer, og om crawlbudget bruges på de rigtige sider. Det gør det lettere at opdage spildcrawl, tekniske fejl og indhold, som søgemaskiner overser.

Log file analysis er derfor et vigtigt værktøj, når man vil forstå den faktiske adfærd fra Googlebot og andre crawlers på et website. Det bruges især på større sites, men kan også være relevant for mindre websites med tekniske eller indekseringsmæssige problemer.

Informationskort med teksten log file analysis og kort forklaring af serverlog-analyse

Hvad serverlogfiler afslører om crawlere

Når en crawler besøger et website, efterlader den spor i serverens logfiler. Hver linje viser typisk, hvilken side der blev anmodet om, hvornår besøget skete, hvilken user-agent der blev sendt, hvilken statuskode serveren svarede med, og hvilken IP-adresse anmodningen kom fra. Det gør logfiler til en direkte kilde til viden om, hvordan søgemaskiner og andre bots faktisk bevæger sig rundt på sitet.

Med de data kan man se, om Googlebot crawler vigtige sider ofte, eller om dens tid i stedet bruges på filtre, parametre eller andre mindre relevante adresser. Man kan også sammenligne forskellige crawlere og opdage, om andre bots belaster serveren unødigt. Besøgte URL’er, hyppighed og fordeling over tid giver et klart billede af crawlmønstre, som ikke altid fremgår af andre værktøjer.

Logfiler viser også, hvordan serveren reagerer på crawl. Mange 404- eller 500-statuskoder kan pege på tekniske problemer, mens lange svartider kan gøre crawl mindre effektiv. Samlet hjælper log file analysis med at forstå, hvilke sider der bliver fundet, hvor ofte de bliver hentet, og om crawlbudgettet bruges fornuftigt.

Sådan finder man crawlfejl og tekniske problemer

Logfile-analyse viser, hvad søgemaskinernes crawlere faktisk gør på sitet, ikke kun hvad de kan tilgå i teorien. Den forskel er vigtig. En side kan godt være teknisk tilgængelig, men hvis den næsten aldrig bliver crawlet, kan det pege på svag intern linkstruktur, lav prioritering eller crawlbudget, der bruges forkert.

Ved at gennemgå statuskoder i logfilerne kan man hurtigt opdage mønstre, der skader crawling og indeksering. Mange 404-fejl fra bottrafik kan for eksempel afsløre gamle sider, interne links eller filtrerede adresser, som søgemaskiner stadig forsøger at hente. Gentagne 500-fejl er mere alvorlige, fordi de viser serverproblemer, der kan forhindre adgang til vigtige sider. Også lange kæder af 301- og 302-omdirigeringer er et klassisk faresignal, fordi de spilder crawlressourcer og kan forsinke indeksering.

Logfiler gør det også muligt at se, om crawlere rammer sider, der burde være blokeret, eller om vigtige områder bliver stoppet af robots.txt. Hvis produkt- eller kategorisider sjældent bliver crawlet, mens parametre, interne søgeresultater eller andre uønskede crawlstier får mange besøg, er det et tegn på, at crawlbudgettet fordeles forkert. Et konkret fejlmønster kan være tusindvis af botanmodninger til filtrerede sider med næsten identisk indhold, mens centrale landingssider kun hentes få gange.

Crawlbudget og prioritering af vigtige URL’er

Serverlogfiler viser hurtigt, om søgemaskinernes crawlere bruger tiden på de sider, der faktisk skal ranke. Hvis loganalysen afslører mange hits på filtrerede kategorier, sorteringer, interne søgninger eller parameterbaserede varianter, er det et tegn på spildt crawl. Samtidig kan vigtige landingssider, produktkategorier eller nye produktsider blive crawlet for sjældent, og det kan forsinke både indeksering og opdatering i søgeresultaterne.

I praksis bør du sammenholde crawlaktivitet med sidernes SEO-værdi. Hvis Googlebot oftere besøger dubletter end dine vigtigste kategorisider, er prioriteringen skæv. Det ses ofte på webshops, hvor filtre for farve, størrelse og pris skaber mange næsten identiske sider. Loganalysen gør det muligt at identificere mønstre i crawl på irrelevante URL’er og derefter begrænse dem med for eksempel noindex, bedre intern linking, korrekt kanonisk håndtering eller strammere styring af parametre.

Det hænger tæt sammen med indeksering og XML-sitemap. Et godt sitemap bør fremhæve de URL’er, du ønsker crawlet og indekseret, men logfilerne viser, om søgemaskinen faktisk følger den prioritering. Når vigtige sider både er med i XML-sitemap, får interne links og modtager reel crawlaktivitet, øges chancen for hurtigere indeksering og bedre udnyttelse af crawlbudgettet.

Værktøjer og datakilder til analyse af serverlogfiler

Data til loganalyse kommer typisk fra webservere, applikationsservere, load balancere og CDN-lag, hvor hver forespørgsel registreres med blandt andet tidspunkt, statuskode, IP-adresse, user-agent og den ønskede URL. I praksis ligger logfilerne ofte på selve serveren, men de kan også stilles til rådighed gennem hostingmiljøet, en cloudplatform eller et kontrolpanel. Adgangen afhænger derfor af opsætningen og af, hvilke rettigheder man har.

For at hente filerne kræves der som regel serveradgang via kommandolinje, filadgang i hostingpanelet eller eksport fra CDN og andre infrastrukturtjenester. Nogle virksomheder gemmer desuden logs centralt i et datalager eller et overvågningssystem, så flere kilder kan analyseres samlet. Det er vigtigt at kende både opbevaringsperiode, filformat og eventuelle begrænsninger i adgangen, før analysen går i gang.

Selve behandlingen kan ske i alt fra regneark og scripts til specialiserede loganalyseværktøjer, der filtrerer, grupperer og visualiserer mønstre i crawl, fejl og svartider. Til SEO bruges værktøjerne især til at se, hvordan søgemaskiners crawlere faktisk bevæger sig på sitet, og om vigtige sider bliver besøgt som forventet.

Forskel på loganalyse og data i Google Search Console

De to datakilder beskriver ikke det samme. Loganalyse bygger på rå serverdata og viser de faktiske forespørgsler, der rammer sitet, herunder præcis hvornår Googlebot besøger en URL, hvilken statuskode serveren svarer med, og hvor ofte bestemte sider bliver crawlet. Det er observeret adfærd på serverniveau.

Google Search Console viser derimod aggregerede rapporter. Dataene er sammenfattet, filtreret og præsenteret i Googles egen grænseflade, så du får overblik over blandt andet indeksering, crawlstatistik og fundne fejl, men ikke hele det rå forløb bag hvert besøg.

Et kort eksempel: Logfiler kan afsløre, at Googlebot gentagne gange crawler en parameter-URL eller rammer mange 404-sider efter en intern ændring. Det ser du ikke nødvendigvis direkte i Search Console. Omvendt giver Search Console værdifuld kontekst om Googles vurdering af siderne. Derfor supplerer logfiler og Search Console hinanden i teknisk SEO.

Hvornår det giver mest værdi

Udbyttet er ofte størst, når et website er stort, komplekst eller teknisk tungt. Her kan log file analysis vise, hvordan søgemaskiners crawlere faktisk bevæger sig på siden, hvilke URL’er de bruger tid på, og hvor crawlbudget måske spildes. Det er især nyttigt, hvis der er mange skabeloner, filtre, parametre eller ældre sider, som gør strukturen svær at gennemskue.

Metoden kan også være relevant ved tekniske udfordringer. Det gælder for eksempel ved mistanke om crawlfejl, langsom indeksering, mange redirects, store mængder dubletindhold eller forskel mellem det, man forventer bliver crawlet, og det, der faktisk bliver besøgt af bots.

På små websites er behovet ofte mindre, fordi problemerne typisk kan findes med enklere analyser. Det betyder dog ikke, at logfiler aldrig er relevante. I nogle tilfælde kan de stadig give værdi, især hvis et mindre site har usædvanlig arkitektur eller tilbagevendende tekniske fejl.

Ofte stillede spørgsmål om Log file analysis

Hvad er log file analysis i SEO?

Log file analysis i SEO er analyse af et websites serverlogfiler for at se, hvordan søgemaskiner og andre bots faktisk besøger siden. Det viser blandt andet, hvilke URL’er der crawles, hvor ofte de bliver hentet, og hvilke statuskoder serveren returnerer.

Det særlige ved loganalyse er, at den bygger på reel serveradfærd. Du ser altså ikke kun, hvad der burde kunne crawles, men hvad der rent faktisk bliver crawlet.

Hvorfor er log file analysis vigtigt for teknisk SEO?

Loganalyse er vigtig, fordi den afslører tekniske problemer, som ellers kan være svære at opdage. Det kan være mange 404-fejl, 5xx-fejl, lange omdirigeringskæder eller vigtige sider, som næsten aldrig får besøg af Googlebot.

Den hjælper også med at vurdere, om crawlbudget bruges rigtigt. Hvis søgemaskiner bruger tid på filtre, parametre eller andre irrelevante URL’er, kan det gå ud over indeksering af de sider, der faktisk er vigtige.

Hvad kan man se i en serverlogfil?

En serverlogfil viser typisk tidspunktet for en forespørgsel, den ønskede URL, statuskoden fra serveren, IP-adressen og den user-agent, der blev sendt med anmodningen. Det gør det muligt at se, om besøget kom fra for eksempel Googlebot, Bingbot eller en anden crawler.

I mange tilfælde kan man også bruge logfiler til at analysere mønstre over tid, som hvilke sider der bliver hentet ofte, og om bestemte områder af sitet giver fejl eller unødigt mange omdirigeringer.

Hvordan viser logfiler Googlebots adfærd?

Logfiler viser Googlebots faktiske besøg på serveren. Du kan se, hvilke URL’er Googlebot anmoder om, hvor hyppigt den crawler bestemte sektioner, og hvilke svar serveren giver tilbage.

Det gør det muligt at sammenligne Googles reelle crawl med din ønskede prioritering. Hvis vigtige sider bliver besøgt sjældent, mens uønskede URL-varianter får mange crawl, er det et klart signal om, at noget bør justeres.

Hvordan finder man crawlproblemer med loganalyse?

Man finder crawlproblemer ved at gennemgå mønstre i botanmodninger, statuskoder og URL-typer. Mange 404-svar, gentagne 500-fejl eller omfattende crawl af omdirigerede adresser er klassiske tegn på problemer.

Det er også nyttigt at se på, hvilke sider der næsten ikke bliver crawlet. Hvis centrale kategori-, produkt- eller landingssider har meget lav crawlaktivitet, kan det pege på svag intern linkstruktur, dårlig prioritering eller spildt crawlbudget.

Kan log file analysis hjælpe med crawlbudget?

Ja, loganalyse er en af de mest direkte måder at arbejde med crawlbudget på. Den viser, om søgemaskiner bruger deres crawlressourcer på de URL’er, der er vigtigst for sitet.

Hvis analysen viser meget crawl på filtre, sorteringer, parameter-URL’er eller interne søgeresultater, kan du begrænse det og i stedet gøre vigtige sider lettere at finde og prioritere. Det kan forbedre både crawling og indeksering.

Hvilke statuskoder bør man holde øje med i logfiler?

De vigtigste statuskoder i SEO-sammenhæng er 200, 301, 302, 404 og 5xx. En 200-kode betyder, at siden blev leveret korrekt, mens 301 og 302 viser omdirigeringer, som kan være nødvendige, men også kan skabe unødigt crawlspild i store mængder.

404-koder viser sider, der ikke findes, og 5xx-koder peger på serverfejl. Særligt mange 5xx-svar til søgemaskiner er alvorlige, fordi de kan forhindre effektiv crawling og skade indekseringen.

Hvad er forskellen på loganalyse og data i Google Search Console?

Loganalyse bygger på rå serverdata og viser de faktiske forespørgsler, der rammer dit website. Du kan se præcise besøg, URL’er, tidspunkter og serverens svar for hver anmodning.

Google Search Console viser derimod aggregerede og bearbejdede data fra Google. Det giver et godt overblik, men ikke samme detaljegrad som logfiler. De to datakilder supplerer derfor hinanden, snarere end at erstatte hinanden.

Hvordan får man adgang til website-logfiler?

Adgangen afhænger af hosting og serveropsætning. Logfiler kan ligge direkte på webserveren, være tilgængelige via SSH, ligge i et kontrolpanel hos hostingudbyderen eller være gemt i en cloud- eller CDN-løsning.

I nogle virksomheder håndteres logs centralt i overvågnings- eller dataplatforme. Før analysen bør man afklare, hvor længe logs gemmes, hvilket format de har, og om der er adgang til de nødvendige data om bottrafik.

Er log file analysis nødvendigt for alle websites?

Nej, ikke nødvendigvis. For mindre og enkle websites kan mange tekniske SEO-problemer ofte opdages med crawlværktøjer, Search Console og almindelig teknisk gennemgang.

Loganalyse bliver især værdifuld på større eller komplekse websites, hvor crawlbudget, mange URL-varianter, filtre, dubletter eller tekniske fejl gør det vigtigt at forstå søgemaskinernes faktiske adfærd. I de tilfælde kan den give indsigter, som andre værktøjer ikke viser tydeligt.

Faglig afsender

SEO-ordbogen.dk er udarbejdet og vedligeholdt af Henrik Andersen, som har arbejdet med hjemmesider siden 2004 og SEO siden 2013.

Formålet er at forklare SEO-begreber enkelt og praktisk, så både begyndere og erfarne kan få bedre forståelse for søgemaskineoptimering.

Læs mere om SEO-ordbogen og Henrik Andersen Se LinkedIn-profil