Søndag Aften
In Association with Amazon.com

FRITEKSTSØGNING
Søg blandt over 500 artikler


Støttet af Kulturministeriets bevilling til almenkulturelle tidsskrifter


August 2004


PageRank - mere får mere


Googles søgemaskine er baseret på PageRank. Denne metode sikrer at de som har mange besøg får endnu flere besøg fremover. Store dele af nettet opdages aldrig


Indtil 1998 var Alta Vista blandt de mest dominerende søgemaskiner på nettet. Alta Vista var kendt for stor dybde i søgningerne og for at give omfattende og troværdige resultater. Problemet med Alta Vista var, at man gav for mange svar og at sorteringen blandt de svar man gav var for svag.

De fleste som søger via en søgemaskine forventer at få det relevante svar på den første resultatside, evt. den anden. Men derefter bliver det mest for forskere eller specialinteresserede at gå videre blandt søgeresultater. Derfor er det altafgørende for søgemaskinerne at vise de mest relevante links. På dette punkt fejlede Alta Vista og her vandt Google. I begyndelsen på grund af PageRank systemet. Mange links til en side gav større sandsynlighed for relevans og så fik siden en god PageRank, og websider med en god PageRank kom højt blandt søgeresultaterne.

En tidlig fordel ved dette var, at pornosider næsten forsvandt fra resultatsiderne. Pornosites havde lukreret på søgemaskinernes brug af keywords og lagt masser af irrelevante keywords ind på siderne. Det gav høj hitratio. Men de havde ikke været gode til at sikre links til sig selv. Derfor faldt de langt ned i Googles resultatlister og blev i realiteten usynlige.

Det unikke demokrati

"Hjertet i vores software er PageRank"
oplyser Google og forklarer:
PageRank bruger Internettets unikke demokratiske natur, til at bedømme en individuel sides værdi. Dvs. at Google tolker et link fra side A til side B som en stemme, fra side A på side B. Men, Google, kigger på mere en det totale antal stemmer, eller links som en side modtager, den analysere også den side der afgiver stemmen. Stemmer givet af sider der selv er "vigtige" vejer mere, og gør andre sider "vigtige".
Googles reelle store fordel er, at den webcrawling man gennemfører lader til at være den bedste og mest konsistente i forhold til konkurrenterne. Man har maskiner til at gennemtrævle hele nettet. I princippet starter en ny gennemtrævling hver måned. Sites med høj Page Rank, dagblade og enkelte andre med hyppige ændringer gennemtrævler man dagligt. Sites med lav PageRank når man ikke igennem. Og da man starter forfra hver måned, når man så at sige aldrig helt i bund med nettets indhold.

Googles resultater opdateres herefter en gang hver måned, de sites som gennemtrævles dagligt opdateres også dagligt i Google. Dette betyder at store sites som ikke opdateres hyppigt og som har lav PageRank ikke crawles af Google og dermed ikke opdages af nogen.

Flertallet bestemmer

Det som Google beskriver som Internets unikke demokratiske natur kan omskrives til flertallets diktatur. Page Rank fører til at de som har får mere, at give de rige mere uanset kvalitet. Sammenligner man med andre medier, så svarer det til en konsttaering som at Ekstra Bladet har mange læsere, derfor taler mange om Ekstra Bladet, det giver i sig selv flere læsere. Men med PageRank bliver det til sidst kun Ekstra Bladet man kan se. Ikke på grund af kvaliteten, men kun fordi mange linker til Ekstra Bladet. Og hvis Ekstra Baldet og BT skriver tilstrækkeligt meget om hinanden, så vil vi aldrig opdage at der findes andre aviser.

Hvis man forestillede sig PageRank som søgefaktor, når man søgte efter bøger på biblioteket, så vil det være de mest omtalte eller lånte bøger der dukkede op - ikke nødvendigvis de bedste og ikke nødvendigvis de mest relevante.

Googles PageRank går laget dybere end blot at sortere efter flest henvisninger til et site. De sider som har en god PageRank tæller således væsentligt mere end de sider med lav PageRank.

Miserable failure

Og som før set for søgemaskiner: når kreative aktører har fundet ud af systemet, så forsøger de at udnytte det til deres fordel.

Et eksempel på dette har været den omfattende subkultur af bloggere, som dagligt opdaterer deres sider og bringer dagens nyheder - og som er særdeles flittige til at linke til hinanden. Med PageRank systemet er bloggernes sider blevet uforholdsmæssigt højt repræsenteret blandt søgeresultaterne (hvorefter Google har ændret i PageRank-formlen). Dermed gav PageRank mulighed for at en subkultur som ellers ikke var fremme i offentligheden blev hørt. Demokratisk er det interessant at give nye grupper af mennesker mulighed for at komme i centrum. Men det øgede ikke nettets troværdighed.

Et lignende eksempel finder man i søgetermen "miserable failure". Nogen fandt på at kalde USA's nuværende præsident for dette og på at sammen med vennerne at lade begrebet "miserable failure" linke til Det hvide hus officielle biografi for George W. Bush. Herefter henviser søgninger efter "miserable failure" derfor til denne link.

Bush-tilhængere har svaret igen med at etablere links fra "miserable failure" til forhenværende præsident Jimmy Carter og senest er filminstruktøren Michael Moore dukket op på 3. plads blandt disse stakkels fiaskoer.

Virksomheden Upspiral, som bygger på AskJeeves søgemaskine har formået at placere sig, således at virksomheden næsten altid kommer op med søgeresultat 2 eller 3 - og klikker man ind på Upspiral er det så godt som de samme sider der henvises til som fra Google. Upspiral.com giver altså entydigt støj på Googles svarsider.

Popularitet = troværdighed?

PageRank har desuden den væsentlige svaghed, at nye sites ikke opdages. Hvis ingen linker til dem, får de lav PageRank og bliver reelt ikke-eksisterende. PageRank løste i sin tid et problem med troværdighed i søgeresultater. Men det var ud fra nettet anno 1999. Sites som er kommet til siden er svagere repræsenteret. Og steder som er døende, eksempelvis Netscape.com, bliver ved med at stå højt i PageRank (og ved linkningen her - med negativ omtale - er Netscape prioriteret en lillebitte smule højere igen :-).

Med PageRank går man ud fra, at linkpopularitet er udtryk for troværdighed. Men linkpopularitet kan også være misvisende. PageRank sikrer, at de som i dag får mange linkhenvisninger i morgen får endnu flere. Nettets mangfoldighed bliver reelt mindre. Dette understreges af, at PageRank også bruges til at styre gennemtrævlingen af nettet, så store dele af nettet aldrig kommer frem i Googles resultater.

Popularitet kan være en vigtig faktor til at vurdere en webside eller et andet kulturprodukt. Googles problem er, at man har gjort denne form for popularitet til en ideologi. Det går ud over mangfoldigheden. Men mangfoldighed er ikke Googles ideologi.

Læs også:
Intro - Go Google Go, Go, Go
Google - historien
Google kender dig
Google - nu med filter
Google - snart med posten
Google - pengene ruller
Konkurrenterne ruster sig
Google brugt kreativt
Kan du din Google?
Nettet forgoogler

Søndag Aften 08/2004

Må gerne kopieres eller citeres med angivelse af Søndag Aften som kilde.

[Næste artikel]

 




Samlet oversigt over Søndag Aftens CulturCronikker 1997-2005






 




arkitektur & design | biblioteker | film | internet | kunst | litteratur | musik | teater & dans

colofon | | links | søg | debat | gæstebog | nyhedsbrev | @ -mail til redaktionen

© 1997-2006 Søndag Aften. All rights reserved.