Sådan finder du relevant information på internettet
Resumé
Af Nils G. Indahl, journalist05/03 2008
Mange af os søger på nettet uden at være klar over, hvordan det søgeredskab vi aktiverer egentlig fungerer. Det gør i mange tilfælde vores søgning upræcis, og resultatet bliver en masse irrelevante hits. Ved hjælp af kataloger, søgemaskiner og blogsøgemaskiner kan vi optimere vores søgning, så den bliver effektiv og præcis.
Måske har du nogle gange en fornemmelse af at famle i blinde, når du skal finde noget bestemt på nettet. For det kan være vanskeligt at vurdere, hvilke ord, du skal skrive i et søgefelt for at få det ønskede resultat. Et katalog er perfekt til at give dig en oversigt over et sagsområde og de ord og udtryk, du senere skal bruge i søgemotoren.
Kataloget hedder directory på engelsk (og kaldes på Googles danske sider for indeks). Et af de veletablerede er Yahoos katalog: http://search.yahoo.com/dir.
Temainddelingen viser katalogets styrke: Hvis du har et vagt kendskab til det tema, du gerne vil vide mere om, lader kataloget dig surfe ind på områder, du ikke vidste eksisterede. For eksempel til dette underkatalog med adressen: http://dir.yahoo.com/Education/Special_Education/.
Linksamlingen er sat sammen og redigeret af en levende person - en redaktør. Takket være redaktørens gennemarbejdede netadresser, kan du hurtigt skaffe dig en oversigt over sagsområdet, så du bliver klar over, hvilke ord du skal søge efter i andre søgeredskaber. Forestil dig, at du researcher den optimale ernæringssammensætning for teenagere. Hvis du ikke ved, hvad de korrekte termer er, kan du finde dem i kataloget "nutrition" (på engelsk): http://dir.yahoo.com/Health/Nutrition/.
Eller du kan finde det sidste inden for interaktive netspil:
http://www.google.dk/Top/World/Dansk/Spil/Internet/.
En dansk pendant til Google er Eniro: http://www.eniro.dk.
Når du søger i et katalog, kan det være, du ikke lige finder kategorien uddannelse, men så kan du jo søge efter ordet uddannelse i kataloget. Skriv kategorien i søgefeltet øverst, og klik "Søg i indeks", alternativt "Search directory". Hvis din specialinteresse for eksempel er sprog og lingvistik, får du her en række gode specifikke danske links serveret på et fad: http://www.google.com/Top/World/Dansk/Videnskab/Humaniora/Sprog_og_lingvistik.
Måske synes du, at der mangler en kategori? Den kan du i så fald foreslå oprettet - med dig selv som redaktør.
De engelsksprogede kataloger indeholder selvfølgelig en stor mængde information. På Open Directory Project, der samarbejder med Google, kan enhver med en vis faglig indsigt blive redaktør.
Hvis du mener, du har ekspertise på et specielt katalogområde, kan du foreslå dig selv som redaktør og komme med på redaktørholdet ved at klikke på linket "Become an Editor" nederst til højre: http://www.google.com/dirhp. Dit arbejde bliver bedømt af de andre redaktører. Hvis de er tilfredse med dit arbejde, får du fuld adgang til deres computernetværk. Dette er den såkaldte wiki-metode, det vil sige at redaktørarbejdet er uddelegeret til en række avancerede brugere - ikke samlet hos en person.
Der er tilknyttet redaktører til Googles katalog inden for en række sprog, og der eksisterer også en dansk startside: http://www.google.com/Top/World/Dansk.
Hvad enten du søger i the Open Directory Project på Google eller i en søgemaskine, har du brug for at kende søgekommandoerne - de såkaldte operander.
Operanderne er de ord, vi benytter for at fortælle søgeredskabet, for eksempel Googles database, hvad det skal gøre med dit søgeord.
Det er en god idé at lave en søgeprofil, inden du går i gang med søgningen. I Googles katalog er det for eksempel muligt at lære sproget esperanto. Du starter med - evt. på et stykke papir - at beskrive med almindelige ord, hvad du vil søge efter:
"Jeg vil finde ud af noget om sproget esperanto, og hvorledes jeg kan lære og praktisere det i Danmark".
Fra denne sætning tager du de vigtigste ord, gerne i ental:
esperanto lære praktisere Danmark
Disse fire ord er nu dine søgeord. Disse søgeord kan du kombinere på forskellige måder på søgelinien, for eksempel:
esperanto AND lære AND praktisere AND Danmark
Søgelinien kaldes en søgestreng.
Denne måde at sætte dine søgekriterier op på kaldes boolske operander. Udtrykket er opfundet af den engelske matematiker George Boole (1815 - 64) og er en måde at skelne en delmængde fra en anden. I stedet for AND kan du bruge operanderne OR, NOT eller NEAR - lidt afhængig af, om de supporteres af søgeværktøjet. Søgeord og operander udgør søgestrengen. Det er denne (søgeord + operander), du lægger ind i Googles søgefelt.
Operanden AND mellem to ord betyder, at begge ord skal findes i søgeresultatet. Operanden OR er strengt taget unødvendig, fordi du da først får søgeresultatet for det ene ord for sig, derefter det andet søgeord osv. I stedet for at lave en søgestreng med operanden OR, kan du ligeså godt søge med et ord ad gangen. Operanden NOT betyder, at du i søgeresultatet vil have dokumenter, hvor et bestemt ord ikke optræder i søgeresultatet.

I ovenstående eksempel gav søgningen et godt og relevant søgeresultat. Som det fremgår af websiden, indsætter Google automatisk operanden AND, men nogle gange vil du måske hellere bruge en anden operand. For eksempel NOT for at udelukke et ord fra søgningen.
Hvis du bruger Google regelmæssigt, kan det betale sig at tage et kig på "Avanceret søgning" eller "Søgetip". Her forklares en række af Googles specialfunktioner. For eksempel er det muligt at begrænse en søgning til et bestemt domæne eller sprog, eller til en bestemt type dokumenter. Måske vil du kun have pdf-filer eller PowerPoint-præsentationer i resultatlisten.
Et eksempel: Gå ind på siden for avanceret søgning.
http://www.google.dk/advanced_search?hl=da
"Med alle ordene" betyder, at Google vælger operanden AND. Skriv et par ord du vil søge med. Derefter trækker du ned i rullemenuen "Filtypen … kun resultater af filtypen …". Her kan du for eksempel vælge PDF (Portable Document Format) eller en anden dokumenttype.
Nogle gange kan vi blive vildledt til at tro, at vi søger på internettet, når vi i virkeligheden søger i søgemaskinens kartotek (indeks).
Faktisk er mindre end halvdelen af verdens internetsider indekserede. En søgemotor består af tre dele:
- Edderkoppen er et program, som besøger et website og derefter følger links ud af siden til andre websteder og netsider. Resultatet af edderkoppens fund bliver sendt videre til søgemaskinens næste del.
- Indeks er en samling harddiske hos f.eks. Google. De udgør et gigantisk kartotek med kopi af hver eneste kendte/indekserede internetside. Når en side ændres, byttes den automatisk ud med et nyt "kartotekskort". Først når siden er indekseret, bliver den tilgængelig i søgemaskinen. Det betyder, at du kan finde mange databaser gennem søgemaskinen. Men indholdet i databaser kan ikke indekseres. For eksempel er mange netaviser baseret på information i databaser. Det er grunden til, at de - og mange andre dynamiske websiders indhold - ikke er at finde i søgemaskinerne.
- Softwaren er et program, som gennemgår millioner af netsider for at finde ord, der passer til andre søgeord - for eksempel synonymer. Den, der søger på konge, søger i virkeligheden også efter monark. Programmet har adgang til store synonymordlister på mange forskellige sprog. Alle netsider bliver rangeret efter, hvad programmøren finder vigtigt. På Google er universiteter vigtigere end andre websider. Hvis du vil rangere højt i Googles søgeresultat, skal din webside være hostet på et kendt universitet. Du får kollegaer på andre kendte universiteter til at linke til din webside. Desuden hjælper det, hvis dit website indeholder information, som andre søger efter. (Obskøne udtryk ligger på en stopliste i indeksen - en liste over forbudte ord - så dem er det bedst at undgå).
Hvis du tager din søgestreng fra Google og lægger ind i Altavista, Lycos eller ask.com, vil du blive overrasket.
Det er ikke altid Google giver det bedste søgeresultat. Når du lægger samme søgestreng ind flere steder, vil du ofte få forskellige søgeresultater, hvilket betyder, at du snyder dig selv for værdifuld information, hvis du kun bruger en søgemaskine.
Google er populær, fordi den bruger akademiske kilder og derfor ofte giver et relevant søgeresultat. Og Lycos (som er det samme som HotBot) er for eksempel god til at finde multimediefiler.
Nogle gange ligger de to søgeord, du kigger efter, langt fra hinanden i et dokument. Hvis første kapitel i en tekst handler om esperanto, og tolvte kapitel om Danmark, vil dokumentet dukke op i søgeresultatet, selv om de to kapitler ikke har noget med hinanden at gøre. Operanden NEAR kan da være praktisk at bruge. Den supporteres IKKE af Google. I Altavista betyder søgestrengen
esperanto NEAR Danmark
at begge søgeord skal findes maksimalt 10 pladser fra hinanden i dokumentet. I Lycos skal ordene være placeret maksimalt 25 ord/pladser fra hinanden.
Hvert sekund etableres der mere end 3 blogs i verden.
"Hvis du går til Google og indtaster ordet vin, får du at vide, hvor det er bedst at købe vin. Men hvis du virkelig vil vide, hvad verdens vineksperter taler om, er Google ikke til megen hjælp". Dette sagde David L. Siffry i et interview med Business Week i 2006. Det var hans motivation for at grundlægge Technorati, verdens førende søgemaskine for blogs (webdagbøger). Du kan søge i alle blog-indlæg i Technorati: http://search.technorati.com.
Du kan også her anvende boolske operander, hvis du i stedet går ind på Technoratis startside: http://www.technorati.com.
Så søger du i tags (det vil sige de søgeord webdagbogens forfatter har mærket indlægget med), IKKE i alle blogs. Men forsiden har andre funktioner: Her kan du for eksempel se dagens mest brugte søgeord.
Mens der kan gå flere uger fra et website er opdateret til Google har registreret det, er blogsøgemaskinen opdateret fra det ene sekund til det andet. En blogs popularitet i Technorati afgøres udelukkende af, hvor mange andre der har linket til den bestemte blog.
Også de andre søgetjenester har efterhånden blogsøgefunktioner, men stadig er Technorati den mest udviklede.
Google finder sig ikke i at spille i andendivision, når det gælder blogsøgninger, så regn med at deres betaversion vil blive bedre i den nærmeste fremtid.
Googles blogsøgningsfunktion kan du finde her: http://blogsearch.google.com.
Sesam drives af den norske Schibsted-gruppe, der også har ejerinteresser i svenske og danske medier. I øjeblikket omfatter den norske webdagbøger, men måske vil den i fremtiden blive udvidet til at indeksere danske og svenske webdagbøger: http://www.sesam.no.
Indahl, Nils G.: Nettjournalisten (2. udgave, 2007): 3. kapitel: Idé og research
Høyskoleforlaget, Kristiansand.
Se mere om Nils G. Indahl:
http://www.indahl.com
http://www.nettjournalisten.info

Udskriv…
Hjælp til udskrift
Om…
Nyhedsbrev
Sitemap
Teknik
Skriv til
RSS
Søg
