Menu
• Indhold

Usability-test vs. spørgeskemaundersøgelser

Resumé

Af Julia Gardner, UNI•C Usability
01/01 2007

Usability-test og spørgeskemaundersøgelser af hjemmesider har et fælles sigte: at skaffe viden om brugerne. Men det er forskellige typer af oplysninger, man får frem vha. de to metoder, så det er ikke ligegyldigt hvilken en af dem, man benytter. Hvilken metode, man skal vælge, afhænger af, hvad man skal bruge resultaterne til.

 

Baggrund for artiklen

Denne artikel tager udgangspunkt i en konkret undersøgelse af en hjemmeside. Undersøgelsen blev gennemført i forsommeren 2005 og byggede på en usability-test og en spørgeskemaundersøgelse. Der blev anvendt to forskellige metoder ud fra et ønske om at få et dækkende billede af brugernes adfærd og ønsker.
Undersøgelsen havde to mål:
1. at finde ud af hvorvidt eksisterende funktioner virker efter hensigten
2. at belyse hvorvidt hjemmesiden rummer det rette indhold, og om brugerne på den baggrund er overordnet tilfredse og betragter hjemmesiden som et centralt værktøj.
Resultaterne skal bruges til videreudvikling af hjemmesiden.

Om Baggrund for artiklen

Nyhedsbrev

Tilmeld dig til IT-temaets nyhedsbrev



 

Grundlæggende principper bag de to metoder

Usability-test og spørgeskemaundersøgelser adskiller sig fra hinanden på flere grundlæggende punkter, og det forklarer, hvorfor man opnår meget forskellige resultater ved at benytte de to metoder [1].

   Usability-test   Spørgeskemaundersøgelse
 Type

 Kvalitativ undersøgelse.

Som udgangspunkt vises åbenhed over for undersøgelsens resultat; man ved ikke på forhånd, hvilken konklusion man vil nå frem til. Resultatet kan være nye perspektiver på et problem.

Hensigten er at forsøge at forstå brugernes handlinger og deres tanker. Metoden er baseret på iagttagelser og tolkninger.

 Kvantitativ undersøgelse.

I en velplanlagt kvantitativ undersøgelse skal man på forhånd vide, hvilke sandsynlige emneområder, man ønsker at få belyst. Spørgsmål og svarkategorier skal være kendt på forhånd.

Metoden er baseret på bearbejdning af talmateriale, som struktureres og analyseres. Der er bl.a. mulighed for at under-søge sammenhængene mellem brugeres svar på forskellige spørgsmål.

Usability-test Spørgeskemaundersøgelse
 Resultaternes rækkevidde

 Resultaterne kan til en vis grad overføres på andre brugere, men der vil være en vis usikkerhed vedrørende konklusionernes repræsentativitet.

Der er dog lavet eksperimenter der viser, at man skal tale med relativt få brugere for at få overblik over, hvilke problemer der findes i et givent system [2].

 Resultaterne kan normalt generaliseres: dvs. man kan lave konklusioner om en større gruppe af personer, end dem man har talt med. Det forudsætter dog, at brugerne er udvalgt således, at der ikke forekommer bias. Desuden skal der tages højde for, at de personer, der returnerer spørgeskemaet ofte har et stærkere engagement i undersøgelsens emne [3].
Usability-test Spørgeskemaundersøgelse
 Antal deltagere  Bygger på ganske få brugeres udsagn.  Bygger på mange brugeres respons.
Usability-test Spørgeskemaundersøgelse
 Hvad bliver målt?

 Måler faktisk adfærd

En testleder observerer brugernes handlinger, imens de udføres, og noterer resultaterne løbende.

Alt hvad testlederen holder øje med kan rapporteres, herunder en lang række mindre delobservationer vedrørende elementer der bliver klikket på eller ikke klikket på etc.

 Måler holdninger

Selvrapportering på baggrund af det brugeren genkalder sig i forbindelse med udfyldelse af spørgeskemaet.

Detaljerede designspørgsmål kan ikke måles af to grunde:

  • Brugerne er ikke opmærksomme på, hvilke handlinger de udfører, dvs. hvilke dele af grænsefladen de benytter. Brugerne er fokuserede på den overordnede opgaveløsning.
  • Brugerne har ikke et ordforråd, der beskriver de mange forskellige elementer i grænsefladen. Derfor er det svært at stille eksplicitte spørgsmål om disse elementer. Fx "Hvad synes du om brugen af drop-down bokse?"
Usability-test Spørgeskemaundersøgelse
 Hvilken type resultater får man?

 Kan give uhyre detaljerede oplysninger vedrørende design af specifikke elementer i grænsefladen.

Samtidig skaffes også generel information om brugernes holdninger via det afsluttende interview, der afrunder hver enkelt testsession.

Overordnet information om brugerens indtryk af systemet.

Svarene falder inden for de forudbestemte svarkategorier. Svar i fritekstfelter kan dog bidrage med indsigt i nye problemstillinger, som der ikke er blevet spurgt til i de faste spørgsmål.

Usability-test Spørgeskemaundersøgelse
 Tidsforbrug for brugeren  En test varer normalt mindst en time.  Et spørgeskema bør ikke tage mange minutter at udfylde: respondenterne føler sig mindre forpligtede end til en test.
Usability-test Spørgeskemaundersøgelse
 Hvor befinder brugeren sig?

 Brugeren befinder sig i sine egne omgivelser, hvis testen gennemføres i konteksten.

Typisk gennemføres test dog i et lab eller andre lokaler reserveret til test.

 Ingen viden om hvor brugeren befinder sig.
Usability-test Spørgeskemaundersøgelse
 Hvordan forberedes evalueringen?

 Testlederen må sætte sig ind i systemet og på den baggrund formulere interviewguide og testscenarier.

Pilottest anbefales som forberedelse.

 Den spørgeskemaansvarlige må sætte sig ind i systemet og på den baggrund udarbejde spørgeskemaet.

Spørgeskemaet bør pilottestes for at sikre, at det er forståeligt.

Usability-test Spørgeskemaundersøgelse
Hvor fast ligger evalueringsformen?

Testscenarier bliver formuleret på forhånd, således at samtlige brugere løser de samme opgaver. Opgavernes formulering kan imidlertid justeres under testen for at sikre brugerens fulde forståelse. Ydermere er der mulighed for at tilføje opgaver, der afspejler den enkelte brugers særlige brug af produktet.

Mulighed for at undersøge komplekse emner, da man kan uddybe opgaver, som brugeren ikke umiddelbart forstår.

Der er således tale om en meget fleksibel evalueringsform, der kan fange ekstra oplysninger, hvis muligheden viser sig.

Spørgsmålene formuleres én gang for alle, og er derfor ens for samtlige brugere.

Spørgsmålene bør ikke være alt for komplicerede, da der ikke er mulighed for at hjælpe brugerne, hvis de ikke forstår et spørgsmål.

Ingen indblik i hvordan den enkelte respondent fortolker spørgsmålene. Det samme spørgsmål kan således blive forstået forskelligt. Problemet kan dog imødegås ved at foretage pilottest af spørgeskemaet.

Usability-test Spørgeskemaundersøgelse
Hvilke faktorer påvirker brugerens svar?
  • Brugerne er ikke anonyme. Da mange brugere ikke ønsker at fremstå "usympatiske", vil flere prøve at finde ud af, hvilke svar testlederen gerne vil have. For at imødegå "interviewereffekt" er det derfor vigtigt at fokusere på observationen af brugerens faktiske handlinger frem for på deres mundtlige udsagn.
  • Det at man bliver observeret, kan få brugeren til at handle anderledes. Fx bruge længere tid på at få en funktion til at fungere, end han normalt ville være indstillet på at bruge.
  • Tænke-højt metoden fordrer, at brugeren løbende forklarer sine handlinger. Selve det at beskrive, hvad man laver, kan ændre ens måde at gøre tingene på.
  • Brugerne oplever en høj grad af anonymitet. De vil derfor normalt være villige til at afgive meget private eller fortrolige oplysninger.
  • I denne type undersøgelser er man nødt til at spørge eksplicit til alle ting - man kan ikke observere, om brugerne rent faktisk har opdaget bestemte funktioner.
  • Undersøgelsesresultater kan blive påvirkede af den præcise formulering af spørgsmål samt de alternativer, man kan vælge imellem.
Usability-test Spørgeskemaundersøgelse
Hvornår i udviklingsprocessen? Kan afvikles fra den første prototype findes, til det færdige produkt står klar. Jo tidligere, der gennemføres test, des større positive bidrag til udviklingsprocessen.

Forudsætter et færdigt produkt, som brugerne har prøvet at anvende i deres dagligdag.

Kan være til gavn som optakt til videreudvikling af et eksisterende produkt.

Usability-test Spørgeskemaundersøgelse
Økonomisk vurdering Vurderes normalt som en mere tidskrævende og dermed dyrere måde at indsamle information på. Vurderes generelt som en mere enkel metode og dermed den hurtigste og mindst dyre måde at indsamle data på.

Som skemaet viser, er de to metoder overordentligt forskellige og bør ikke betragtes som alternativer, man frit kan vælge imellem: Valg af metode afhænger af, hvilken type svar man har brug for. Hvis man mangler input til en designproces - hvad enten det drejer sig om videreudvikling af eksisterende produkt eller udvikling af et nyt - er usability-test absolut den bedste løsning, idet man kan gå i detaljer med opbygning af grænsefladen. Har man brug for at finde ud af, hvad brugerne generelt mener om ens produkt samt få overblik over, hvad de bruger produktet til, er spørgeskemaundersøgelse det rigtige valg.

Om Grundlæggende principper bag de to metoder

Nyhedsbrev

Tilmeld dig til IT-temaets nyhedsbrev



 

Artikler af

Julia Gardner
 (11/07 2007)

 

At kombinere usability-test og spørgeskemaundersøgelse

Dette afsnit sammenfatter de praktiske erfaringer med at kombinere usability-test og spørgeskemaundersøgelse. Den overordnede konklusion er, at det giver store fordele at benytte mere end én metode: de to tilgange til brugerundersøgelse giver hvert sit perspektiv på data, og man kan ikke sige, at det ene verdensbillede er mere sandt eller dækkende end det andet.

  • Rækkefølgen på de to aktiviteter er vigtig
    Det anbefales klart, at man udfører usability-test først, hvis man planlægger både test og spørgeskemaundersøgelse. Det skyldes flere ting:
    1. Usability-test giver indblik i brugernes ordbrug mv. Med det som udgangspunkt kan man nemmere formulere forståelige spørgeskemaspørgsmål.
      Eksempel: Usability-testen viste, at mange brugere havde svært ved at bruge en central funktion på hjemmesiden, der forudsætter, at brugeren markerer, hvilken branche han arbejder indenfor. Listen over brancher gav simpelthen ikke mening for brugerne. Fordi dette problem var kendt på forhånd, undlod vi i spørgeskemaet at spørge til branchetilhørsforhold. I stedet indgik der en afkrydsningsliste, hvor brugerne kunne vælge deres speciale direkte uden at tænke på, hvilken branche det hørte til i.
    2. Man kan bruge spørgeskemaet til at undersøge, om konklusionerne fra usability-testen holder, når der inddrages en langt større, mere forskelligartet gruppe brugere. Dermed kan begrænsede kvalitative data, understøttes af omfattende kvantitative resultater.
      Eksempel: Usability-testen viste, at flere brugere havde svært ved at foretage søgninger på hjemmesiden. Denne problemstilling understøttes efterfølgende af statistikken, hvor 1/3 af brugerne angiver, at de har problemer med at betjene denne funktion.
    3. De svar, der kommer ud af spørgeskemaundersøgelsen, kan være svære at fortolke, hvis man ikke har konkret indsigt i brugernes adfærd fra testen.
      Eksempel: Det fremgår af resultaterne af spørgeskemaundersøgelsen, at 1/3 af brugerne har svært ved at bruge den særlige søgefunktion i systemet. Men man kan ikke ud af dette tal se, hvorfor det er svært at søge. Det kan man imidlertid redegøre for på baggrund af usability-testen, som identificerede tre forskellige, meget grundlæggende problemer med søgeinterfacet.
  • Der er forskel på resultaterne af de to undersøgelser
    I den konkrete undersøgelse viste forskellene sig på to punkter:
    1. De resultater, der kom ud af usability-testen, er meget fokuserede på betjening af hjemmesiden. Rapporten rummer således en række anbefalinger til funktioner, der med fordel kan justeres for at sikre en problemfri betjening af hjemmesiden.
      Det vigtigste resultat af spørgeskemaundersøgelsen var at skabe fokus på selve dataindholdet på hjemmesiden. Brugerne beklager, at de ting andre brugere har lagt ind i systemet, ikke er af tilstrækkelig høj kvalitet. Dette påvirker deres samlede vurdering af, hvorvidt hjemmesiden er et effektivt værktøj. 
      Denne bemærkelsesværdige forskel i resultatet kan skyldes, at testopgaver er opbygget med fokus på betjening af funktioner og navigation generelt. Selvom testlederen opfordrer test-personen til at give sig tid til at læse indholdet på skærmen, vil denne altid føle et vist pres for at skynde sig. Dermed kommer netop indholdet af de enkelte sider mindre i fokus.
    2. Spørgeskemaundersøgelsen giver et bedre indblik i holdninger, end usability-testen gør.
      Både test og spørgeskemaundersøgelse blev gennemført med aktive brugere af hjemmesiden, dvs. personer der havde været logget på hjemmesiden inden for den sidste måned. I forbindelse med usability-testene anførte testpersonerne, at de var interesserede i at bruge hjemmesiden, fordi den er et målrettet og gratis redskab. Selvom de ikke lagde skjul på, at de også benyttede sig af andre hjælpemidler, kan man konkludere, at de havde en positiv vurdering af hjemmesidens potentiale. Langt værre ser det ud, når man kigger på statistikken fra spørgeskemaundersøgelsen: her kan man konstatere, at den ene type af brugere stort set afskriver hjemmesiden som et væsentligt redskab, idet kun 16% betragter den som deres første prioritet.
      Måske skyldes denne forskel, at brugerne svarer mere ærligt, når de ikke sidder over for en testleder, der har berøring med den organisation, der har udarbejdet hjemmesiden.
  • Nogle resultater kommunikerer bedre end andre
    Tal er mere troværdige og på mange måder nemmere at huske. Det virker simpelthen mere overbevisende at sige "1/3 af alle brugere har problemer med søgefunktionen" end at sige, "en del af de 11 brugere, der deltog i testen, havde svært ved at bruge søgefunktionen" [4]. Spørgeskemaundersøgelser kan normalt generaliseres: man har en større sikkerhed for, at konklusionerne formentlig gælder alle brugere. Ved at kunne læne sig op ad statistikken bliver kvalitativ data pludselig langt nemmere at formidle; når de to metoder kombineres, sendes et signal om autoritet, som det er svært at modsige.
 

Noter og links

  1. Dette afsnit bygger på følgende baggrundslitteratur:
    - Alab Dix et.al "Human-computer interaction", Prentice Hall Europe,1998, s. 406-441.
    - Kursusmateriale udarbejdet af UNI•C Statistik & Analyse
    - R. Gunnarson, Göteborg University - Research methodology web site: http://infovoice.se/fou
  2. Se Jakob Nielsen artikel: Why you only need to test with 5 users
  3. En almindelig måde at foretage korrektion for skævheder i det indsamlede datamateriale er at sammenligne fordelingen på centrale baggrundsvariable med den kendte fordeling i populationen og herefter korrigere for bortfaldet.
  4. Det skal dog understreges, at man ikke ved, om antallet af brugere, der har problemer, måske er større end 1/3. Dels er der måske brugere, der har glemt, at de har haft problemer, dels er der brugere, der slet ikke har opdaget, at de har fejlbetjent søgefunktionen.