Usability-test vs. spørgeskemaundersøgelser
Resumé
Af Julia Gardner, UNI•C Usability01/01 2007
Usability-test og spørgeskemaundersøgelser af hjemmesider har et fælles sigte: at skaffe viden om brugerne. Men det er forskellige typer af oplysninger, man får frem vha. de to metoder, så det er ikke ligegyldigt hvilken en af dem, man benytter. Hvilken metode, man skal vælge, afhænger af, hvad man skal bruge resultaterne til.
Denne artikel tager udgangspunkt i en konkret undersøgelse af en hjemmeside. Undersøgelsen blev gennemført i forsommeren 2005 og byggede på en usability-test og en spørgeskemaundersøgelse. Der blev anvendt to forskellige metoder ud fra et ønske om at få et dækkende billede af brugernes adfærd og ønsker.
Undersøgelsen havde to mål:
1. at finde ud af hvorvidt eksisterende funktioner virker efter hensigten
2. at belyse hvorvidt hjemmesiden rummer det rette indhold, og om brugerne på den baggrund er overordnet tilfredse og betragter hjemmesiden som et centralt værktøj.
Resultaterne skal bruges til videreudvikling af hjemmesiden.
Om Baggrund for artiklen
Nyhedsbrev
Usability-test og spørgeskemaundersøgelser adskiller sig fra hinanden på flere grundlæggende punkter, og det forklarer, hvorfor man opnår meget forskellige resultater ved at benytte de to metoder [1].
| Usability-test | Spørgeskemaundersøgelse | |
| Type |
Kvalitativ undersøgelse. Som udgangspunkt vises åbenhed over for undersøgelsens resultat; man ved ikke på forhånd, hvilken konklusion man vil nå frem til. Resultatet kan være nye perspektiver på et problem. Hensigten er at forsøge at forstå brugernes handlinger og deres tanker. Metoden er baseret på iagttagelser og tolkninger. |
Kvantitativ undersøgelse. I en velplanlagt kvantitativ undersøgelse skal man på forhånd vide, hvilke sandsynlige emneområder, man ønsker at få belyst. Spørgsmål og svarkategorier skal være kendt på forhånd. Metoden er baseret på bearbejdning af talmateriale, som struktureres og analyseres. Der er bl.a. mulighed for at under-søge sammenhængene mellem brugeres svar på forskellige spørgsmål. |
| Usability-test | Spørgeskemaundersøgelse | |
| Resultaternes rækkevidde |
Resultaterne kan til en vis grad overføres på andre brugere, men der vil være en vis usikkerhed vedrørende konklusionernes repræsentativitet. Der er dog lavet eksperimenter der viser, at man skal tale med relativt få brugere for at få overblik over, hvilke problemer der findes i et givent system [2]. |
Resultaterne kan normalt generaliseres: dvs. man kan lave konklusioner om en større gruppe af personer, end dem man har talt med. Det forudsætter dog, at brugerne er udvalgt således, at der ikke forekommer bias. Desuden skal der tages højde for, at de personer, der returnerer spørgeskemaet ofte har et stærkere engagement i undersøgelsens emne [3]. |
| Usability-test | Spørgeskemaundersøgelse | |
| Antal deltagere | Bygger på ganske få brugeres udsagn. | Bygger på mange brugeres respons. |
| Usability-test | Spørgeskemaundersøgelse | |
| Hvad bliver målt? |
Måler faktisk adfærd En testleder observerer brugernes handlinger, imens de udføres, og noterer resultaterne løbende. Alt hvad testlederen holder øje med kan rapporteres, herunder en lang række mindre delobservationer vedrørende elementer der bliver klikket på eller ikke klikket på etc. |
Måler holdninger Selvrapportering på baggrund af det brugeren genkalder sig i forbindelse med udfyldelse af spørgeskemaet. Detaljerede designspørgsmål kan ikke måles af to grunde:
|
| Usability-test | Spørgeskemaundersøgelse | |
| Hvilken type resultater får man? |
Kan give uhyre detaljerede oplysninger vedrørende design af specifikke elementer i grænsefladen. Samtidig skaffes også generel information om brugernes holdninger via det afsluttende interview, der afrunder hver enkelt testsession. |
Overordnet information om brugerens indtryk af systemet. Svarene falder inden for de forudbestemte svarkategorier. Svar i fritekstfelter kan dog bidrage med indsigt i nye problemstillinger, som der ikke er blevet spurgt til i de faste spørgsmål. |
| Usability-test | Spørgeskemaundersøgelse | |
| Tidsforbrug for brugeren | En test varer normalt mindst en time. | Et spørgeskema bør ikke tage mange minutter at udfylde: respondenterne føler sig mindre forpligtede end til en test. |
| Usability-test | Spørgeskemaundersøgelse | |
| Hvor befinder brugeren sig? |
Brugeren befinder sig i sine egne omgivelser, hvis testen gennemføres i konteksten. Typisk gennemføres test dog i et lab eller andre lokaler reserveret til test. |
Ingen viden om hvor brugeren befinder sig. |
| Usability-test | Spørgeskemaundersøgelse | |
| Hvordan forberedes evalueringen? |
Testlederen må sætte sig ind i systemet og på den baggrund formulere interviewguide og testscenarier. Pilottest anbefales som forberedelse. |
Den spørgeskemaansvarlige må sætte sig ind i systemet og på den baggrund udarbejde spørgeskemaet. Spørgeskemaet bør pilottestes for at sikre, at det er forståeligt. |
| Usability-test | Spørgeskemaundersøgelse | |
| Hvor fast ligger evalueringsformen? |
Testscenarier bliver formuleret på forhånd, således at samtlige brugere løser de samme opgaver. Opgavernes formulering kan imidlertid justeres under testen for at sikre brugerens fulde forståelse. Ydermere er der mulighed for at tilføje opgaver, der afspejler den enkelte brugers særlige brug af produktet. Mulighed for at undersøge komplekse emner, da man kan uddybe opgaver, som brugeren ikke umiddelbart forstår. Der er således tale om en meget fleksibel evalueringsform, der kan fange ekstra oplysninger, hvis muligheden viser sig. |
Spørgsmålene formuleres én gang for alle, og er derfor ens for samtlige brugere. Spørgsmålene bør ikke være alt for komplicerede, da der ikke er mulighed for at hjælpe brugerne, hvis de ikke forstår et spørgsmål. Ingen indblik i hvordan den enkelte respondent fortolker spørgsmålene. Det samme spørgsmål kan således blive forstået forskelligt. Problemet kan dog imødegås ved at foretage pilottest af spørgeskemaet. |
| Usability-test | Spørgeskemaundersøgelse | |
| Hvilke faktorer påvirker brugerens svar? |
|
|
| Usability-test | Spørgeskemaundersøgelse | |
| Hvornår i udviklingsprocessen? | Kan afvikles fra den første prototype findes, til det færdige produkt står klar. Jo tidligere, der gennemføres test, des større positive bidrag til udviklingsprocessen. |
Forudsætter et færdigt produkt, som brugerne har prøvet at anvende i deres dagligdag. Kan være til gavn som optakt til videreudvikling af et eksisterende produkt. |
| Usability-test | Spørgeskemaundersøgelse | |
| Økonomisk vurdering | Vurderes normalt som en mere tidskrævende og dermed dyrere måde at indsamle information på. | Vurderes generelt som en mere enkel metode og dermed den hurtigste og mindst dyre måde at indsamle data på. |
Som skemaet viser, er de to metoder overordentligt forskellige og bør ikke betragtes som alternativer, man frit kan vælge imellem: Valg af metode afhænger af, hvilken type svar man har brug for. Hvis man mangler input til en designproces - hvad enten det drejer sig om videreudvikling af eksisterende produkt eller udvikling af et nyt - er usability-test absolut den bedste løsning, idet man kan gå i detaljer med opbygning af grænsefladen. Har man brug for at finde ud af, hvad brugerne generelt mener om ens produkt samt få overblik over, hvad de bruger produktet til, er spørgeskemaundersøgelse det rigtige valg.
Dette afsnit sammenfatter de praktiske erfaringer med at kombinere usability-test og spørgeskemaundersøgelse. Den overordnede konklusion er, at det giver store fordele at benytte mere end én metode: de to tilgange til brugerundersøgelse giver hvert sit perspektiv på data, og man kan ikke sige, at det ene verdensbillede er mere sandt eller dækkende end det andet.
- Rækkefølgen på de to aktiviteter er vigtig
Det anbefales klart, at man udfører usability-test først, hvis man planlægger både test og spørgeskemaundersøgelse. Det skyldes flere ting:- Usability-test giver indblik i brugernes ordbrug mv. Med det som udgangspunkt kan man nemmere formulere forståelige spørgeskemaspørgsmål.
Eksempel: Usability-testen viste, at mange brugere havde svært ved at bruge en central funktion på hjemmesiden, der forudsætter, at brugeren markerer, hvilken branche han arbejder indenfor. Listen over brancher gav simpelthen ikke mening for brugerne. Fordi dette problem var kendt på forhånd, undlod vi i spørgeskemaet at spørge til branchetilhørsforhold. I stedet indgik der en afkrydsningsliste, hvor brugerne kunne vælge deres speciale direkte uden at tænke på, hvilken branche det hørte til i.
- Man kan bruge spørgeskemaet til at undersøge, om konklusionerne fra usability-testen holder, når der inddrages en langt større, mere forskelligartet gruppe brugere. Dermed kan begrænsede kvalitative data, understøttes af omfattende kvantitative resultater.
Eksempel: Usability-testen viste, at flere brugere havde svært ved at foretage søgninger på hjemmesiden. Denne problemstilling understøttes efterfølgende af statistikken, hvor 1/3 af brugerne angiver, at de har problemer med at betjene denne funktion.
- De svar, der kommer ud af spørgeskemaundersøgelsen, kan være svære at fortolke, hvis man ikke har konkret indsigt i brugernes adfærd fra testen.
Eksempel: Det fremgår af resultaterne af spørgeskemaundersøgelsen, at 1/3 af brugerne har svært ved at bruge den særlige søgefunktion i systemet. Men man kan ikke ud af dette tal se, hvorfor det er svært at søge. Det kan man imidlertid redegøre for på baggrund af usability-testen, som identificerede tre forskellige, meget grundlæggende problemer med søgeinterfacet.
- Usability-test giver indblik i brugernes ordbrug mv. Med det som udgangspunkt kan man nemmere formulere forståelige spørgeskemaspørgsmål.
- Der er forskel på resultaterne af de to undersøgelser
I den konkrete undersøgelse viste forskellene sig på to punkter:- De resultater, der kom ud af usability-testen, er meget fokuserede på betjening af hjemmesiden. Rapporten rummer således en række anbefalinger til funktioner, der med fordel kan justeres for at sikre en problemfri betjening af hjemmesiden.
Det vigtigste resultat af spørgeskemaundersøgelsen var at skabe fokus på selve dataindholdet på hjemmesiden. Brugerne beklager, at de ting andre brugere har lagt ind i systemet, ikke er af tilstrækkelig høj kvalitet. Dette påvirker deres samlede vurdering af, hvorvidt hjemmesiden er et effektivt værktøj.
Denne bemærkelsesværdige forskel i resultatet kan skyldes, at testopgaver er opbygget med fokus på betjening af funktioner og navigation generelt. Selvom testlederen opfordrer test-personen til at give sig tid til at læse indholdet på skærmen, vil denne altid føle et vist pres for at skynde sig. Dermed kommer netop indholdet af de enkelte sider mindre i fokus.
- Spørgeskemaundersøgelsen giver et bedre indblik i holdninger, end usability-testen gør.
Både test og spørgeskemaundersøgelse blev gennemført med aktive brugere af hjemmesiden, dvs. personer der havde været logget på hjemmesiden inden for den sidste måned. I forbindelse med usability-testene anførte testpersonerne, at de var interesserede i at bruge hjemmesiden, fordi den er et målrettet og gratis redskab. Selvom de ikke lagde skjul på, at de også benyttede sig af andre hjælpemidler, kan man konkludere, at de havde en positiv vurdering af hjemmesidens potentiale. Langt værre ser det ud, når man kigger på statistikken fra spørgeskemaundersøgelsen: her kan man konstatere, at den ene type af brugere stort set afskriver hjemmesiden som et væsentligt redskab, idet kun 16% betragter den som deres første prioritet.
Måske skyldes denne forskel, at brugerne svarer mere ærligt, når de ikke sidder over for en testleder, der har berøring med den organisation, der har udarbejdet hjemmesiden.
- De resultater, der kom ud af usability-testen, er meget fokuserede på betjening af hjemmesiden. Rapporten rummer således en række anbefalinger til funktioner, der med fordel kan justeres for at sikre en problemfri betjening af hjemmesiden.
- Nogle resultater kommunikerer bedre end andre
Tal er mere troværdige og på mange måder nemmere at huske. Det virker simpelthen mere overbevisende at sige "1/3 af alle brugere har problemer med søgefunktionen" end at sige, "en del af de 11 brugere, der deltog i testen, havde svært ved at bruge søgefunktionen" [4]. Spørgeskemaundersøgelser kan normalt generaliseres: man har en større sikkerhed for, at konklusionerne formentlig gælder alle brugere. Ved at kunne læne sig op ad statistikken bliver kvalitativ data pludselig langt nemmere at formidle; når de to metoder kombineres, sendes et signal om autoritet, som det er svært at modsige.
-
Dette afsnit bygger på følgende baggrundslitteratur:
- Alab Dix et.al "Human-computer interaction", Prentice Hall Europe,1998, s. 406-441.
- Kursusmateriale udarbejdet af UNI•C Statistik & Analyse
- R. Gunnarson, Göteborg University - Research methodology web site: http://infovoice.se/fou
-
Se Jakob Nielsen artikel: Why you only need to test with 5 users
-
En almindelig måde at foretage korrektion for skævheder i det indsamlede datamateriale er at sammenligne fordelingen på centrale baggrundsvariable med den kendte fordeling i populationen og herefter korrigere for bortfaldet.
-
Det skal dog understreges, at man ikke ved, om antallet af brugere, der har problemer, måske er større end 1/3. Dels er der måske brugere, der har glemt, at de har haft problemer, dels er der brugere, der slet ikke har opdaget, at de har fejlbetjent søgefunktionen.

Udskriv…
Hjælp til udskrift
Om…
Nyhedsbrev
Sitemap
Teknik
Skriv til
RSS
Søg
