Hoofdstuk 1: Beschrijvende statistiek: Typen data en metingen
Kwalitatieve en kwantitatieve variabelen
Voordat we beginnen met de analyse van een dataset, is het belangrijk om eerst stil te staan bij het soort data dat we voor ons hebben. Afhankelijk van het type data kunnen verschillende statistische technieken worden toegepast om de dataset te beschrijven en te analyseren. Het is daarom essentieel om verschillende typen data juist te kunnen identificeren.
Binnen de statistiek maken we in eerste instantie onderscheid tussen twee typen variabelen: kwalitatieve en kwantitatieve variabelen.
Kwalitatieve variabele
Definitie
Een kwalitatieve variabele is niet-numeriek of categorisch van aard. Dit houdt in dat namen of labels worden gebruikt om waarnemingen te classificeren in verschillende categorieën.
Voorbeelden:
- Kleur van de lucht
- Textuur van een shirt
- Favoriete eten
- Geslacht
Vanwege de niet-numerieke aard van kwalitatieve variabelen, mogen er geen wiskundige bewerkingen op dit type variabelen toegepast worden. Hierdoor is het aantal statistische technieken dat gebruikt kan worden om kwalitatieve data te beschrijven en te analyseren vrij beperkt.
Een mogelijke valkuil bij het analyseren van kwalitatieve data is dat verbale labels (woorden/letters) vaak gecodeerd worden als numerieke waarden. Een bekend voorbeeld is geslacht, wat vaak wordt gecodeerd met getallen zodat #\text{man} = 1# en #\text{vrouw} = 2# (of vice versa). Het is belangrijk op te merken dat, ondanks het gebruik van de numerieke waarden om de data te coderen, er geen betekenis mag worden toegeschreven aan deze getallen. Het zou bijvoorbeeld onjuist zijn om te stellen dat, omdat mannen zijn gecodeerd als #1# in de dataset en vrouwen als #2#, vrouwen twee keer zo veel geslacht hebben als mannen.
#\phantom{0}#
Kwantitatieve variabele
Definitie
Een kwantitatieve variabele is numeriek van aard en wordt gemeten door middel van tellen of met behulp van meetinstrumenten.
Voorbeelden:
- De som van twee dobbelstenen
- Aantal leerlingen in een klas
- Gewicht
- Lengte
#\phantom{0}#
Kwantitatieve variabelen kunnen worden onderverdeeld in twee types: discrete en continue variabelen.
#\phantom{0}#
Discrete variabele
Definitie
Een discrete variabele kan ofwel een eindig aantal waarden aannemen, ofwel oneindig veel waarden aanemen die met nummers kunnen worden gelabeld (bijv. #0, 1, 2, 3\ldots# ).
Voorbeelden:
- De som van twee dobbelstenen
- Aantal leerlingen in een klas
- Aantal broers en zussen
- Hoeveelheid kleingeld in je broekzak
#\phantom{0}#
Continue variabele
Definitie
Een continue variabele kan elke waarde aannemen in één of meer intervallen.
De precisie waarmee een continue variabele kan worden uitgedrukt is afhankelijk van de nauwkeurigheid van het meetinstrument dat gebruikt is om de data te verzamelen.
Voorbeelden:
- Gewicht
- Lengte
- Tijd
- Temperatuur
omptest.org als je een OMPT examen moet maken.