Hoofdstuk 2: Correlatie: Correlatie
Kracht van een lineair verband
Pearson Correlatiecoëfficiënt
Definitie
De Pearson correlatiecoëfficiënt is de gestandaardiseerde vorm van de covariantie.
Op basis van deze correlatiecoëfficiënt kunnen we zowel de richting als de kracht van een lineaire verband tussen twee kwantitatieve variabelen bepalen.
De populatie en steekproef Pearson correlatiecoëfficiënten worden respectievelijk aangeduid met #\rho# en #r#.
Formule
\[r_{\small{X,Y}}=\dfrac{s_{\small{X,Y}}}{s_{\small{X}}s_{\small{Y}}}\]
Interpretatie van de Pearson correcoëfficiënt
De Pearson correlatiecoëfficiënt heeft altijd waarde tussen #-1# en #+1# :
- Als #r=1# dan hebben #X# en #Y# een perfect positieve lineaire relatie.
- Als #r=-1# dan hebben #X# en #Y# een perfect negatieve lineaire relatie.
- Als #r=0# dan zijn #X# en #Y# lineair ongerelateerd.
Het is belangrijk om te onthouden dat de Pearson correlatiecoëfficiënt alleen de richting en kracht van de lineaire relatie tussen twee variabelen meet.
Het gevolg hiervan is dat het vinden van een waarde van #r=0# niet betekent dat de variabelen op geen enkele manier aan elkaar gerelateerd zijn. Het enige wat we op basis van deze waarde kunnen concluderen is dat er geen lineair verband tussen de variabelen bestaat.
Een ander ding om rekening mee te houden is dat de Pearson correlatiecoëfficiënt zeer gevoelig is voor uitschieters. Eén enkele uitschieter kan dus een zeer groot effect hebben op de waarde van de coëfficiënt.
Het spreidingsdiagram hieronder toont een voorbeeld van twee variabelen die een Pearson correlatiecoëfficiënt hebben van #r=0#, maar ondertussen wel een perfecte kwadratische relatie hebben.
\[\text{}\]
Berekening van de Steekproef Covariantie in R
Om de steekproef Pearson Correlatiecoëfficiënt tussen twee variabelen #X# en #Y# te berekenen in R, gebruik je de volgende functie:
cor(x, y)
- x: De numerieke vector met de waardes voor variabele #X#
- y: De numerieke vector met de waardes voor variabele #Y#
omptest.org als je een OMPT examen moet maken.