Spreidingsmaten en visualisatie
Een boxplot toont de verdeling van kwantitatieve data visueel. De spreidingsbreedte is het verschil tussen grootste en kleinste waarneming. De interkwartielafstand Q3−Q1 geeft de breedte van de box weer.
Spreidingsmaten drukken uit hoe verspreid je data is. De standaarddeviatie (σ) is de meest gebruikte maat. Je berekent deze door: het gemiddelde bepalen, voor elk getal het verschil met het gemiddelde kwadrateren, alle kwadraten optellen, delen door het aantal getallen en daarvan de wortel nemen.
Om conclusies te trekken over verschillen tussen groepen gebruik je associatiematen. Voor twee nominale variabelen gebruik je de Phi-coëfficiënt: φ = |ad-bc|/√(a+b)(c+d)(a+c)(b+d).
Vuistregel Phi-coëfficiënt: φ > 0.4 = groot verschil, 0.2 < φ ≤ 0.4 = middelmatig verschil, φ ≤ 0.2 = gering verschil.
Bij ordinale variabelen gebruik je Max VCP (maximaal verschil in cumulatief percentage). Je berekent eerst voor beide groepen de cumulatieve frequenties, dan de relatieve cumulatieve frequenties, en tenslotte het grootste verschil tussen de percentages.