Determinatiecoefficient Calculator
Bereken R² om regressiemodel fit en verklaarde variantie te meten
Hoe te Gebruiken
- Voer uw X-waarden (onafhankelijke variabele) in gescheiden door spaties, komma's of puntkomma's
- Voer uw Y-waarden (afhankelijke variabele) in gescheiden door spaties, komma's of puntkomma's
- Zorg ervoor dat X- en Y-waarden hetzelfde aantal datapunten hebben
- Klik op bereken om de R²-waarde en interpretatie te zien
- Bekijk de correlatiecoefficient en model fit beoordeling
Wat is R² (Determinatiecoefficient)?
De determinatiecoefficient, aangeduid als R², is een statistische maat die de proportie variantie in de afhankelijke variabele vertegenwoordigt die voorspeld kan worden uit de onafhankelijke variabele(len). Het varieert van 0 tot 1, waarbij 1 perfecte voorspelling aangeeft en 0 geen voorspellende waarde.
R² wordt veel gebruikt in regressieanalyse om te evalueren hoe goed een model bij de geobserveerde data past. Een hogere R²-waarde duidt erop dat een groter deel van de variantie in de afhankelijke variabele verklaard wordt door de onafhankelijke variabele(len).
Interpreteren van R² Waarden
- 0.90 - 1.00: Uitstekende fit - Het model verklaart het grootste deel van de variantie
- 0.70 - 0.89: Goede fit - Het model verklaart een groot deel van de variantie
- 0.50 - 0.69: Matige fit - Het model verklaart ongeveer de helft van de variantie
- 0.30 - 0.49: Zwakke fit - Het model verklaart beperkte variantie
- 0.00 - 0.29: Zeer zwakke fit - Het model heeft weinig verklarende kracht
Let op dat de interpretatie van R² afhangt van de context en het studiegebied. In sommige gebieden zoals sociale wetenschappen zijn lagere R²-waarden gebruikelijk en worden nog steeds als betekenisvol beschouwd.
R² vs. Correlatiecoefficient
Hoewel zowel R² als de correlatiecoefficient (r) de sterkte van relaties meten, hebben ze belangrijke verschillen:
- De correlatiecoefficient (r) varieert van -1 tot +1, en geeft richting en sterkte aan
- R² varieert van 0 tot 1, en vertegenwoordigt de proportie verklaarde variantie
- R² is altijd niet-negatief, terwijl correlatie positief of negatief kan zijn
- R² = r² voor simple lineaire regressie (één onafhankelijke variabele)
Beperkingen van R²
R² heeft flere beperkingen om te overwegen:
- Meer variabelen toevoegen verhoogt altijd R², zelfs als ze niet significant zijn
- R² geeft niet aan of de regressiecoëfficiënten vertekend zijn
- Hoge R² bewijst geen causaliteit tussen variabelen
- R² geeft niet aan of de onafhankelijke variabelen de juiste zijn
- Niet-lineaire relaties kunnen lage R² hebben ondanks sterke associaties
Aangepaste R²
Aangepaste R² is een gemodificeerde versie die rekening houdt met het aantal voorspellers in het model. Het bestraft het toevoegen van onnodige variabelen en kan afnemen wanneer voorspellers de model fit niet verbeteren.
Voor meervoudige regressiemodellen wordt aangepaste R² vaak verkozen boven reguliere R² omdat het een nauwkeurigere beoordeling van model fit biedt bij het vergelijken van modellen met verschillende aantallen voorspellers.
Veelgestelde vragen
- Wat betekent een R² van 0.75?
- Een R² van 0.75 betekent dat 75% van de variantie in de afhankelijke variabele verklaard kan worden door de onafhankelijke variabele(len) in uw model. Dit wordt over het algemeen als een goede fit beschouwd, en duidt erop dat het model een groot deel van de variabiliteit in de data verklaart.
- Kan R² negatief zijn?
- Bij simple lineaire regressie kan R² niet negatief zijn. In sommige gevallen van meervoudige regressie of bij het gebruik van bepaalde schattingsmethoden kan R² echter negatief zijn, wat aangeeft dat het model slechter past dan een horizontale lijn (het gemiddelde van de afhankelijke variabele).
- Wat is het verschil tussen R² en aangepaste R²?
- Aangepaste R² houdt rekening met het aantal voorspellers in het model en bestraft het toevoegen van onnodige variabelen. Terwijl R² altijd toeneemt (of gelijk blijft) wanneer u voorspellers toevoegt, kan aangepaste R² afnemen als de nieuwe voorspellers het model niet voldoende verbeteren.
- Hoeveel datapunten heb ik nodig voor R²?
- Technisch gezien heeft u minimaal 2 datapunten nodig om R² te berekenen, maar voor betekenisvolle resultaten heeft u er veel meer nodig. Het minimum aantal hangt af van uw vakgebied en de complexiteit van uw model, maar over het algemeen worden 10-20+ observaties per voorspeller aanbevolen.
- Is een hogere R² altijd beter?
- Niet per se. Hoewel een hogere R² meer verklaarde variantie aangeeft, moet u de context, het studiegebied en of het model over-fitted is, overwegen. Soms is een eenvoudiger model met iets lagere R² nuttiger en generaliseerbaarder dan een complex model met hogere R².