Determinationskoefficient Kalkylator
Beräkna R² för att mäta regressionsmodell-passning och förklarad varians
Hur man Använder
- Ange dina X-värden (oberoende variabel) separerade med mellanslag, kommatecken eller semikolon
- Ange dina Y-värden (beroende variabel) separerade med mellanslag, kommatecken eller semikolon
- Se till att X- och Y-värden har samma antal datapunkter
- Klicka på beräkna för att se R²-värdet och tolkningen
- Granska korrelationskoefficienten och modellpassningsbedömningen
Vad är R² (Determinationskoefficient)?
Determinationskoefficienten, betecknad R², är ett statistiskt mått som representerar proportionen av varians i den beroende variabeln som kan förutsägas från den/den oberoende variabeln/variablerna. Den varierar från 0 till 1, där 1 indikerar perfekt förutsägelse och 0 indikerar inget förutsägelsevärde.
R² används vanligtvis i regressionsanalys för att utvärdera hur väl en modell passar till observerade data. Ett högre R²-värde indikerar att en större proportion av variansen i den beroende variabeln förklaras av den/den oberoende variabeln/variablerna.
Tolkning av R² Värden
- 0.90 - 1.00: Utmärkt passning - Modellen förklarar det mesta av variansen
- 0.70 - 0.89: Bra passning - Modellen förklarar en stor del av variansen
- 0.50 - 0.69: Måttlig passning - Modellen förklarar ungefär hälften av variansen
- 0.30 - 0.49: Svag passning - Modellen förklarar begränsad varians
- 0.00 - 0.29: Mycket svag passning - Modellen har liten förklarande kraft
Observera att tolkningen av R² beror på kontexten och studieområde. I vissa områden som samhällsvetenskaper är lägre R²-värden vanliga och anses fortfarande meningsfulla.
R² vs. Korrelationskoefficient
Även om både R² och korrelationskoefficienten (r) mäter styrkan i relationer, har de viktiga skillnader:
- Korrelationskoefficienten (r) varierar från -1 till +1 och indikerar riktning och styrka
- R² varierar från 0 till 1 och representerar proportionen av förklarad varians
- R² är alltid icke-negativ, medan korrelation kan vara positiv eller negativ
- R² = r² för enkel linjär regression (en oberoende variabel)
Begränsningar av R²
R² har flera begränsningar att överväga:
- Att lägga till fler variabler ökar alltid R², även om de inte är meningsfulla
- R² indikerar inte om regressionskoefficienterna är biased
- Hög R² bevisar inte kausalitet mellan variabler
- R² indikerar inte om de oberoende variablerna är de rätta
- Icke-linjära relationer kan ha lågt R² trots starka associationer
Justerat R²
Justerat R² är en modifierad version som tar hänsyn till antalet prediktorer i modellen. Det straffar tillägg av onödiga variabler och kan minska när prediktorer inte förbättrar modellpassningen.
För multipel regressionsmodeller föredras ofta justerat R² framför reguljärt R² eftersom det ger en mer korrekt bedömning av modellpassning när man jämför modeller med olika antal prediktorer.
Vanliga frågor
- Vad betyder ett R² på 0.75?
- Ett R² på 0.75 betyder att 75% av variansen i den beroende variabeln kan förklaras av den/den oberoende variabeln/variablerna i din modell. Detta anses generellt vara en bra passning och indikerar att modellen förklarar en stor del av variabiliteten i datan.
- Kan R² vara negativt?
- Vid enkel linjär regression kan R² inte vara negativt. Men i vissa fall av multipel regression eller vid användning av vissa skattningsmetoder kan R² vara negativt, vilket indikerar att modellen passar sämre än en horisontell linje (medelvärdet av den beroende variabeln).
- Vad är skillnaden mellan R² och justerat R²?
- Justerat R² tar hänsyn till antalet prediktorer i modellen och straffar tillägg av onödiga variabler. Medan R² alltid ökar (eller förblir samma) när du lägger till prediktorer, kan justerat R² minska om de nya prediktorerna inte tillräckligt förbättrar modellen.
- Hur många datapunkter behöver jag för R²?
- Tekniskt sett behöver du minst 2 datapunkter för att beräkna R², men för meningsfulla resultat bör du ha många fler. Minsta antalet beror på ditt område och komplexiteten i din modell, men generellt rekommenderas 10-20+ observationer per prediktor.
- Är ett högre R² alltid bättre?
- Inte nödvändigtvis. Även om ett högre R² indikerar mer förklarad varians, bör du överväga kontexten, studieområdet och om modellen är överanpassad. Ibland är en enklare modell med något lägre R² mer användbar och generaliserbar än en komplex modell med högre R².