Hoppa till huvudinnehåll

Determinationskoefficient Kalkylator

Beräkna R² för att mäta regressionsmodell-passning och förklarad varians

Beräkna R²

Separera värden med mellanslag, kommatecken eller semikolon

Separera värden med mellanslag, kommatecken eller semikolon

Hur man Använder

  1. Ange dina X-värden (oberoende variabel) separerade med mellanslag, kommatecken eller semikolon
  2. Ange dina Y-värden (beroende variabel) separerade med mellanslag, kommatecken eller semikolon
  3. Se till att X- och Y-värden har samma antal datapunkter
  4. Klicka på beräkna för att se R²-värdet och tolkningen
  5. Granska korrelationskoefficienten och modellpassningsbedömningen

Vad är R² (Determinationskoefficient)?

Determinationskoefficienten, betecknad R², är ett statistiskt mått som representerar proportionen av varians i den beroende variabeln som kan förutsägas från den/den oberoende variabeln/variablerna. Den varierar från 0 till 1, där 1 indikerar perfekt förutsägelse och 0 indikerar inget förutsägelsevärde.

R² används vanligtvis i regressionsanalys för att utvärdera hur väl en modell passar till observerade data. Ett högre R²-värde indikerar att en större proportion av variansen i den beroende variabeln förklaras av den/den oberoende variabeln/variablerna.

Tolkning av R² Värden

  • 0.90 - 1.00: Utmärkt passning - Modellen förklarar det mesta av variansen
  • 0.70 - 0.89: Bra passning - Modellen förklarar en stor del av variansen
  • 0.50 - 0.69: Måttlig passning - Modellen förklarar ungefär hälften av variansen
  • 0.30 - 0.49: Svag passning - Modellen förklarar begränsad varians
  • 0.00 - 0.29: Mycket svag passning - Modellen har liten förklarande kraft

Observera att tolkningen av R² beror på kontexten och studieområde. I vissa områden som samhällsvetenskaper är lägre R²-värden vanliga och anses fortfarande meningsfulla.

R² vs. Korrelationskoefficient

Även om både R² och korrelationskoefficienten (r) mäter styrkan i relationer, har de viktiga skillnader:

  • Korrelationskoefficienten (r) varierar från -1 till +1 och indikerar riktning och styrka
  • R² varierar från 0 till 1 och representerar proportionen av förklarad varians
  • R² är alltid icke-negativ, medan korrelation kan vara positiv eller negativ
  • R² = r² för enkel linjär regression (en oberoende variabel)

Begränsningar av R²

R² har flera begränsningar att överväga:

  • Att lägga till fler variabler ökar alltid R², även om de inte är meningsfulla
  • R² indikerar inte om regressionskoefficienterna är biased
  • Hög R² bevisar inte kausalitet mellan variabler
  • R² indikerar inte om de oberoende variablerna är de rätta
  • Icke-linjära relationer kan ha lågt R² trots starka associationer

Justerat R²

Justerat R² är en modifierad version som tar hänsyn till antalet prediktorer i modellen. Det straffar tillägg av onödiga variabler och kan minska när prediktorer inte förbättrar modellpassningen.

För multipel regressionsmodeller föredras ofta justerat R² framför reguljärt R² eftersom det ger en mer korrekt bedömning av modellpassning när man jämför modeller med olika antal prediktorer.

Vanliga frågor

Vad betyder ett R² på 0.75?
Ett R² på 0.75 betyder att 75% av variansen i den beroende variabeln kan förklaras av den/den oberoende variabeln/variablerna i din modell. Detta anses generellt vara en bra passning och indikerar att modellen förklarar en stor del av variabiliteten i datan.
Kan R² vara negativt?
Vid enkel linjär regression kan R² inte vara negativt. Men i vissa fall av multipel regression eller vid användning av vissa skattningsmetoder kan R² vara negativt, vilket indikerar att modellen passar sämre än en horisontell linje (medelvärdet av den beroende variabeln).
Vad är skillnaden mellan R² och justerat R²?
Justerat R² tar hänsyn till antalet prediktorer i modellen och straffar tillägg av onödiga variabler. Medan R² alltid ökar (eller förblir samma) när du lägger till prediktorer, kan justerat R² minska om de nya prediktorerna inte tillräckligt förbättrar modellen.
Hur många datapunkter behöver jag för R²?
Tekniskt sett behöver du minst 2 datapunkter för att beräkna R², men för meningsfulla resultat bör du ha många fler. Minsta antalet beror på ditt område och komplexiteten i din modell, men generellt rekommenderas 10-20+ observationer per prediktor.
Är ett högre R² alltid bättre?
Inte nödvändigtvis. Även om ett högre R² indikerar mer förklarad varians, bör du överväga kontexten, studieområdet och om modellen är överanpassad. Ibland är en enklare modell med något lägre R² mer användbar och generaliserbar än en komplex modell med högre R².