2018-03-06

Undersökningar syftar oftast till att undersöka hur en eller flera variabler påverkar en annan. Därav blir första steget att i denna matris utläsa vilken som är variabeln som påverkas, d.v.s. den beroende.

 

semuppgift

 

 

Den årliga boendekostnad är den beroende variabeln, y.

De oberoende variablerna är ålder, x₁ och antal i hushållet, x₂

Hur påverkas boendekostnad y av ålder, x₁ och antal i hushållet, x₂ ?

Korrelationsmatrisen ser ut enligt följande:

Generellt gäller att N = 793 deltagare i undersökningen, varav en verkar inte velat uppge sin ålder, och att korrelation finns mellan & x₁ & x₂ enligt sig. (2-tailed) = .000 

De rödmarkerade värdena är de mest intressanta korrelationerna i matrisen.

Korrelation

a, B:  y påverkas med en negativ korrelationskoefficient mycket svagt (<0,25; Stukat 1993, sid 57) av x₁. Detta innebär att den årliga boendekostnaden påverkas mycket svagt av ålder men att ett visst samband ses mellan lägre ålder och hög boendekostnad eller att hög ålder har en lägre boendekostnad, vilket är troligare än det första.

 

a, C: påverkas med en positiv korrelationskoefficient ganska svagt (0,25-0,50; Stukat 1993, sid 57) av x₂. Detta innebär att den årliga boendekostnaden påverkas ganska svagt av antalet i hushållet, vilket i klartext betyder att fler personer i hushållet till leder till högre boendekostnad om än inte i ett helt linjär samband.

 
c, B: Två oberoende variabler som har ett lite o-relevant samband med en negativ korrelationskoefficient där x₁ har en mycket svag korrelation (<0,25; Stukat 1993, sid 57) med x₂. Detta innebär att i en mycket svagt korrelation så gäller att i låg ålder är det fler personer i hushållet än i hög ålder. Det troliga är att sambandet varierar likt en sinuskurva där man först är barn i en familj som växer upp och sen krymper i och med att barnen flyttar hemifrån, följt av några år som ensamstående innan man själv börja bygga upp en familj som sedan krymper. De sista 20-25 pensionsåren lever man två eller själv i hushållet vilket gör att sinuskurvan rätas ut och det är anledningen till att den negativa korrelationskoefficienten uppstår.

 

 

Jag gjorde en egen uppskattning om hur det kan tänkas se ut i ”verkligheten ” där jag försökte få fram grafer som beskriver hur sambanden varierar för variablerna. Givetvis gissade jag inte värden för samtliga 793 individer utan uppskattade vad jag tror skulle vara ett genomsnitt, för att med grafer & miniräknare kunna få en tydligare bild av och förstå varför korrelationerna ser ut som de gör. Framför allt sambandet mellan ålder och boendekostnad där högst boendekostnad fås vid lägst ålder enligt matrisen.

Först gjordes en polynomregression och redan utifrån den syntes hur den linjära regressionen skulle bli. Den linjära regressionen stämde sedan överens med korrelationsmatrisen och den tillsammans förklarade regressionerna varför det är en negativ korrelationen mellan boendekostnad och ålder.

Ålder

Antal

Ålder - Antal

Den verkliga undersökningen

Statistiksem