Kapitel 14 Presentation av dataset

14.1 NTU 2017-2021

Datasetet NTU 2017-2021.SAV innehåller fem årgångar av NTU och består sammanlagt av 375 590 respondenter. Samtliga individer är anonymiserade vilket innebär att det ej går att härleda vem som förekommer i datamaterialet. Vilka variabler som finns i datamaterialet och hur varje variabel är kodad går att se i kodboken för datamaterialet som ni finner i Athena. Detta dokument är viktigt att nyttja i samband med att ni använder datasetet då det inte alltid framgår vad varje variabel betyder och vad dess värden innebär.

Datasetet finns i två versioner: en stor fil innehållande alla fem årgårdar alternativt uppdelade årgångar så att varje dataset innehåller enbart en årgång.

Närmare information om urval, datainsamling, frågekonstruktion, kodning och annat relevant återfinns i den tekniska rapporten för NTU 2021 som ni finner här.

14.2 NTU 2013-2015

Datafilen ”NTU 2013-15.sav” är en SPSS fil som rymmer tre hela årgångar av NTU, sammanlagt 37 118 observationer (personer som besvarat frågorna). Det går inte att identifiera vilket av de tre åren som respektive person ingått i undersökningen, varför datamaterialet behandlas som en tvärsnittsundersökning (NTU 2013-15). Frågorna som förekommer i detta dataset skiljer sig till viss del från datasetet NTU 2017-2021.

Närmare information om urval, datainsamling, frågekonstruktion, kodning mm återfinns i den tekniska rapporten för NTU 2015 som ni finner här.

För att arbeta med NTU datamaterialet behöver ni hjälp av information från den tekniska rapporten, exempelvis ser ni där hur frågor och svarsalternativ är utformade. Utifrån variabelnamnen i datafilen går det att identifiera frågorna i frågeformuläret.

Exempel:

I datafilen finns en variabel som heter C6, av variabelns label (etikett) framgår att den rör cykelbrott: ”Cykelstöld_CY_C6”. Att frågan rör cykelstöld är tydligt, men vilken av alla frågor som rör cykelstöld? Genom att frågenumret i frågeformuläret anges i variabeländelsen, i exemplet ”C6”, kan vi koppla till frågeformuläret i den tekniska rapporten (Brå 2016, bilaga 1, sid 5):

Ni har enbart tillgång till vissa frågor i NTU – bakgrundsfrågor om t.ex. ålder och kön samt frågor om utsatthet för brott, oro för brott och förtroende för rättsväsendet.

14.3 Skolundersökning 2005

Datafilen ”Skol05.sav” är en SPSS fil med data från Brottsförebyggande rådets skolundersökning om brott från 2005 (SUB2005). Undersökningen rymmer ursprungligen 7449 observationer (deltagande elever), ni har dock ett slumpurval av hälften av de svarande (3724 elever). Ni har tillgång till de flesta frågor som ingick i studien, tex om egen brottslighet och utsatthet för brott (totalt rör det sig om cirka 190 variabler).

Närmare information om urval, bortfall, datainsamling, frågekonstruktion, kodning mm återfinns i den tekniska rapporten för SUB 2005 som ni finner här.

För att arbeta med skolundersökningen behöver ni hjälp av information från den tekniska rapporten, exempelvis ser ni där hur frågor och svarsalternativ är utformade. Utifrån variabelnamn och label i datafilen går det enkelt att identifiera frågorna, för deras exakta lydelse får ni dock gå till den tekniska rapporten.

14.4 Glass och brott

Inte sällan inom samhällsvetenskapen brukar det faktum att korrelation inte nödvändigtvis innebär att det finns ett orsakssamband exemplefieras med hjälp av sambandet mellan glassförsäljning och brott. Ju fler glassar som sälj under en dag desto fler brott brukar i regel anmälas. Detta samband är dock ett skensamband efters det finns en bakomliggand variabel som orsakar både fler sålda glassar och fler polisanmälda brott: temperatur.

Ett fiktivt (!) datasetet (ice_cream.sav) har skapats för att vidare undersöka detta samband. Datasetet innehåller 60 dagar och som ska representera två sommarmånader. Varje dag innehåller information om hur många brott som polisanmäts, hur många celcius som uppmättes under dagen och om det förekom regn under dagen.

13 Bearbeta tabeller och figurer