Econstudentlog

Health and happiness in the US

Via Will Wilkinson, I came across this map:

0311-economix-well-being-map

Two remarks:

a) As Wilkinson demonstrates, there’s a positive correlation between income and wellbeing (Willkinson uses the words money and happiness, I’m not sure that’s correct given the way the data is defined).

b) The inter-state variation is relatively low; every single one of the states fit into an interval (from 61.2 to 69.2) that is less than a tenth the size of the scale used.

March 12, 2009 - Posted by | data, demographics, economics

4 Comments »

  1. Men det er jo gennemsnitstal. Hvad med variationen indenfor de enkelte stater; Kunne man ikke forstille sig at uligheden i nogle stater er så stor at det næsten ikke giver mening med blot et tal.
    Der er trods alt betydelige forskelle mellem f.eks. de forskellige “racer” situation.

    Comment by Superman | March 13, 2009 | Reply

  2. @Superman:

    Selvfølgelig er det ikke anderledes her, end det altid er, når man arbejder med aggregerede data. Jo, man “kunne godt forestille sig” at der var stater, hvor der var så stor intern variation specifikke grupper imellem, at det ville være misvisende kun at anvende et tal. Det er utvivlsomt tilfældet, jeg tror ikke du kan finde nogen hjemløse noget sted i USA, der mener deres “wellbeing-indeks” retteligt befinder sig på en 6-7er ud af 10.

    Når man propper en masse ting sammen i en kasse og blander dem grundigt, er der altid en del detaljer, der går tabt. Jeg synes dog stadig, det er værd at bemærke og spekulere over, at de amerikanske stater ligger så relativt tæt, som de gør. USA er et ekstremt heterogent land, og hvis jeg skulle have gættet på variationen før indekset var udarbejdet, ville jeg have antaget den var betydeligt højere. Mississippi’s BNP/capita er under halvdelen af Delaware’s, men alligevel er de to stater’s wellbeing-index relativt tæt på hinanden, og det er da lidt spøjst. Ville Kroatiens og Frankrigs score på en lignende skala ligge inden for et tilsvarende interval?

    ii) Mht. “race” kan du jo prøve at sammenligne ovenstående kort med dette for at få en meget grov estimator for betydningen af den variabel. Groft sagt er den sorte andel af befolkningen tykkere, ryger mere og den tjener mindre end befolkningen som helhed, og vi ville derfor i udgangspunktet forvente, at stater med høj andel af afro-amerikanere scorede lavere end resten på et indeks som dette. Det synes også generelt set at være tilfældet. Men variationen er ikke så voldsom endda, når vi husker på, hvad der står på akserne.

    Comment by US | March 13, 2009 | Reply

  3. Jeg er med på at det er en sjov/interessant observation at de ligger så relativt tæt.

    Angående den hjemløse. Der vil naturligvis altid være outliers, og enhver normal-fordeling indeholder jo også ekstremer i begge ender. I den slags tilfælde er gennemsnit jo stadig interessant.
    Problemet opstår jo nærmere når vi har at gøre med en sitaution hvor der reelt er to (eller flere) grupper, altså en massiv bund og så en anden gruppe. Altså noget der ikke er normalt fordelt, men nærmere en lille bjergkæde. I den slags tilfælde er det jo ikke blot detaljer der går tabt.
    I en regressions-analyse vil den slags jo være brud på selve regressions-analysens forudsætninger. Man kan ikke bare presse en ret linie gennem et datasæt, hvis der faktisk i stedet er tale om en kurve. Eller jo, det kan man godt, men det er dybt problematisk at tolke på den, da der jo kan være store intervaller hvor man så rammer systematisk skævt.
    Og mit bud ville være at det i nogle stater som Alabaa, Lousiana og Missisippi meget let kunne være tilfældet.

    Comment by Superman | March 14, 2009 | Reply

  4. Superman, heldigvis er intet af det, du siger, nyt for mig. Jeg blogger, jeg skriver ikke akademiske afhandlinger, her, så mange af de caveeats jeg måtte have i baghovedet i en given sammenhæng eller situation, udtrykker jeg normalt ikke eksplicit. For at sige det lige ud; det gider jeg ikke spilde tid med.

    Mht. dine tekniske bemærkninger, ville jeg påpege, at der altså ikke er tale om en regressionsanalyse her, men blot om en simpel beregning af en indekseret variabels gennemsnit på tværs af stater. Jeg antager ikke normalitet (eller i.i.d. el. lignende) nogetsteds, og det behøver man heller ikke for at tolke det jeg gør, på de angivne data. Uanset hvilke underliggende fordelinger, der ligger til grund for datamaterialet, så er variationen på tværs af stater begrænset og indkomst indvirker positivt på staternes score. Et gennemsnit er et gennemsnit, også selvom du ikke har nogen anelse om, hvordan de data, du har udtrukket fra, er fordelt. Det kan i nogle tilfælde være misvisende at anvende, ja, især når man ikke er opmærksom på underliggende variation i data, og det anvendte indeks er et stærkt forsimplet mål for lykke/helbred, og det er i det hele taget alt sammen meget quick and dirty, men sådan er det, og det er lidt bedre end ingenting.

    Jo længere du dykker ned i data, jo flere brud på normalitet vil du få øje på. Vi har været omkring hjemløse og sorte. Hvad med kvinder vs mænd? Evangelister vs. katolikker? Collegeuddannede vs. dropouts? Venstrehåndede vs højrehåndede? (er du bekendt med den centrale grænseværdisætning? Jeg vil antage du er…). Du siger Alabama, Lousiana og Mississippi godt kan ske at ligge under for nogle forhold, der gør tolkningen af disse staters score problematiske. Enig, det er dødproblematisk at analysere og tolke på den slags data. Det er faktisk derfor, jeg er så forsigtig med at konkludere noget som helst, udover at staterne som helhed ligger tæt på hinanden, og at indkomst lader til at indvirke positivt på den realiserede score.

    Stater med store etniske minoriteter er problematiske at tolke på, fordi den interne variation måske er ganske betydelig. Men prøv du at sammeligne bøssers forhold i Massachusetts og Texas, eller ateisternes forhold i DC og Utah. Der findes ingen stater, der ikke har markant intern variation i scoren på tværs af specifikke grupper, men der er stor forskel på, hvilke variable der har indflydelse på den pågældende variation. Ikke alle variationselementer får lige stor opmærksomhed, ligesom det på ingen måde er sikkert, at variationen er lige stor alle steder. Det er den næppe, og derfor fortæller hele denne øvelse med at sammenligne gennemsnit os måske i virkeligheden ikke så meget. Men jeg synes stadig, det er bedre end ingenting.

    Antag for øvrigt, lige som et lille tankeeksperiment her til sidst i forlængelse af sidste del af min forrige kommentar, at alle Mississippis sorte indbyggere (ca. 40%) er meget mere ulykkelige og i langt dårligere helbred, end resten af amerikanerne, og derfor scorer i snit 40 på indekset. For at forklare statens i den sammenhæng relativt høje score, ville du i så fald være nødt til at formode, at resten af Mississippis indbyggere i gennemsnit var markant lykkeligere/i bedre helbred end USA som helhed (omkring 75 eller så). Også selvom de samme mennesker er markant fattigere end amerikanerne i almindelighed, og i øvrigt slås med mange af de samme problemer, som den sorte befolkning i staten gør (hvide og sorte anvender eksempelvis i udgangspunktet det samme sundhedsvæsen). Det er farligt at overse effekter som dem, du påpeger, men det er også farligt at overspille dem, når vi ikke rigtigt har noget konkret at arbejde ud fra.

    Comment by US | March 14, 2009 | Reply


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: