Metodehjørnet

I denne spalten tipser vi om artikler og andre ressurser som tar opp metodiske aspekter som er relevante for ernæringsforskning. Spalten er aktuell både for de som forsker selv, og for de som leser og benytter seg av denne forskningen. Temaene vil variere, så her er det noe for de fleste.

Tekst
Vegard Lysne

Redaksjonsmedlem

Thomas Olsen

Redaktør

Ane Sørlie Kværner

Redaktør

Hva bør egentlig inngå i Tabell 1?

I de fleste kliniske og epidemiologiske forskningsstudier finner man en første tabell som beskriver utvalget i studien. Om satt opp på en hensiktsmessig måte kan denne tabellen gi viktig innsikt i studiens interne (risiko for bias) og eksterne (overførbarhet) validitet. Men hvor mye tanke legges egentlig i oppsettet av disse tabellene i utformingen av vitenskapelige artikler? Hvilke variabler bør presenteres i Tabell 1 og på hvilken måte? I en artikkel fra 2019 publisert i American Journal of Epidemiology (1) kommer Eleanor Hayes-Larson og medarbeidere med et sett anbefalinger for hvordan utforme disse tabellene, med utgangspunkt i studiens design og formål, for å gi leseren et best mulig grunnlag for å kritisk vurdere studiens gyldighet. For å ta noen eksempler: I intervensjonsstudier, tverrsnittstudier og prospektive kohortstudier er det gjerne vanlig å presentere populasjonskarakteristika fordelt på strata av eksponeringsvariabelen (for eksempel behandlet vs. ikke behandlet) i Tabell 1. Dette kan gi viktig informasjon om hvorvidt gruppene er like, eller hvilke faktorer som eventuelt er betydelig forskjellige utover den faktoren som studeres, noe som kan påvirke tolkningen av resultatene. I kasus-kontroll studier, der pasienter med og uten utfallsvariabelen velges ut etter sykdommen først er oppstått, er det derimot vanligere å ta utgangspunkt i utfallsvariabelen for stratifisering. Dette vil imidlertid ikke egne seg for å belyse forskjeller mellom eksponerte og ikke-eksponerte, ettersom disse gruppene av flere grunner er forventet å ha ulik fordeling av underliggende årsaker til sykdommen. For å belyse konfunderingsproblematikk i denne sammenheng anbefaler forfatterne at man innad i kontrollgruppen, som representerer referansepopulasjonen, deler materiale ytterligere opp basert på grad av eksponering. Dette gir leseren mulighet til å sammenligne fordelingen av potensielle forskjeller mellom eksponerte og ikke-eksponerte kontroller. Det nevne eksempelet adresserer forhold knyttet til intern validitet. For å vurdere den eksterne validiteten foreslår forfatterne å inkludere en kolonne som representerer målpopulasjonen, dersom data på denne eksisterer. Blant andre relevante temaer som tas opp er valg av variabler, statistiske parametere som bør inngå, ønskelig (eller tilstrekkelig) presisjonsnivå på de inkluderte parameterne, samt hvordan balansere mengde informasjon gitt opp mot lesbarhet. Til å være en ren metodeartikkel er artikkelen lettlest og noe å anbefale enhver som utarbeider eller studerer en Tabell 1.

Lurer du også på hvordan du skal sette opp Tabell 2? Se vår omtale av dette temaet i forrige utgave av NTFE (2).

Rapportering og tolkning av statistiske resultater

Alle som forsker eller leser forskning må forholde seg til statistikk, og å gjøre gode tolkninger er helt essensielt for å kunne lære noe fra dataene som er samlet inn. Likevel er feiltolkninger av statistiske resultater svært utbredt, og de siste årene har denne diskusjonen igjen blusset opp i litteraturen. Et nylig publisert bidrag i denne debatten er forfattet av Zad Rafi og Sander Greenland, i deres artikkel «Semantic and cognitive tools to aid statistical science» (3). De argumenterer for at kjerneproblemene forbundet med bruk av p-verdier, hypotesetesting og statistisk signifikans er kognitive, heller enn statistiske. Kanskje bunner problemene rett og slett i hvordan vi omtaler resultater fra statistiske tester, med begreper som konfidens, signifikans, og en dikotomisert omtale av konsepter som er underliggende kontinuerlige, for eksempel når man snakker om en forskjell som om den enten finnes eller ikke, når en mer korrekt omtale ville omhandlet hvor stor denne forskjellen er, på en skala fra null og oppover. I artikkelen beskriver Rafi og Greenland en nyttig transformering av P-verdier (til S-verdier), som kognitivt sett er enklere å forstå betydningen av. Videre foreslår de å erstatte bastante uttrykk som konfidens og signifikans med mer beskjedne deskriptive begreper som kompatibilitet, for å unngå å gi inntrykk av at dataene er mer sikre enn de er, og å snakke om graden av kompatibilitet fremfor å dikotomisere resultatene i harde kategorier. I denne sammenhengen anbefaler de også å teste dataene mot flere testhypoteser, ikke bare mot nullhypotesen, noe som effektivt kan gjøres grafisk. For å ytterligere synliggjøre usikkerheten knyttet til statistisk modellering understreker de også at det er hele modellen (inkludert alle antagelsene som gjøres) som testes, og ikke bare testhypotesen. Dersom dataene er lite kompatible med modellen, kan man med andre ord ikke automatisk anta at det er testhypotesen som er feil, da det kan være andre aspekter med modellen som ikke passer.

Substitusjonsmodeller i ernæringsforskning

Spiser vi mer av noe, spiser vi mindre av noe annet, og effekten av å spise mer av en matvare avhenger av hva den erstatter. Når vi anbefaler å spise mer av noe, er det derfor også ønskelig å spesifisere hva det bør erstatte. Et godt eksempel på dette er anbefalingene om å spise mindre mettet fett, hvor det spesifiseres at dette bør erstattes med flerumettet fett. Disse anbefalingene bygger blant annet på såkalte substitusjonsmodeller, hvor kostholdsdataene er modellert slik at man estimerte effekten av å erstatte mettet fett med andre næringsstoffer. Denne typen substitusjonsanalyser har vist seg å være nyttig når man studerer makronæringsstoffer, ettersom det er relativt enkelt å modellere og tolke isokaloriske substitusjoner. Dette er mer utfordrende når vi snakker om matvarer, noe Daniel Ibsen og kollegaer belyser i sin artikkel «Food substitution analyses for nutritional epidemiology» (4).

En slik utfordring er knyttet til valg av enhet, altså om matvarene modelleres basert på vekt, volum, porsjoner eller energiinnhold. Substitusjoner basert på porsjonsstørrelse sammenligner matvarer i de mengdene de normalt konsumeres i, men dette innebærer også ofte ulikt energiinnhold. Det samme gjelder substitusjoner basert på vekt eller volum. Da er det vanskelig å separere effekten av substitusjonen fra effekten av endret energiinntak. På den andre siden, kan isokaloriske substitusjoner i ytterste konsekvens bety svært ulike mengder mat, og den praktiske relevansen er kanskje mindre. Et annet aspekt som er viktig å være klar over er at en substitusjon i kostholdet ofte følges av andre substitusjoner. For eksempel kan et skifte fra rødt kjøtt til kylling gjerne følges av et skifte fra poteter til ris, da dette gjerne er et mer vanlig tilbehør. Dette åpner for konfundering og vanskeliggjør tolkningen, spesielt for matvarer som inngår i spesifikke kostholdsmønstre og derfor i praksis øker og reduseres samtidig heller enn å erstatte hverandre. Å justere for slike matvarer, og dermed holde dem konstant i modellen, vil håndtere eventuell konfundering, og spesifisere at det ikke er disse som erstattes. Problemet er at man da modellerer en kostholdsendring få faktisk gjennomfører, noe som gjør modellen mindre praktisk relevant.

Alt i alt kan slike substitusjonsmodeller settes opp på mange ulike måter, og forfatterne påpeker at det aller viktigste er å tenke nøye gjennom hvilket spørsmål man ønsker å svare på, og ha dette samt øvrige begrensninger i bakhodet når man gjennomfører og tolker analysene.

Potensielle konsekvenser av lav representativitet i kohortstudier

UK Biobank er en stor kohort basert i Storbritannia med data på mer en halv million deltakere. Formålet med kohorten er å studere livsstilsfaktorer og andre faktorer som er relatert til utvikling av sykdom. En stor utfordring med UK Biobank, og kohorter generelt, er at den ikke er representativ for målpopulasjonen, den generelle befolkningen. Andelen som takket ja til å delta i UK Biobank var nemlig på skarve 5,5 % av alle inviterte, og vi vet fra før at helsebevisste individer har en større tilbøyelighet til å takke ja til å bli med i studier som omhandler helse. Her er UK Biobank intet unntak. Deltakerne i kohorten er mer fysisk aktive, har mindre overvekt, røyker og drikker mindre og har betydelig lavere dødelighet og kreftforekomst enn den generelle britiske befolkningen. Dette kompliserer tolkningen av de over tusen forskningsartiklene som er publisert fra kohorten, især når funnene brukes til å utforme råd og retningslinjer til den generelle befolkningen.

I en fersk studie publisert i tidsskriftet Epidemiology, har Stamatakis og medarbeidere re-analysert data fra UK Biobank (5). Ved å bruke tall fra en annen undersøkelse (The Health Survey of England) som i større grad speiler den generelle befolkningen, kunne forfatterne kalibrere analysene fra UK Biobank og på den måten vurdere i hvilken grad allerede publiserte resultater fra kohorten er overførbare til den generelle befolkningen. Forfatterne argumenterer med at dette er vesentlige vurderinger som må gjøres ettersom resultater fra store observasjonsstudier jevnlig påvirker råd fra myndigheter og andre pasient- og helseorienterte foreninger.

Resultatene fra de kalibrerte analysene viste blant annet at UK Biobank overestimerer den beskyttende effekten av alkoholinntak på dødelighet av hjerte- og karsykdommer. I UK Biobank var hazard ratio (HR) og konfidensintervall (KI) for inntak av 1-5 enheter/uke og over 5 enheter/uke henholdsvis 0,66 (0,58-0,91) og 0,60 (0,43-0,84) som er kompatibelt med en betydelig redusert risiko. Kalibrering av disse analysene var derimot tilvarende HR på 1,00 (KI: 0,59-1,69) og 0,93 (0,54-1,61). Med andre ord, etter å ha tatt høyde for denne seleksjonsskjevheten, var det ingen tydelig sammenheng mellom alkoholinntak og hjerte- og karsykdom, og det ble konkludert med at resultatene fra UK Biobank når det gjelder denne problemstillingen ikke kan overføres til den øvrige populasjonen. Videre ble det også vist at resultater fra UK Biobank underestimerte helsekonsekvenser hos deltakere med en dårlig livsstil på måletidspunktet.

Selv om en del viktige sammenhenger ble under- eller overestimert som følge av de omtalte seleksjonsmekanismene, var det andre assosiasjoner som så ut til å være mindre påvirket. For eksempel estimerte helseeffekter av fysisk aktivitet, røykevaner og inntak av frukt og grønt. Studien er likevel viktig og understreker tydelig at assosiasjoner til dels er et produkt av populasjonen som studeres og studiens innebygde seleksjonsmekanismer. Dette er spesielt viktig å ha i bakhodet for den som leser og utformer råd med utgangspunkt i epidemiologiske studier.

Referanser

  1. Hayes-Larson E, Kezios KL, Mooney SJ, Lovasi G. Who is in this study, anyway? Guidelines for a useful Table 1. J Clin Epidemiol. 2019;114:125–32.

  2. Lysne V, Olsen T, Kværner A. Metodehjørnet. Nor Tidsskr ernæring, nr 4 2020.

  3. Rafi Z, Greenland S. Semantic and cognitive tools to aid statistical science: Replace confidence and significance by compatibility and surprise. BMC Med Res Methodol 20, 244 (2020).

  4. Ibsen DB, Sofie A, Laursen D, et al. Food substitution models for nutritional epidemiology. Am J Clin Nutr. 2021 Feb 2;113(2):294-303.

  5. Stamatakis E, Owen KB, Shepherd L, et al. Is Cohort Representativeness Passé? Poststratified Associations of Lifestyle Risk Factors with Mortality in the UK Biobank. Epidemiology 2021 Mar 1;32(2):179-188.