Metodehjørnet

Vegard Lysne

Redaksjonsmedlem

Thomas Olsen

Redaktør

Ane Sørlie Kværner

Redaktør

I denne spalten tipser vi om artikler og andre ressurser som tar opp metodiske aspekter som er relevante for ernæringsforskning. Spalten er aktuell både for de som forsker selv, og for de som leser og benytter seg av denne forskningen. Temaene vil variere, så her er det noe for de fleste.

Tabell 2-feilslutningen

I vitenskapelige artikler finner vi vanligvis en tabell 1, som inneholder sosiodemografisk og klinisk informasjon om studiepopulasjonen. Denne er viktig for å kunne vurdere resultatene i lys av hvilken gruppe man har forsket på, og ikke minst for å vurdere om populasjonen er representativ for andre populasjoner slik at resultatene er generaliserbare. Hoved-resultatene presenteres deretter i tabell 2.

Vi har alle hørt at korrelasjon ikke er det samme som kausalitet, blant annet fordi det kan være andre variabler som på ulike måter påvirker sammenhengen vi studerer. Disse variablene kan kategoriseres ut fra hvordan de henger sammen kausalt med eksponeringsvariabelen X og utfallsvariabelen Y, og de har ulik effekt på analysene. En konfunderende faktor er en variabel som påvirker både X og Y, og dermed introduserer en statistisk sammenheng mellom disse. En mediator er en variabel som ligger på den kausale stien fra X til Y, slik at effekten av X går via denne

Et eksempel er kolesterolnivåene, som medierer effekten av mettet fett på risikoen for hjerte- og karsykdom. Den siste typen variabel er de som påvirkes av både X og Y, som kalles kolliderende faktorer (collidere). Disse introduserer en sammenheng mellom X og Y dersom de justeres for. Dette er spesielt relevant for seleksjonsbias, også kjent som «collider-stratification-bias», da alle studier per design justerer for de kriteriene som ligger til grunn for inklusjon. Dette fenomenet kan du lese mer om i en illustrativ artikkel av Stephen Cole og kollegaer (1).

Foto: Getty images

For å kunne estimere det man er interessert i må epidemiologiske analyser derfor justeres, og da er typen variabel sentralt for hvordan man bygger opp modellene. Konfunderende faktorer ønsker man alltid å inkludere i modellene, mens man bør unngå å justere for kolliderende faktorer. Hvorvidt man inkluderer mediatorer avhenger av om man er interessert i den totale effekten (via alle mulige kausale veier) eller den direkte effekten (ikke via mediatorer).

Hensikten med å justere modellen er å estimere den faktiske sammenhengen mellom X og Y. Det er ikke meningen at estimatene for de andre variablene i modellen skal tolkes, da modellen ikke er designet for å si noe om disse. Disse estimatene kan være justert for både mediatorer og kolliderende faktorer, og viktige konfunderende faktorer kan være utelatt fordi de ikke var relevante for X. Likevel er det ikke uvanlig at hele modellen med gjensidig justerte assosiasjoner presenteres. Dette kan by på en rekke problemer, elegant belyst av Daniel Westreich og Sander Greenland i kommentaren «The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients» publisert i American Journal of Epidemiology i 2013 (2). Kjernen i problemet er at de ulike estimatene fra samme modell har ulik betydning, men når de presenteres i samme tabell er veien kort til å ilegge dem samme tolkning. Forfatterne presenterer flere løsninger på problemet, deriblant å begrense presentasjonen av effektestimater i tabell 2 til de eksponeringene man har bygget modellen for. Bonusen er at man samtidig frigir plass til presentasjon av effektestimater fra flere modeller med ulikt sett av kovariater, og med det kausale antakelser. Sammenligning av disse effektestimatene gir viktig innsikt i betydningen av de sekundære risikofaktorene for sammenhengen vi studerer. Og skal man presentere estimater for flere faktorer, bør man bygge separate modeller for hver av disse og presentere dem hver for seg. En full utgreiing om temaet er utenfor rekkevidden for denne spalten, men vi håper likevel varsellampen vil være tent i fremtidige møter med potensielle «Tabell 2-feilslutninger».

Et tidsrelevant eksempel på denne feilslutningen finner vi i en artikkel nylig publisert i Nature av Williamson og kollegaer. De utforsket ulike risikofaktorer for Covid-19 relatert død i en stor britisk kohort (3). Alle risikofaktorene ble inkludert i samme modell, og alle estimatene fra denne modellen ble presentert i resultattabellen. Artikkelen har møtt mye kritikk, både før og etter publisering, deriblant fra Westreich og kollegaer (4). For de som ønsker å fordype seg ytterligere i denne tematikken anbefaler vi en glimrende kortserie i tre deler publisert av den kanadiske epidemiologen Taylor McLinden på youtubekanalen «intuitive EPI» (5), med utgangspunkt i den originale kommentaren fra Westreich og Greenland (2).

Ikke-differensiell målefeil

Målefeil i eksponeringsvariabelen (for eksempel risikofaktorer for sykdom), og dermed feilklassifisering av eksponering, er en utfordring i epidemiologisk forskning. Vi kan dele slike målefeil inn i flere kategorier, og en av disse er ikke-differensiell målefeil. Dette er målefeil som kan antas å være uavhengig av hvilket endepunkt man studerer, slik at sannsynligheten for å feilklassifiseres er like stor enten man utvikler utfallet eller ikke. I ernæringsepidemiologi er det vanlig at kostholdsdata samles inn ved baseline, og deretter knyttes til endepunkter som utvikles under oppfølgingstiden. I denne sammenheng betyr ikke-differensiell målefeil at vi kan ta utgangspunkt i at de som utvikler utfallet og de som ikke gjør det har feilrapportert i like stor grad.

Det er en utbredt oppfatning at ikke-differensiell målefeil fører til en attenuering av observerte assosiasjoner. Dette betyr at målefeilen skyver sammenhengene mot null, eller gir en bias mot null. Dette stemmer i teorien, dersom målefeilen er eksakt lik mellom de som utvikler utfallet og de som ikke gjør det. Men selv om sannsynligheten for feilrapportering på forhånd er lik, vil det ikke bli eksakt likt i hver enkelt studie. Den faktiske effekten av ikke-differensiell målefeil vil derfor være uforutsigbar i enkeltstudier, og det kan også føre til at effekter overestimeres.

Dette kan du lese mer om i artikkelen «Things Don’t Always Go as Expected: The Example of Nondifferential Misclassification of Exposure—Bias and Error» (6), av Brian Whitcomb og Ashley Naimi. Her understreker de viktigheten av å skille mellom bias, som er den forventede effekten av ikke-differensiell målefeil, og feilestimater i enkeltstudier som er den faktiske effekten av målefeilen som oppstod. De advarer videre mot å anta at resultatene fra enkeltstudier underestimerer de reelle effektene, og anbefaler å tolke resultater med forsiktighet og anerkjenne begrensningene som følge av målefeil.

Artikkelsamling - Bias in epidemiology

Til sist vil vi tipse om en samling publisert i International Journal of Epidemiology kalt Bias in Epidemiology (7). Denne samlingen består av tolv artikler med fokus på feilkilder i epidemiologi relatert til design, datainnsamling, analyser, tolkning og rapportering og som består av artikler publisert mellom 2014 og 2020. Blant temaer som belyses i artikkelsamlingen er nettopp korreksjon for feilklassifisering av utfallsdata hentet fra databaser (for eksempel ICD-koder) (8). Dette er av sterk relevans når det gjelder å knytte kostdata som beskrevet over til registerbaserte endepunkter, for eksempel hjerteinfarkt. I tillegg inneholder samlingen interessante artikler som tar for seleksjonsskjevhet (9), metoder for å evaluere og kvantifisere skjevheter i epidemiologiske studier (10), samt utfordringer med valideringsstudier (11) som er spesielt relevant når det kommer til å ta i bruk nye verktøy for kostregistrering.

Referanser

  1. Cole SR, Platt RW, Schisterman EF, Chu H, Westreich D, Richardson D, Poole C. Illustrating bias due to conditioning on a collider. Int J Epidemiol [Internet]. Oxford Academic; 2010 [cited 2020 Nov 16];39:417–20.

  2. Westreich D, Greenland S. The table 2 fallacy: Presenting and interpreting confounder and modifier coefficients. Am J Epidemiol. 2013;177:292–8.

  3. Williamson EJ, Walker AJ, Bhaskaran K, Bacon S, Bates C, Morton CE, Curtis HJ, Mehrkar A, Evans D, Inglesby P, et al. Factors associated with COVID-19-related death using OpenSAFELY. Nature. Nature Publishing Group; 2020;584:430–6.

  4. Westreich D, van Smeden M, Edwards JK. COMMENT ON WILLIAMSON ET AL. (OpenSAFELY). Epidemiology. 2020;

  5. McLinden T. A detailed discussion of the Table 2 Fallacy [Internet]. 2020. https://www.youtube.com/watch?v=ufwRaWQmxDE&feature=youtu.be

  6. Whitcomb BW, Naimi AI. Things Don’t Always Go as Expected: The Example of Nondifferential Misclassification of Exposure—Bias and Error. Am J Epidemiol [Internet]. 2020;189:365–8. Available from: https://doi.org/10.1093/aje/kwaa020

  7. Bias in Epidemiology. 2020.

  8. Walraven C van. A comparison of methods to correct for misclassification bias from administrative database diagnostic codes. Int J Epidemiol. 2018;47:605–16.

  9. Infante-Rivard C, Cusson A. Reflection on modern methods: selection bias—a review of recent developments. Int J Epidemiol. 2018;47:1714–22.

  10. Lash TL, Fox MP, MacLehose RF, Maldonado G, McCandless LC, Greenland S. Good practices for quantitative bias analysis. Int J Epidemiol. 2014;43:1969–85.

  11. Fox MP, Lash TL, Bodnar LM. Common misconceptions about validation studies. Int J Epidemiol. 2020;