Metodehjørnet

Vegard Lysne

Redaksjonsmedlem

Ane Sørlie Kværner

Redaksjonsmedlem

Thomas Olsen

Redaksjonsmedlem

I denne spalten tipser vi om artikler og andre ressurser som tar opp metodiske aspekter som er relevante for ernæringsforskning. Spalten er aktuell både for de som forsker selv, og for de som leser og benytter seg av denne forskningen. Temaene vil variere, så her er det noe for de fleste. Denne gangen fokuserer vi på to temaer knyttet til behandling av kontinuerlige variabler, kategorisering og log-transformering, før vi tar for oss noen artikler knyttet til hvordan vi vurderer og graderer kvaliteten på ernæringsforskning.

Kategorisering av ­kontinuerlige variabler

Mange av variablene vi jobber med innen helseforskning er kontinuerlige, for eksempel vekt, høyde, BMI, alder, midjemål eller inntaket av sukker, fett, og energi. Men, heller enn å bruke disse variablene på den kontinuerlige skalaen de opprinnelig eksisterer på, blir disse ofte omdannet til kategorier. Man er ikke 37 eller 68 år gammel, man er ung (<65) eller gammel (>65). Man har ikke BMI på 24, 27 eller 31 kg/m2, man er i kategoriene normalvektig, overvektig eller har fedme. Kontinuerlige variabler deles noen ganger inn i slike forhåndsdefinerte kategorier, mens man andre ganger benytter datadrevne grenseverdier. Eksempler på det siste er median splitt, tertiler og kvartiler. Da rangeres deltakerne i stigende rekkefølge for den aktuelle variabelen, og deles deretter i to, tre eller fire like store grupper (eller flere). Denne typen kategorisering er umiddelbart attraktiv, da den tilsynelatende gjør det mulig å dele folk inn i lav, middels og høy risiko. I tillegg kan risikoen kvantifiseres relativt mellom disse gruppene, for eksempel ved bruk av odds ratio.

Slik kategorisering har imidlertid flere potensielle begrensninger, og dette gjelder spesielt for de datadrevne kategoriene. Caroline Bennette og Andrew Wickers diskuterer flere av disse i sin artikkel «Against quantiles: categorization of continuous variables in epidemiologic research, and its discontents» (1). Ett av temaene som diskuteres er antagelsen om at risikoen innad i hver gruppe er homogen, som er en antagelse man automatisk introduserer når man deler opp populasjonen for så å sammenligne kategoriene mot hverandre. Videre vanskeliggjør slike datadrevne grenseverdier sammenligning av resultater mellom studier, ettersom grenseverdiene som benyttes er populasjonsavhengige og dermed ofte ulike. Et annet problem med kategorisering diskuteres av Magne Thoresen i sin artikkel «Spurious interaction as a result of categorization»(2). I denne artikkelen viser han ved hjelp av simulering at kategorisering av kontinuerlige variabler i en regresjonsmodell også kan føre til tilfeldige interaksjonseffekter.

Log-normal fordeling

Kontinuerlige variabler beskrives ofte ved hjelp av (aritmetisk) gjennomsnitt og standardavvik. Disse målene tar utgangspunkt i normalfordelingen, som er symmetrisk, og har da som egenskap at 68% av dataene vil ligge innenfor gjennomsnittet ± ett standardavvik, og 95% ligger innenfor ± to standardavvik. Mange kontinuerlige variabler, spesielt innenfor biologi, følger imidlertid ikke en normalfordeling, men er skjevfordelte og har en usymmetrisk fordeling mot høyere verdier. I slike tilfeller gir ikke gjennomsnitt og standardavvik en god beskrivelse av dataene, og ofte vil nedre del av intervallet definert av gjennomsnittet ± 2 standardavvik være under 0, og altså fysiologisk umulig. I to artikler beskriver Eckhard Limpert og kollegaer hvordan slike data i mange tilfeller følger en log-normal fordeling, og kommer med anbefalinger om hvordan man kan håndtere dette (3,4). En log-normal fordeling er symmetrisk og normalfordelt på en log-skala, altså dersom variabelen log-transformeres. For å beskrive en slik fordeling kan man oppgi gjennomsnitt og standardavvik av de log-transformerte dataene, men ulempen med dette er at tallverdiene kan være vanskelig å forholde seg til. Limpert foreslår derfor å tilbaketransformere disse verdiene, og presentere dem på originalskalaen. Dette kalles geometriske gjennomsnitt, og geometriske standardavvik. I motsetning til de aritmetiske standardavvikene som er additive (pluss/minus), er de geometriske standardavvikene multiplikative (gange/dele). For log-normale fordelinger har disse parameterne som egenskap at 68% av datapunktene vil ligge innenfor et intervall definert av det geometrisk gjennomsnittet delt på eller ganget med det geometriske standardavviket, og 95% innenfor det samme intervallet med det geometriske standardavviket opphøyd i andre. For en typisk log-normalfordelt variabel, illustreres forskjellen på å bruke aritmetisk versus geometrisk deskriptiv statistikk i figur 1.

Figur 1. Geometrisk og aritmetisk gjennomsnitt, og intervall definert av ett (mørk farge) eller to (lys farge) aritmetiske (additive) eller geometriske (multiplikative) standardavvik.

Dersom man velger å bruke log-transformerte variabler i de statistiske modellene sine, eller leser artikler hvor andre har gjort dette, er det viktig å tenke på hvordan dette påvirker tolkningen av resultatene. Kenneth Benoit har skrevet en kort artikkel som gir en fin innføring i hvordan man tolker disse estimatene avhengig av hvorvidt det er eksponeringsvariabelen, utfallet eller begge som er log-transformert (5).

Evidenskriterier i ernæringsforskning

I kronikken «Ernæringsforskning er ikke som annen forskning» (6) fra nummer 4, 2020, drøftet Åslaug Matre, Jutta Dierkes og Vegard Lysne hvordan ulike aspekter ved forskningen på kosthold gjør at det ikke alltid er mulig å vurdere forskning på mat på samme måte som man for eksempel vurderer forskning på et medikament. En nyttig referanse å kjenne til i denne sammenheng er publisert av Jeffrey Blumberg og medarbeidere, med tittelen «Evidence-based criteria in the nutritional context». I artikkelen diskuterer forfatterne hvordan evidensbasert ernæring skiller seg fra evidensbasert medisin, og forklarer hvorfor vi i ernæringsfaget er avhengig av å kombinere informasjon fra ulike forskningsdesign, og ikke kan sette randomiserte kliniske studier ubestridt på toppen av evidenshierarkiet.

Et verktøy som ofte brukes for å vurdere kvaliteten på forskningen og dermed evidensgraden er GRADE (Grading of Recommendations, Assessment, Development, and Evaluation). Dette verktøyet er utviklet for å vurdere evidensgraden for spørsmål som kan besvares ved hjelp av randomiserte, kontrollerte studier, som dermed blir regnet som gullstandarden. Ernæring er ikke et slikt felt, og for å ta høyde for de iboende begrensningene vi møter på når vi forsker på kosthold, kan vi bruke verktøyet NutriGRADE (7), som er utarbeidet for å ta hensyn til disse. Bruken av verktøy som GRADE og NutriGRADE ble nylig diskutert i en redaksjonell artikkel i American Journal of Clinical Nutrition, hvor Deirdre Tobias, Clemens Wittenbecher og Frank Hu advarer mot å ukritisk bruke GRADE for å vurdere ernæringsforskning (8). De påpeker også at andre verktøy, deriblant NutriGRADE, også har sine begrensninger, og understreker viktigheten av at ernæringsforskningsmiljøet går sammen og kommer til konsensus for hvordan forskning på ernæring bør oppsummeres og vurderes.

Referanser

  1. Bennette C, Vickers A. Against quantiles: categorization of continuous variables in epidemiologic research, and its discontents. BMC Med Res Methodol. 2012/03/02. 2012;12:21.

  2. Thoresen M. Spurious interaction as a result of categorization. BMC Med Res Methodol. 2019 Feb 7;19(1).

  3. Limpert E, Stahel WA, Abbt M. Log-normal distributions across the sciences: Keys and clues. Bioscience. 2001;51(5):341–52.

  4. Limpert E, Stahel WA. Problems with Using the Normal Distribution-and Ways to Improve Quality and Efficiency of Data Analysis. PLoS One. 2011;6(7).

  5. Benoit K. Linear Regression Models with Logarithmic Transformations. 2011. Tilgjengelig fra: https://kenbenoit.net/assets/courses/ME104/logmodels2.pdf

  6. Matre ÅO, Dierkes J, Lysne V.: Ernæringsforskning er ikke som annen forskning | NTFE. Nor Tidsskr Ernæring. 2020;4.

  7. Schwingshackl L, Knuppel S, Schwedhelm C, Hoffmann G, et al. Perspective: NutriGrade: A Scoring System to Assess and Judge the Meta-Evidence of Randomized Controlled Trials and Cohort Studies in Nutrition Research. Adv Nutr. 2017/02/01. 2016;7(6):994–1004.

  8. Tobias DK, Wittenbecher C, Hu FB. Grading nutrition evidence: where to go from here? Am J Clin Nutr. 2021 May 8;113(6):1385–7.

  9. Blumberg J, Heaney RP, Huncharek M, Scholl T, et al. Evidence-based criteria in the nutritional context. Vol. 68, Nutrition Reviews. Blackwell Publishing Inc.; 2010. p. 478–84.