Metodehjørnet

Metodene som ligger bak en forskningsartikkel setter premissene, og legger grunnlaget, for tolkningen og forståelsen av resultatene. Både for deg som selv forsker, og for deg som leser og bruker forskningen, er det essensielt å ha god kjennskap til og forståelse av disse metodene. Samtidig er det lite som er hugget i stein, og nye metoder utvikles fortløpende. Samtidig ser vi at bruken og forståelsen av etablerte metoder kontinuerlig diskuteres, både i vitenskapelige publikasjoner og på andre plattformer.

I denne spalten vil vi tipse om artikler og andre ressurser som tar opp metodiske aspekter som er relevant for forskning på ernæring. Hovedformålet er å opplyse om relevante ressurser, ikke å gi en fullgod omtale. Spalten er aktuell både for forskeren og den som leser forskningen. Temaene vil variere, så her vil det være noe for de fleste.

P-verdier og statistisk signifikans

Et av temaene som har blitt viet mest oppmerksomhet i statistiske miljøer de siste årene er bruken av p-verdier og konseptet statistisk signifikans. Når vi gjennomfører en statistisk test får vi ut en p-verdi, og når denne er lavere enn 0,05, har det tradisjonelt sett vært vanlig å kalle resultatet statistisk signifikant. Motsatt betegnes resultater med p-verdier høyere enn 0,05 som ikke-signifikante. Dessverre er dette konsepter som ofte feiltolkes, for eksempel ved å sette likhetstegn mellom at noe er ikke-signifikant og at det ikke er noen effekt.

Gjennomgående feilbruk og feiltolkning av p-verdier i den vitenskapelige litteraturen har lagt grunnlaget for en langvarig debatt, som i 2016 kulminerte i en autoritativ uttalelse om p-verdier fra den amerikanske statistikkforeningen1. I 2019 ble denne fulgt opp av en ny uttalelse om statistisk signifikans, hvor forfatterne tar til orde for å gå bort fra å bruke merkelappene «signifikant» og «ikke-signifikant»2. Begge uttalelsene ble publisert som spesialnumre, med en rekke kommentarartikler hvor statistikere og andre fagfolk bidro med sine synspunkter. I kjølvannet av disse publikasjonene har NISS (National Institute of Statistical Sciences) arrangert tre webinarer hvor temaet diskuteres, publisert på deres YouTube-kanal «NISS communications».

Senere har også flere relevante artikler blitt publisert. For eksempel har mer enn 800 forskere signert et opprop publisert i Nature mot en uheldig kategorisering av resultater baser på p-verdier som i verste fall kan føre til at reelle effekter med kliniske relevans forkastes3. I tillegg har Dorothy Bishop i en helt fersk meningsartikkel i Nature tatt til orde for at på samme måte som at forskere på lab må sette seg grundig inn i sikkerhetsrutiner før de kan ta fatt på sine arbeidsoppgaver, må forskere som jobber med tall ha en tilsvarende forståelse for hva en p-verdi er4.

Dersom du foretrekker å bli fortalt hvordan det ikke skal gjøres, har Sander Greenland, Stephen Senn og Kenneth Rothman publisert en artikkel med tittelen «Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations»5 hvor de har gjort nettopp det: Laget en guide til hvordan disse konseptene ikke skal brukes.

Hva er en årsak?

Et viktig mål når vi forsker er å etablere årsakssammenhenger. Da er det viktig å ha en formening om hva selve begrepet «årsak» innebærer. Pearce og Vandenbroucke publiserte i 2019 en oversiktsartikkel som tar for seg de ulike årsakstypene6. Her skilles det mellom årsaker som er statiske (kjønn, gener), dynamiske (kroppsvekt, blodtrykk, kolesterol) og handlinger (røyking, kosthold, fysisk aktivitet). De ulike årsakstypene beskrives ved hjelp av spørsmål som hvorvidt vi kan undersøke underliggende mekanismer, om det er mulig å sette opp kontrafaktuelle kontraster, eller om det er mulig å randomisere eller intervenere på årsaken. Å definer hvilken type årsak man studerer vil være relevant for tolkningen av resultatene, og hva vi kan bruke resultatene til.

Sammensatte data

Konseptet sammensatte data sikter til data hvor ulike deler sammen utgjør en total. Et eksempel er totalt energiinntak, som utgjøres av de energigivende næringsstoffene karbohydrater, fett, protein og alkohol. For kostholdsdata er totalen variabel. Spiser vi mer karbohydrater, kan det totale energiinntaket øke, med mindre vi samtidig spiser mindre av noe annet. Andre totaler er fikserte, for eksempel timer per døgn. Dersom vi øker tiden vi bruker på en aktivitet, må dette gå på bekostning av mindre tid brukt på en annen aktivitet.

Når vi studerer effekten av slike sammensatte data, er det vesentlig hvorvidt totalen kan variere eller om den er fiksert. Dette styrer hvilke typer effekter vi kan estimere, relative (mer X på bekostning av mindre Y) eller totale (mer X, der totalen også kan endre seg). Når totalen er fiksert kan vi bare estimere relative effekter, mens data med variable totaler slik som kostholdsdata tillater å estimere både relative og totale effekter. Dette kan du lese mer om i artikkelen «A causal inference perspective on the analysis of compositional data»7.

Referanser

  1. Wasserstein RL, Lazar NA. The ASA’s Statement on p-Values: Context, Process, and Purpose. Am Stat 2016; 70: 129–33.

  2. Wasserstein RL, Schirm AL, Lazar NA. Moving to a World Beyond “ p < 0.05”. Am Stat 2019; 73: 1–19.

  3. Amrhein V, Greenland S, McShane B. Scientists rise up against statistical significance. Nature. 2019.

  4. Bishop D. How scientists can stop fooling themselves over statistics. Nature 2020; 584.

  5. Greenland S, Senn SJ, Rothman KJ, et al. Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations. Eur J Epidemiol 2016; 31: 337–50.

  6. Pearce N, Vandenbroucke JP. Educational note: types of causes. Int J Epidemiol 2019; 49: 676–85.

  7. Arnold KF, Berrie L, Tennant PWG, Gilthorpe MS. A causal inference perspective on the analysis of compositional data. Int J Epidemiol 2020; published online March.