Investigadors de prestigi proposen canviar el valor estadístic p

mpoc estudi jordi roig cutillas
Deixar de fumar d’hora redueix el risc de patir MPOC a la meitat en adults amb alt risc genètic
16 febrer, 2017
regeneracion pulmonar dr. jordi roig cutillas
Descobertes noves cèl·lules mare que regeneren el teixit pulmonar.
14 març, 2018

Un equip d’investigadors proposa canviar el valor p inferior a 0,05 com estadísticament significatiu per un nou valor de p inferior a 0,005 en l’àmbit de les ciències socials i biomèdiques.

La ciència està travessant una crisi de reproductibilitat, i els investigadors, els finançadors i els editors estan cada vegada més preocupats que la literatura acadèmica estigui plena de resultats poc fiables. Ara, un grup de 72 investigadors prominents estan apuntant com la causa del problema els febles estàndards estadístics dels nous descobriments.

En moltes disciplines, la importància de les troballes es jutja pels valors de p. S’usen per provar (i rebutjar) una “hipòtesi nul·la”, que generalment postula que l’efecte que s’està provant no existeix. Com més baix sigui el valor de p que es troba per a un conjunt de resultats, menys probable és que els resultats siguin purament deguts a l’atzar. Els resultats es consideren “estadísticament significatius” quan aquest valor és inferior a 0,05.

Però molts científics temen que el llindar de 0,05 hagi causat que apareguin massa falsos positius en la literatura científica, un problema exacerbat per una pràctica anomenada p-hacking, també conegut com pesca de dades, en la que els investigadors recopilen dades sense abans crear una hipòtesi per provar i després buscar patrons en els resultats que puguin ser reportats com estadísticament significatius.

En un article publicat a Nature Human Behaviour, els investigadors sostenen que el llindar del valor p hauria de reduir-se a 0,005 per a les ciències socials i biomèdiques

“Els investigadors simplement no s’adonen de com de feble és l’evidència quan el valor de p és 0,05″, diu Daniel Benjamin, un dels autors de l’estudi i economista de la Universitat del Sud de Califòrnia, Estats Units. Segons Benjamin, les afirmacions amb valors de p que es trobin entre 0,05 i 0,005 han de tractar-se simplement com “evidència suggestiva” en lloc del coneixement establert.

Mostres de grans dimensions

Un problema amb la reducció dels llindars del valor p és que poden augmentar les probabilitats d’un fals negatiu –afirmant que els efectes no existeixen quan de fet ho fan– diu Casper Albers, un investigador en psicometria i estadística a la Universitat de Groningen als Països Baixos. Per contrarestar aquest problema, Benjamin i els seus col·legues suggereixen que els investigadors augmentin la mida de les mostres en un 70%; diuen que això evitaria l’augment de les taxes de falsos negatius, mentre que es reduirien dramàticament les taxes de falsos positius. Però Albers pensa que en la pràctica, només els científics ben finançats tindrien els mitjans per fer-ho.

Shlomo Argamon, un científic informàtic de l’Institut de Tecnologia d’Illinois, diu que no hi ha una resposta simple al problema, ja que “no importa quin nivell de confiança triïs, si hi ha bastants formes diferents de fer el teu experiment, que almenys un d’ells donarà un resultat estadísticament significatiu només per casualitat”. Calen canvis més radicals com nous estàndards metodològics i incentius a la investigació, explica.

La reducció dels llindars del valor p també pot agreujar el biaix de publicació, en el qual els estudis amb resultats negatius es deixen de publicar, diu Tom Johnstone, neurocientífic cognitiu de la Universitat de Reading, Regne Unit. Però Benjamin diu que tota investigació ha de publicar-se, independentment del valor de p.

Canvi en les regles

Altres camps científics ja han actuat sobre els valors de p. El 2015 una revista de psicologia els va prohibir. Els físics de partícules, que recullen raimes de dades d’experiments de col·lisions d’àtoms, porten molt temps exigint un valor de p per sota de 0,0000003 (3 x 10-7) a causa de la preocupació que un llindar més baix podria conduir a afirmacions equivocades, assenyala Valen Johnson, coautor de l’article. Fa més d’una dècada, els genetistes van prendre mesures similars per establir un llindar de 5 x 10-8 per els estudis de genoma on busquen diferències entre les persones que tenen una malaltia i les que no.

No obstant això, altres científics han abandonat els valors de p en favor d’instruments estadístics més sofisticats, com les proves bayesianes, que requereixen que els investigadors defineixin i provin dues hipòtesis alternatives. Però no tots els investigadors tindran l’experiència tècnica necessària per dur a terme proves bayesianes, diu Johnson, que pensa que els valors de p poden ser útils per determinar si una hipòtesi és recolzada per evidència. “El valor de p per si mateix no és necessàriament dolent.”

Notícia original: Big names in statistics want to shake up much-maligned P value
Artículo: Redefine statistical significance

Dr. Jordi Roig Cutillas
Dr. Jordi Roig Cutillas
El Doctor i Pneumòleg Jordi roig Cutillas és llicenciat en Medicina i Cirurgia i Doctor Cum Laude per la Universitat de Barcelona. Format com a Especialista en Pneumologia a l’Hospital de la Vall d’Hebron. Autor de més 100 publicacions en prestigioses revistes internacionals i de diversos capítols de llibres. Investigador principal de diversos assajos clínics internacionals. Gold Member de l’European Respiratory Society, Fellow de l'American College of Chest Physicians i membre del grup Colleman. Ha estat President del Comitè Científic i de Recerca de la SEPAR, Membre de la Comissió Tècnica Avaluadora de Projectes de Malalties Respiratòries del FIS, entre d'altres.