Comprendre les tests

Il est important de bien distinguer reproductibilité et validité. Le premier terme permet de savoir si la répétition d’un test sur un patient (pratiqué par un ou plusieurs praticiens) donne le même résultat. Le second terme nous renseigne sur le fait que le test mesure bien ce qu’il est sensé mesurer.

Il existe également bien d’autres coefficients de corrélation pour tester la reproductibilité des tests diagnostics dont certains moins connus ou usuels. C’est pourquoi la description s’est concentrée sur les plus courants et les tests que nous verrons notamment dans les chapitres suivants.

On parle notamment de kappa pondéré (Weighted kappa) dans certaines publications, cela suppose qu’il y a un ordre possible entre les réponses au test (ex: négatif > neutre > positif). Il est important lorsque l’on étudie des publications de vérifier si les outils statistiques employés sont correctement choisis. 

Enfin, dernier point concernant la reproductibilité, il existe notamment un problème récurrent dans la méthodologie des études c’est l’aveuglement des praticiens lors du test du patient. En effet, le patient est réconnaissable pour le praticien ce qui peut créer une attente de résultat et donc fausser les scores de reproductibilité intrapraticien. Il faut donc se méfier parfois de certains tests avec de hauts scores de reproductibilité intrapraticien et des scores plus mitigés en interpraticien.

Pour aller plus loin:

  • Delacour, H., Servonnet, A., Perrot, A., Vigezzi, J. F., & Ramirez, J. M. (2005, March). La courbe ROC (receiver operating characteristic): principes et principales applications en biologie clinique. In Annales de biologie clinique (Vol. 63, No. 2, pp. 145-154) (pdf)
  • Sainani, K. L. (2017). Reliability statistics. PM&R, 9(6), 622-628 (pdf).
  • Vetter, T. R., & Schober, P. (2018). Agreement analysis: what he said, she said versus you said. Anesthesia & Analgesia, 126(6), 2123-2128.