La LCA des (très) bien classés pour les ECNi/EDN: La correction détaillée des annales 2017-2021 et le cours en fiches synthétiques 2311663038, 9782311663037

La synthèse de ce qu'il faut savoir en LCA pour faire la différence Représentant à elle seule 10 % de la note fina

113 106 80MB

French Pages [440] Year 2022

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
édition amis-med.com
Recommend Papers

La LCA des (très) bien classés pour les ECNi/EDN: La correction détaillée des annales 2017-2021 et le cours en fiches synthétiques
 2311663038, 9782311663037

  • Commentary
  • decrypted from 94BCD744EEAC5F028AE4E0E6B68E9846 source file
  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Collection dirigée par Aymeric Rouchaud

Antoine Bouvier Bastien Le Guellec Paul Parizot Aymeric Rouchaud

t uv... n

eu

u

1U

u l

I

1)

Pour aller plus loin dans votre entraînement et mettre toutes les chances de votre côté, téléchargez tous les sujets blancs de LCA des ECNi 2017, 2018, 2019 et 2020 commentés et corrigés : • Soit par flashcode :

• Soit à l'adresse suivante: www.vuibert.fr/site/663037

Création de la maquette intérieure et mise en pages : Patrick Leleux PAO Couverture : Primo & Primo Illustrations : Magnard

ISBN: 978-2-311-66303-7

Toute représentation ou reproduction, intégrale ou partielle, faite sans le consentement de l'auteur, ou de ses ayants droit aux ayants cause, est illicite (loi du 11 mars 1957, alinéa 1er de l'article 40) . Cette représentation ou reproduction par quelque procédé que ce soit, constituerait une contrefaçon sanctionnée par les articles 425 et suivants du Code pénal.

© Janvier 2022, Éditions Vuibert - 5, allée de la 2e DB, 75015 Paris www.vuibert.fr

Les auteurs Antoine Bouvier s'est classé S0e aux ECNi 2021. Il est interne en Cardiologie à Lille. Bastien Le Guellec s'est classé 83e aux ECNi 2020. Il est interne en Radiologie et Imagerie médicale à Lille. Paul Parizot s'est classé 3400e aux ECNi 2021. Il est actuellement interne de Médecine interne et conférencier en LCA à Lille. Aymeric Rouchaud s'est classé 14e aux ECNi 2017 et est interne en Radiologie à Lyon. Il dirige la collection des (très) bien classés.

Remerciements À mes parents et ma famille pour leur soutien. À Marie. Aux trois frères Jenvick, Léo et Ludwig. Aux Caennais et aux Parisiens qui se reconnaîtront. Remerciement spécial à Jolan pour son amour des Biostats, à Émile et François, jeunes docteurs, et à JC, Querquevillais d'adoption. Bastien [

À ma famille, qui m'entoure et me soutient depuis toujours : Papa et Maman, Fanny, Baptiste, Marion, et Simon, Estelle, Gabrielle et Maxence. À toute la team AirBnBoobs, qui a rendu ces années d'études et ces vacances post-ECN inoubliables : Florian, Mathilde, Nassim, Pierre-Henri, Simon. Plus particulièrement à Paul, ami et co-auteur de ce livre, qui a su me transmettre ses connaissances en LCA bien plus facilement que sa passion pour Brassens. E À Roxane, à mes côtés depuis le début de ce projet. Antoine t I>'--

À ma famille pour leur soutien durant ces études. À mes amis qui égaient chaque jour ma vie : ceux de Lille (ils se reconnaîtront) et ceux de la Raclette. À Antoine pour ces dimanches soir de LCA et pour m'avoir suivi dans cette aventure. À mes professeurs de statistiques, notamment les Prs Forzy et Charkaluk, pour m'avoir transmis leur amour de cette matière. Paul

n

n

JC>l

n z n u

1

bec rn t

VC

)

nt

l

nn

t

V I'

vc V U

pll

,..

'' t r

y

~

C".

z

1 )

nt E

. [

[

C

~

l

111

Avant-propos On ne présente plus l'épreuve de LCA aux ECNi ! Celle-ci tient une place à part au sein de ce concours et dans l'esprit des étudiants. Seule matière à être certaine de tomber le jour J et comptant pour 10 % de la note, elle est hautement discriminante. Elle est pourtant souvent délaissée, mal aimée et survolée. Tant mieux pour vous, lecteurs ! Ne voyez pas ce livre seulement comme une correction d'annales de LCA (ce n'est d'ailleurs pas son titre). C'est une boîte à outils pour (très) bien réussir l'épreuve de LCA aux ECNi. C'est un condensé de tous les points de cours pertinents, de toutes les astuces et de tous les pièges tombés pendant les cinq dernières années en LCA, aux ECNi et ECNi blanches. C'est donc un tout-en-un, qui prend les annales comme un prétexte pour apprendre, solidifier et approfondir les notions-clés qui concentrent la plupart des questions, en même temps qu'une méthode qui optimise les chances d'obtenir une (très) bonne note le jour J. C'est enfin un projet né du constat que les étudiants, même ceux irréprochables au sujet de la prise en charge de la hyalinose segmentaire et focale, connaissent mal leur cours de LCA : c'est pourtant la source des écarts de notes entre les bons étudiants et les étudiants excellents. Nous sommes persuadés qu'à l'aide de ce livre qui allie le cours précis à l'entraînement sur sujets réels, vous allez progresser en LCA pour être en mesure d'obtenir une excellente note. L'objectif est d'arriver le jour des ECNi en envisageant l'épreuve de LCA comme une demi-journée qui vous donnera de l'avance sur les autres étudiants compétitifs car vos notes auront été systématiquement bonnes et que votre méthode sera rodée. C'est l'état d'esprit que nous vous proposons avec ce livre : faire un effort supplémentaire par rapport aux autres étudiants en LCA. Cet effort a payé pour nous et il n'y a pas de raison que ce ne soit pas votre cas. Savoir qu'on a de l'avance sur une matière qui tombera forcément à hauteur de 10 %, c'est un sacré boost de confiance ! u c

r

E

La connaissance précise du cours et l'entraînement par les annales qui permettent de cerner les limites d'un programme parfois flou est l'essence de la collection des (très) bien classés. Cette méthode s'applique parfaitement en LCA, où le cours et la pratique des QCM classiques représentent 90 % du travail. Dans un texte, tout le monde sait repérer le nombre de pays où se déroule l'étude mais peu d'étudiants savent repérer à coup sûr une cohorte historico-prospective appariée. C'est pourtant cette seconde question qui fera la différence le jour J. Ce livre se distingue tout de même de ses collègues de la collection par certains points. Le cours de ce livre de LCA ne se veut pas exhaustif mais une synthèse de ce qui est nécessaire pour réussir votre épreuve. Là où l'ambition de résumer la néphrologie en quelques pages de synthèse est vaine, nous pouvons, en LCA, nous permettre de le faire. Ce livre s'adapte VI

IV

V

, n

➔ LejourJ ('

I

• Vous portez un intérêt à la LCA et vous avez préparé l'épreuve mieux que les autres étudiants : ce sera un de vos points forts. Vous arriverez le sourire aux lèvres avec l'envie d'en découdre. • Quand vous lirez le titre des deux articles au début de l'épreuve, repérez si l'un des deux articles est atypique ou particulièrement long, dans l'optique de le préparer en premier. l Car on ne peut pas préparer sereinement un sujet en sachant qu'il reste le plus long. Il faut faire le plus long/le plus difficile en premier pour gagner en confiance et savoir qu'on a fait le plus dur. u [

C ,

n

VIII

'1-

.-.u

u

Méthodologie générale

• Vous appliquerez votre méthode rodée en entraînement : l'épreuve ne posera pas de problème . • Vous tomberez sur une question ambiguë : respirez, elle l'est pour tout le monde. Essayez de raisonner par élimination (d'expérience, c'est la meilleure façon de gérer ce genre de question) . • Vous penserez avoir réussi et c'est top : ce sera le cas. • Vous penserez avoir foiré : c'est faux . Les sujets difficiles le sont pour tout le monde, et c'est souvent dans ces situations-là que les différences se font entre les étudiants bien entraînés dont vous faites partie, et les autres. ➔

Comment utiliser le livre ?

Le livre se divise en deux parties : le cours et les annales corrigées. Vous pouvez réaliser les annales dans l'ordre chronologique ou, à l'aide de l'index à la fin du livre, choisir l'épreuve sur laquelle vous entraîner en fonction des différentes notions qui y sont abordées. Vous trouverez des renvois aux différents points de cours abordés tout au long de la correction afin d'approfondir, au besoin, les connaissances traitées. Dans la partie de cours, retrouvez toutes les notions essentielles pour travailler et comprendre les notions-clés de LCA. Parmi ces notions, vous pouvez identifier les points méthodologiques et les questions type • ·

e

IX

Sommaire général Cours Généralités ............................................................................................................ .

. des Etu

3

d.1agnost1ques . .......................................................................................... .

37

Études thérapeutiques ......................................................................................... .

42

Analyse de survie ................................................................................................ .

57

. .d.em10 . 1og1ques . • tu des ep1 E .................................................................................... .

64

Méta-analyses ...................................................................................................... .

73

Autres notions de LCA ........................................................................................ .

75

Annales ECNi 2021 Énoncé du suïet 1 . .. .. ... . ... . .. ... .. ... .. .. . .. .. .. .. .. . . . .. .. ... .. ... .. ... . .. .. .. .. .. .. .. . .. .. .. .. ... .. . ... .. .. .. . 100 nn

, l

n

I

n

L

Corrigé du sujet 1 ................. f.~ ......................... ~ .. f ...~ ..................... ~ .. ~~............. 103

,.

n

l

CL

tz

... 1

v

C

..1

Énoncé du sujet 2 .................................................................................................. 132 c

z

c




Énoncé du sujet 2 ................ ~ .............. !...... .....-:-.... ~~ .... ......... .......... .. ~~:: .... ~ ....~... 191 UI

> '

VI

I



m

vI1

C..

Corrigé du sujet 2 ... . .. .. ... .. .. . ... .. .. ... .. . .. .. ... . . .. .. ... . .. .. .. ... .. .. . .. .. .. .. .. .. . ... .. ... .. ... . ... . .. .. .. 193 n

n u V,..,

t X

r

lC>Oli

VI V

n

v•

"

V

h.&\r

L

Z

z ')

I •

c ...

'I

L



Sommaire

ECNi 2020 Énoncé du sujet 1 .................................................................................................. 220 Corrigé du sujet 1 ................................................................................................. 223 Énoncé du sujet 2 . .. .. ... .. .. .. ... ... ... .. . .. .. ... .. ... . ... .. ... ... .. . ... .. .. .. .. . ... .. .. ... .. .. ... .. .. ... . .. ... .. . 248 Corrigé du sujet 2 .. .. .. ... ... . ... ... ... .. . .. .. ... .. .. ... .. .. ... ... .. . ... .. .. .. .. .. .. .. .. ... .. .. .. ... .. ... . .. ... .. . 251

ECNi 2019 Énoncé du sujet 1 .................................................................................................. 282 Corrigé du sujet 1 ................................................................................................. 285 Énoncé du sujet 2 .. ... .. .. ... .. ... .. ... .. ... . .. .. .. .. ... . ... ... ... .. . ... .. .. .. ... . .. .. ... ... .. . .. ... ... ... . .. ... ... 310 Corrigé du sujet 2 . .. ... .. ... ... . ... ... .. ... . .. .. .. .. .. .... . ... ... .. ... . .. .. ... .. .. .. . ... ... .. .. . ... ... .. ... . ... ... 313

ECNi 2018 ,

, d u su1et . 1 ........ ............ ... ............ ..... ....... ... .. ............... ......................... ...... 336

Enonce

Corrigé du sujet 1 ................................................................................................. 339 Énoncé du sujet 2. ......... ..... ..... ..... ..... ..... ...................... ..... ..... ..... ..... ..... ................ 361 Corrigé du sujet 2 .. .. .. ... ... . ... ... .. .. ... . .. .. ... .. ... . ... ... .. .. .. .. .. ... .. .. . ... .. .. ... .. .. ... .. .. ... . .. ... .. . 364 n,

c

l

t

mi

l

1

u

i

t rn

V



I

#

#

C



IC

nL

...

m

C

Enonce du su1et 1 ........... ......... .......................... ................ ............ ........................ 384 Corrigé du sujet 1 ................................................................................................. 386

T>

>

Énoncé du sujet 2 . ... .. .. ... .. ... .. .. ... .. ... .. ... .. .. ... .. ... .. .. ... .. ... .. .. ... .. ... .. ... .. .. ... .. ... .. .. ... .. ... 411 "'

).i, ,



,



n

n

,...,.I"I"

>

,. n

v

I

>

,..,,...

Corrige du su1et 2 ... .. ... .. ... .l . .. ... .. ... .. ... .. ... .. .. ... .. ... .. ... .. .l . ... .. ... .. ... .. ... .. .. ... .l . ... .. .. ... .. .. 413 Index des notions de cours ................................................................................. . 425

I

mi f n ne plu

I

~

• 2017, 2018, ~L:J Les articles de LCA des ECNi blanches 2019 et 2020 en PDF sont à télécharger ici ! www.vuibert.fr/site/663037

[!]

..' l'i'

t

UI

l r

"Y

V

V



C ~

n

C

L;,a

u

n

1)

XI

Sommaire des points de cours par épreuv~s

Pour vous faciliter la navigation dans le livre et potentialiser vos révisions, VOICI un sommaire des sujets présents dans ce livre, avec pour chaque épreuve les points de cours qui y sont abordés. Cela vous permettra d'articuler les deux parties du livre pour savoir quelles notions sont mobilisées (et donc à réviser!) sur les annales que vous allez travailler. A vous de jouer !

Sujet 1 : Erlotinib as maintenance treatment in advanced non-small-cell lung cancer: • • • • •

a multicentre, randomised, placebo-controlled phase 3 study Étude thérapeutique page 42. Randomisation page 44. Analyse de survie page 57. Kaplan-Meier page 57. Stratification page 45.

Sujet 2 : Prenatal and infant exposure to ambient pesticides and autism spectrum disorder • • • • • • • • • •

XII

in children: population based case-control study Étude épidémiologique cas-témoin page 67. Odds ratio page 70. Biais page 21. Types de variables page 9. Risque alpha, bêta et puissance page 6. Inflation du risque alpha page 6. Appariement page 71. Analyse multivariée page 31. Critères de Bradford-Hill page 71. Fluctuations d'échantillonnage page 15.

Sommaire des points de cours par épreuves

2021 blanche Sujet 1 : Rivaroxaban versus Enoxaparin for Thromboprophylaxis after Hip Arthroplasty • • • • • • • • •

Étude thérapeutique page 64. Aveugle page 28. Randomisation page 44. Fluctuations d'échantillonnage page 15. Stratification page 45. Nombre de sujets nécessaires page 7. Risque alpha, bêta et puissance page 6. Non-infériorité page 54. Comité d'adjudication page 81.

Sujet 2 : Noninvasive Coronary Angiography With Multislice Computed Tomography • Étude diagnostique page 37. • Caractéristiques intrinsèques et extrinsèques d'un test page 38. • Types de variables page 9.

2020 Sujet 1 : Oxygen Therapy in Suspected Acute Myocardial Infarction • • • • •

Étude thérapeutique page 42. Supériorité page 52. Randomisation page 44. ITT page 50. Validités page 27.

Sujet 2 : Risk Factors for Pancreatic Cancer in China : A Multicenter Case-Control Study • • • • •

Étude épidémiologique cas-témoin page 67. Biais de mémoire page 25. Analyse multivariée page 31. Causalité page 71. Relation dose-effet page 29.

XIII

Sommaire des points de cours par épreuves

2020 blanche Sujet 1 : Benzodiazepine use and risk of Alzheimer's disease : case-control study • • • • •

Étude épidémiologique page 64. Randomisation page 44. Relation dose-effet page 29. Analyse de sensibilité page 31. Fraction attribuable du risque page 66.

Sujet 2 : Mechanical thrombectomy after intravenous alteplase versus alteplase alone after • • • • • •

stroke (THRACE): a randomised controlled trial Étude thérapeutique page 42. Supériorité page 52. Randomisation page 44. ITT page 50. Types de variables page 9. Analyse sous-groupes page 32.

2019 Sujet 1 : Axillary dissection versus no axillary dissection in patients with sentinel-node • • • • • • •

micrometastase (IBCSG 23-01) : a phase 3 randomised controlled trial. Étude thérapeutique page 42. Non infériorité page 54. Randomisation page 44. Analyse de survie page 57. Test unilatéral page 49. Analyse intermédiaire page 34. Forest plot page 73.

Sujet 2 : Assessment ofglenohumeral subluxation in poststroke hemiplegia: comparison • • • • • •

between ultrasound and fingerbreadth palpation methods Étude diagnostique page 37. Courbe ROC page 39. Variabilité inter-opérateurs/ concordance page 19. Corrélation page 20. Nombre de sujets nécessaires page 7. Caractéristiques d'un test/tableau de contingence page 37.

XIV

Sommaire des points de cours par épreuves

2019 blanche Sujet 1 : Venous Thromboembolism Among Elderly Patients Treated With Atypical and • • • • • •

Conventional Antipsychotic Agents Étude épidémiologique de cohorte exposée vs non exposée page 67. Types d'étude page 66. Analyse multivariée page 31. Interprétation du tableau 1 page 14. Analyse de survie page 57. Causes de négativité du résultat page 18.

Sujet 2 : Oral Rivaroxaban for the Treatment of Symptomatic Pulmonary Embolism • • • • •

Étude thérapeutique page 42. Non-infériorité page 54. Analyse de survie page 57. Fluctuations d'échantillonnage page 15. Validité externe page 27.

2018 Sujet 1 : Is Endocan a Diagnostic Marker for Pneumonia After Cardiac Surgery? • • • •

The ENDOLUNG Study Étude diagnostique page 37. Types d'études page 66. Caractéristiques intrinsèque et extrinsèques d'un test page 38. Analyse multivariée page 31.

Sujet 2 : A Randomized Trial of Laparoscopie versus Open Surgery for Rectal Cancer • • • • • • •

Étude thérapeutique page 42. Caractéristiques d'un critère de jugement principal page 12. ITT page 50. Nombre de sujets nécessaires page 7. Randomisation page 44. Aveugle page 28. Hazard Ratio page 63.

XV

Sommaire des points de cours par épreuves

2018 blanche Sujet 1 : Dutasteride in localised prostate cancer management: the REDEEM randomised, double-blind, placebo-controlled trial • • • • • • • • • •

Étude thérapeutique page 42. Supériorité page 52. Randomisation page 44. Fluctuations d'échantillonnage page 15. Aveugle page 28. Nombre de sujets nécessaire page 7. Caractéristiques d'un critère de jugement principal page 12. ITT modifiée page 50. Types de variables page 9. Hazard Ratio page 63.

Sujet 2 : Outcomes of Pregnancy after Bariatric Surgery • • • • • • • • •

Étude épidémiologique de cohorte exposée vs non exposée page 67. Appariement page 71. Risque alpha, bêta et puissance page 6. Puissance page 35. Odds Ratio page 70. Validités page 27 . Analyse de sensibilité page 31. Critères de Bradford-Hill page 71. Relation dose-effet page 29 .

2017 Sujet 1 : Early-Onset Alopecia and Amyotrophie Lateral Sclerosis: A Cohort Study • Étude épidémiologique de cohorte page 67 . • Vocabulaire et épidémiologie page 64. • Biais de mémoire page 25.

Sujet 2 : Levosimendan for the Prevention of Acute Organ Dyifunction in Sepsis • • • • • • • • •

Étude thérapeutique page 42 . Supériorité page 52. Randomisation page 44. Analyse de survie page 57. Autorisations nécessaires page 28. Aveugle page 28. Lire un flow-chart page 16. Interprétation du tableau 1 page 14. Validités page 27.

XVI

Sommaire des points de cours par épreuves

2017 blanche Sujet 1 : Mortality results from the Goteborg randomised population-based prostate-cancer screening trial

• • • • • • •

Étude diagnostique page 37. Randomisation page 44. Analyse de survie page 57 . Number needed to screen page 7. Interprétation du tableau 1 page 14. Comité d'adjudication page 81. Lire un flow-chart 16.

Sujet 2 : Operative versus non-operative treatment for closed, displaced, intra-articular fractures of the calcaneus: randomised controlled trial

• • • • • • • •

Étude thérapeutique page 42. Supériorité page 52. Randomisation page 44. NSN page 7. Validités page 27 . Type de variables page 9. Lire un flow-chart page 16. Analyses en sous-groupes page 32.

XVII

Cours

Le L

l •'

l n

To~ l

+ 1

l


..l

[

y

n

l

z

UV [

1)

or F,>E CJ'

l

'TU

u t

C

Sommaire Généralités . . . . .. . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . .. . . . .. . . . l . Justification de l'étude . . .. . . .. . . . . . . . . . ... ... .. .. . . . .. . .. 2. Tests principaux en LCA .. . . .. . . .. . . ... . .. . . .. . . ... . ... . 3. Intervalle de confiance.............................. .... 4. Risques alpha, bêta et puissance.................... 5. Inflation du risque alpha................................ 6. Nombre de sujets nécessaires (NSN) .............. 7. Facteurs et marqueurs de risque, facteur pronostique...................................... ..... 8. Populations, inférence et généralisation........... 9. Types de variables........................................ l O. Caractéristiques d'un critère de jugement principal.......................................................... l l . Interprétation du tableau l ... ..... . . . .. . .... .. .. ..... 12. Fluctuations d'échantillonnage........... ........... l 3. Flow-ch art.................................................. 14. Test significatif, hypothèse nulle............. ....... 15. Causes de négativité du résultat................... 16. Variabilité inter- et intro-opérateur, concordance.................................................... 17. Corrélation ................................................ 18. Biais ......................................................... 19. Effet-centre................................... ....... ....... 20. Validités............ ..... .. ..... .. ..... .. ..... .. ............ 21. Aveugle..................................................... 22. Autorisations nécessaires............................. 23. Relation dose-effet................... ..... ......... ...... 24. Modèles statistiques en LCA. ... . . ... . . ... . .. . . .. . .. . 25. Analyse de sensibilité...................... ............ 26. Analyse univariée vs multivariée................... 27. Analyse en sous-groupes (= subgroup analysis) ......................... ............... 28. Analyse intermédiaire(= inlerim analysis) ...... 29. Types des études ........................................ 30. Grades de recommandations et niveaux de preuve des études........................................ 31. Conclusion d'un article ................... ............ Études diagnostiques . . .. . . .. . . ... . .. . ....... ..... ... . ... . l. Tableau de contingence................................ 2. Caractéristiques intrinsèques et extrinsèques d'un test.......................................................... 3. Courbe ROC................................................ 4. Rapports de vraisemblance et nomogramme de Fagan .........................................................

3 3 4 4 6 6 7 8 9 9 12 14 15 16 17 18 19 20 21 26 27 28 28 29 30 31 31 32 34 34 35 35 37 37 38 39 40

Études thérapeutiques.. .. .. .. .. .. ... .. .... ... ...... .... .. l . Essai contrôlé........................ ....... ................ 2. Clause d'ambivalence................................... 3. Randomisation ................ ............................. 4. Test uni- au bilatéral ...................................... 5. ITT, per-protocale et en traitement reçu............ 6. Quel est l'objectif de cet essai thérapeutique?. 7. Études de supériorité..................................... 8. Études de non-infériorité......... .. ..... ... .... ......... 9. Phase des essais ..................... ......... ....... ......

42 42 43 44 49 50 52 52 54 56

Analyse de survie. .. ....... ... ... .... .. .. ..... .... .. .... .. .. l. Courbe de Kaplan-Meier............................... 2. Calcul d'une médiane de survie ..................... 3. Hazard ratio(= HR = rapport de risques instantanés)......................................................

57 57 61

Études épidémiologiques . ... .... ... .... . .... .. ..... .. . . l. Vocabulaire et épidémiologie ........................ 2. Types d'études ............................................. 3. Tableau de contingence, risque relatif et adds ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.Apparieme~ ........................... .................... 5. Critères de Bradford-Hill ............ ....................

64 64 66

63

69 71 71

Méta-analyses. .. .... ....... .. ... ... ........ .... ... .. .......... 73 Autres notions de LCA ........ ... .. .. ...... .. .. .. .... .... l . Préventions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . 2. Analyses médico-économiques .............. ......... 3. Informations sur les auteurs............................ 4. Transparence, indépendance, liens d'intérêt .... 5. Références . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6. Supplementary figures................................... 7. Les différents acteurs de la recherche.............. 8. Biais de causalité inverse(= reverse causality) .. 9. Gérer un aspect flou de l'article ...................... l O. Données manquantes.................................. 11. Effet de l'imprécision sur le résultat mesuré...................................................... ...... 12. Comité d'adjudication (= ad;udication committee) . . .. . .. . . . .. . .. . .. . .. . . . .. . .. . .. 13. Comité de pilotage (= steering committee) . .. . .. . ...... .. . . .. . . . ... . . .. . ... . ... .

75 75 75 76 76 77 77 78 78 79 79 81 81 81

Généralités

-La LCA a pour objectif de faire lire à tous les futurs médecins des articles scientifiques. Avant de plonger dans le cours à connaître, rappelons l'intérêt de la littérature scientifique. Une étude = un article répond à une question précise que se pose la communauté médicale à un moment donné. La question est toujours formulée de la même manière : « Est ce que, dans cette population, cette variable est associée à cette autre variable ? » Exemples: • Est-ce que, chez les patients hospitalisés pour une infection à Covid-19 modérée à sévère, un traitement par hydroxychloroquine diminue la mortalité à 30 jours ? • Est-ce que, chez les personnes âgées de plus de 50 ans, le traitement par benzodiazépines est associé à un sur-risque de maladie d'Alzheimer ? Dans les deux cas, on cible une population précise, définie par des critères d'inclusion et d'exclusion, une variable d'intérêt, et un critère de jugement mesurable. Sans définition précise de la question, il est impossible d'y répondre. Le rôle des auteurs est ensuite de rédiger un protocole (qui est les règles du jeu de l'essai), de recruter des sujets ou de tirer des données d'une base de données en santé, éventuellement de réaliser le suivi des patients s'il existe, de mesurer le lien entre les variables d'intérêt à l'aide d'analyses statistiques, et de publier les résultats de l'étude dans un journal accessible à la communauté scientifique. De votre côté, l'épreuve de LCA vous demande de saisir l'enjeu de la question posée par les auteurs, d'identifier de quelle façon ils ont tenté d'y répondre, d'identifier leur réponse, et éventuellement de critiquer la manière dont ils s'y sont pris, bien que ce ne soit pas toujours nécessaire. Voici un premier chapitre qui aborde toutes les notions générales que vous serez à même de rencontrer au fil des sujets de LCA. Elles sont classées selon leur ordre d'apparition dans les questions pour vous permettre de comprendre au mieux les mécanismes de l'énoncé en LCA.

1. Justification de l'étude



En LCA, la première question est quasi systématiquement celle-ci : « Dans l'introduction de l'article, quelles sont les données avancées par les auteurs qui justifient la réalisation de l'étude ? ». Cette question fait référence au rationnel (rationale en anglais) de l'étude, pour lequel on retrouve toujours les mêmes arguments : • présomption d'effet(« Pourquoi les auteurs pensent que l'effet existe ? ») ; • données divergentes/manque de données(« Mais pourquoi ne peut-on pas trancher pour le moment? »). ln fine, la communauté scientifique suspecte un résultat mais il n'existe pas de données claires (dans cette population, pour cette indication, avec ce schéma thérapeutique, etc.).

3

Cours

L'étudiant ne peut pas connaître le contexte scientifique précédant l'étude en question et il est donc nécessaire de faire confiance aux auteurs pour rapporter celui-ci. C'est pour cette raison que le correcteur ne peut demander en toute bonne foi de ne cocher que des propositions explicitement présentes dans le texte.

2. Tests principaux en LCA De très nombreux tests statistiques sont utilisés dans les études. Il est néanmoins très peu probable que l'on vous demande de choisir ou de critiquer le choix d'un test. Aussi, je ne fais que mentionner ici les deux plus fréquents, à savoir le X 2 (pour données qualitatives) et le test t de Student (pour données quantitatives). Pour aller plus loin avec la LCATBC

Les autres tests usuels sont recensés dans le tableau. Variable analysée

Test employé

1

Catégorielle Ordinale Quantitative, distribution normale Censurée

2

X ou Fisher X2 ou Wilcoxon-Mann-Witney t test de Student log-rank

Quantitative, autre

McNemar, Wilcoxon-Mann-Witney ou paired t-test

Échantillons appariés (avant-après, corps divisé, cross-over)

McNemar, Wilcoxon-Mann-Witney ou paired t-test

Il faut par contre savoir que la variable de sortie d'un test (valeur numérique que l'on obtient à l'issue du test) est la probabilité p que le résultat soit expliqué par le hasard (plus p est faible, plus on a confiance dans le résultat) .

3. Intervalle de confiance Le problème en LCA est souvent d' estimer un résultat au sein d'une population à partir d'une mesure réalisée dans un échantillon tiré au sort. Ce résultat en population sera probablement proche de celui estimé en échantillon, sans pour autant pouvoir être certain qu'il sera identique. On doit donc associer à tout résultat estimé une fourchette qui aurait une grande chance de comprendre le résultat réel que l'on cherche à approcher. Cette fourchette est appelée intervalle de confiance (IC) à X % et se définit comme une zone centrée par la valeur estimée en échantillon, dans laquelle le résultat réel a X % de chances de se trouver. X est souvent choisi à 95 %, mais peut prendre de nombreuses valeurs. Autre chose : si la valeur réelle a X % de chance de se trouver dans l'IC à X %, elle a aussi 100-X % de chances de se trouver en fait en dehors de la zone estimée par l'IC par hasard: c'est le risque alpha ! 4

Généralités

:) Voir point de cours sur les risques alpha, bêta et puissance, page suivante.

Les intervalles de confiance sont centrés autour de la valeur estimée dans l'échantillon, mais on peut choisir quelle zone on souhaite couvrir avec ceux-ci en déterminant leur caractère uni- ou bilatéral : • un IC bilatéral est l'usage le plus fréquent, et il prend un risque égal que la valeur réelle soit en fait plus grande ou plus petite que l'estimation ; • un IC unilatéral est choisi quand on souhaite avoir une estimation de valeurs maximales ou minimales probables que pourrait prendre le résultat réel (en langage courant : « fourchette haute » ou « fourchette basse») . Exemple

On souhaite estimer l'efficacité d'un traitement antibiotique sur le temps d'hospitalisation pour décompensation de BPCO chez les sujets âgés de plus de 65 ans. On recrute un échantillon de sujets qui reçoivent aléatoirement un antibiotique ou un placebo. Au terme de l'essai, on mesure un gain de 15 h d'hospitalisation suite au traitement étudié. Il est probable que le gain réel ne soit pas exactement 15 h, puisqu'on a à faire ici qu'à une estimation ponctuelle (à savoir une seule valeur). On doit donc, pour être plus précis, associer cette estimation ponctuelle à son intervalle de confiance, choisi ici bilatéral à 95 %. En le calculant, on trouve qu'il existe 95 % de chances pour que le gain réel en population soit compris entre 5 h (borne basse) et 21 h (borne haute). Il existe 5 % de chance pour que le gain soit en fait plus petit ou plus grand (également réparti, donc 2,5 % de chances qu'il soit inférieur à 5 et 2,5 % de chance qu'il soit supérieur à 21).

l

95 % de chances que l'effet réel en population soit dans l'IC à 95 % 2,5 % de risque que l'effet soit dans cette zone

\

..

1

t Néfaste

e

2,5 % de risque que l'effet soit dans cette zone

1 ..

I

..

Estimation de l'effet dans la population Calcul de l'IC à 95 %

Effet nul

t

Bénéfique

Estimation ponctuelle de l'effet à partir des mesures de l'échantillon

On aurait pu choisir un intervalle unilatéral à 90 % par exemple, qui aurait pu nous donner la valeur 12 h, soit 10 % de chances pour que la valeur réelle soit en fait inférieure à 12 h. Une estimation ponctuelle est toujours comprise dans l'intervalle de confiance. Plus il est choisi à un X % important, plus la fourchette est large (probabilité faible de se tromper en visant large !) . On ne vous demandera jamais de le calculer ! 5

Cours

4. Risques alpha, bêta et puissance Les résultats d'études statistiques sont très souvent issus d'analyses menées dans des échantillons issus d'une population . L'échantillon n'étant jamais le reflet parfait de la population, il existe toujours des risques de se tromper dans le résultat : Risque alpha (ou risque de première espèce)

Risque de conclure à tort à une différence statistique, qui est en fait inexistante dans le monde réel. Devant un résultat significatif (c'est-à-dire lorsque la p-value d'un test est inférieure à alpha), on conclut« au risque alpha de se tromper près ». Ce risque alpha est fixé a priori dans le protocole et sa valeur n'est jamais modifiée au cours de l'étude

Risque bêta {ou risque de deuxième espèce)

Risque de conclure à tort à l'absence de différence statistique alors que celle-ci existe dans le monde réel. Il est aussi fixé dans le protocole, notamment pour aider au calcul du NSN (nombre de sujets nécessaire)

Puissance statistique (ou 1-bêta)

Capacité à mettre en évidence une différence qui existe. La puissance est bien souvent fixée a priori à 80 % dans les études (mais ce choix reste celui des auteurs).

À la différence du risque alpha, bêta et 1-bêta peuvent être modifiés en cours d'étude par les caractéristiques réelles de cette dernière (si moins de sujets sont recrutés ou si l'événement a une incidence plus faible que prévue, alors bêta augmente et la puissance diminue) _C'est pour cette raison que l'on parle de puissance a priori (puissance ciblée par les auteurs lors de la rédaction du protocole de l'étude) et de puissance a posteriori (puissance effectivement retrouvée après l'étude). On peut résumer les risques alpha, béta et la puissance dans le tableau suivant :

Différence dans l'étude

Risque alpha

1-bêta (=puissance)

Pas de différence dans l'étude

1-alpha

Risque bêta

5. Inflation du risque alpha L'inflation du risque alpha est une conséquence nuisible de la réalisation de multiples tests, qui conduit à mettre en évidence une différence pour un des tests au moins, alors qu ' elle n'existe pas en réalité. On n'en parle pas dans les cas de réalisations d'un test unique. Pour aller plus loin avec la LCATBC

Si pour un test donné, on fixe alpha à 5 % : • la probabilité de conclure à raison est de 1-alpha soit 95 % ; • pour 2 tests consécutifs, la probabilité de conclure à tort sur au moins un test est de 1-(û,95Xû,95) = 9,8 % ; • pour 10 tests, elle passe à 40 % ; • pour n tests, la probabilité de conclure à tort à une différence qui n'existerait pas est finalement : 1-[(1-alphat]

6

Généralités

Même sans le détail mathématique, il est aisé de comprendre que plus on réalise de tests, plus il y a de chance de tomber au moins une fois sur un résultat significatif par hasard. Le mieux est de ne pas multiplier les analyses (c'est une des raisons pour lesquelles on ne fait pas de tests sur le tableau 1 quand il y a eu randomisation !). Quand des analyses multiples sont incontournables (analyses intermédiaires, analyses en sous-groupes), il est recommandé d'adopter une stratégie de contrôle du risque, qui témoigne d'une bonne validité interne. Nous citerons la méthode de Bonferroni (la plus simple et celle évoquée dans le Collège de LCA) où le risque alpha est divisé par le nombre de tests. Il existe d'autres méthodes .

6. Nombre de suiets nécessaires (NSN) Le nombre de sujets nécessaires (NSN) correspond à la détermination mathématique du nombre de sujets à recruter pour pouvoir mettre en évidence la différence souhaitée. Il est donc intimement lié à la notion de puissance. Un essai est qualifié de puissant si la probabilité qu'il arrive à mettre en évidence une différence réelle est importante. On peut prendre en analogie du NSN la notion de loupe grossissante, avec un pouvoir de magnification proportionnel au nombre de sujets. Plus on souhaite mettre en évidence une différence faible (D petit) , plus la loupe doit être grossissante. Plus ce que l'on observe est rare ou variable (s), plus la loupe doit être grossissante. Deux questions sont en général posées par le correcteur : 1) Quelles variables rentrent dans le calcul du NSN ? • alpha, fixé manuellement ; • bêta, fixé manuellement ; • la variance ou l'incidence attendue pour le critère de jugement principal, déterminée d'après les données précédentes de la littérature ; • la différence à mettre en évidence, choisie arbitrairement comme étant pertinente. Pour aller plus loin avec la LCATBC

Voici la formule du NSN, qui n'est pas à connaître, mais qui peut aider à mémoriser ses termes: s2

NSN

= 2 x -t,,_2 x [f(a) - f([3)] x (1 + PpdJ

• s est : - la variance du CJP dans la population s'il est quantitatif;. - une grandeur inversement proportionnelle à l'incidence de l'événement en cas de CJP qualitatif • ~ est la différence à mettre en évidence. • f(a) et f([3) sont deux grandeurs qui dépendent respectivement du risque alpha et du risque bêta. • ppdv est la proportion de perdus de vue.

7

Cours

2) Quel est l'effet des variations des valeurs composant la formule sur les autres composants ? • alpha ne change jamais car il est fixé ; • bêta augmente (= la puissance diminue) : si le nombre de sujets recrutés est finalement plus faible que le NSN, - si l'incidence est plus faible que prévu, - si la variance est plus grande que prévu ; • la variance et l'incidence dans la population de l'essai sont mesurées dans l'échantillon et comparées aux données de la littérature ; • la différence à mettre en évidence est fixée, elle ne change pas. ! L'existence d'analyses intermédiaires prévues dans le protocole impacte la puissance statistique de l'étude et aura tendance à augmenter le NSN. Vous pouvez donc voir ici que le type d'analyse (supériorité ou non-infériorité) n'a pas d'impact sur le NSN à proprement parler ! En revanche, le caractère bilatéral ou non du test aura un impact sur le risque alhpa et donc sur le NSN : c'est pour cela qu'à protocoles équivalents, les études de non-infériorité (unilatérales) auront souvent moins de sujets nécessaires sur les études de supériorité en majorité bilatérales. Il est néanmoins possible que vous ayez déjà entendu/lu que les études de non-infériorité nécessitent plus de sujets sur les autres parce qu'elles « explorent un territoire plus large ».. Cet argument, sans réel fondement statistique, est peut-être dû au fait que les différences attendues sont souvent plus faibles dans les études de non-infériorité, ce qui provoque une impression d'avoir besoin de plus de sujets que pour les études de supériorité.

7. Facteurs et marqueurs de risque, facteur pronostique rn

L

Définition

L

I IC

Variable associée significativement à un événement et dant le lien de causalité peut être au moins suspecté. Modifier spécifiquement le facteur de risque pourra avoir un impact sur la survenue de l'événement auquel il est lié

Variable significativement associée à un événement, mais qui ne peut pas être suspectée de jouer un rôle causal. Modifier la valeur du marqueur de risque n'aura aucun impact sur la survenue de l'événement

Variable significativement associée à une évolution défavorable de la situation chez un patient

Un taux élevé de LDL cholestérol est un facteur de risque cardiovasculaire

Un taux élevé de BNP est un bon marqueur de risque de décompensation cardiaque, mais baisser spécifiquement ce taux {avec des anticorps, par inhibition enzymatique) n'aurait absolument aucun effet sur le risque de décompensation cardiaque car le BNP n'est qu'un marqueur de risque

Une valeur élevée de CRP dans un contexte de pancréatite aiguë est associée à un sur-risque de complications de celle-ci, dont le décès

'J

I Exemple

:"l

l

V

z ,..

y

'Jil

Généralités

Certains rédacteurs ont tendance à utiliser l'un pour désigner l'autre ... Pas toujours facile de savoir si l'on est face à un piège ou un manque de rigueur !

8. Populations, inférence et généralisation • L'échantillon est la population avec laquelle on travaille dans l'étude. Il s'agit de patients issus de la population source, qui ont été sélectionnés selon les critères d'inclusion et d'exclusion. • La population source est la population théorique dans laquelle on tire au sort l' échantillon de l'étude. On la dit théorique car c'est une population qui n'existe pas au-delà de l'étude . Par exemple, tous les patients avec une sarcoïdose consultant dans 3 CHU n'ont pas de liens autres que celui que l'étude leur a attribué. Pour aller plus loin avec la LCATBC

Il existe un format d'étude dans lequel la population source n'est pas fictive : l'étude en population. Les échantillons sont tirés au sein d'une communauté réelle d'individus, par exemple définis selon des critères géographiques. Les exemples les plus marquants sont les essais réalisés au sein de villes réelles, les habitants de ces villes ayant une existence réelle en communauté au-delà du cadre de l'étude. Les populations étudiées sont souvent qualifiées de population générale (en opposition donc à des populations fictives définies seulement par les auteurs pour l'étude) : • avantage : bonne validité externe en raison de la « réalité » de cette population même en dehors de l'essai ; • inconvénient : essais très coûteux et associés à des difficultés logistiques (recrutement de grands échantillons, gestion de grandes bases de données prospectives). • La population cible est un ensemble théorique de sujets qui sont concernés par la question posée dans l'article. Elle correspond en pratique à des sujets à qui on pourra appliquer les résultats de l'étude. • L'inférence est le fait d'appliquer les résultats de l'échantillon à la population source. • La généralisation est le fait d'appliquer les résultats de l'échantillon à la population générale.

9. Types de variables On peut d'emblée distinguer 2 grands types de variables : non censurées et censurées.

Variables non censurées Celles-ci peuvent prendre des valeurs qui sont soit connues, soit inconnues, mais pas partiellement connues. On retrouve dans cette catégorie les variables qualitatives et quantitatives, qu'il faut absolument savoir distinguer !

9

Cours

Variables quantitatives • Les variables quantitatives sont des variables dont la valeur est une grandeur numérique. Elles peuvent être : discrètes : seulement certaines valeurs sont autorisées . Par exemple : score de Glasgow à 4, 5, 6 etc. ; score de Rankin à 1, 2, 3 etc. ; taille en mètre à 1 cm près : 1,71 m, 1,72 m, etc . ; continues : toutes les valeurs sont théoriquement autorisées. Par exemple : valeur de CRP ; taille d'une lésion au scanner, etc. • On peut les décrire selon deux grandes modalités : la médiane et ses disciples (quartiles, percentiles, IQR [interquartile range]), qui fonctionnent ensemble. Les études présentent les résultats sous la forme « median (IQR) »; la moyenne et ses disciples (écart-type [SD = déviation standard], variance, étendue), qui fonctionnent ensemble. Les études présentent les résultats sous la forme « mean (SD) » ; les deux possibilités sont plus ou moins équivalentes, mais il est bon de savoir que la médiane (IQR) n'est pas affectée par les valeurs extrêmes (contrairement à la moyenne (SD)). On utilisera donc de préférence la médiane lorsque la distribution des valeurs n'est pas normale. Un piège classique est l'inversion médiane/moyenne (median vs mean). C'est un distracteur tout trouvé et vous allez vous faire avoir une fois ! C'est vexant et on ne s'y reprend plus! Voici un tableau qui définit les notions qui viennent d'être évoquées . Médiane

Correspond à la valeur de la mesure pour laquelle 50 % des mesures dans l'échantillon sont supérieures et 50 % sont inférieures

Quartiles

Correspondent aux mesures pours lesquelles 75 % (1er quartile), = médianel ou 25 % (3e quartile! des valeurs sont supérieures

IQR(= interquartile range = écart interquartile)

50 % (2 nd quartile

Différence entre les valeurs des 1er et 3e quartiles . Ces deux quartiles définissent un intervalle au sein duquel se trouvent 50 % des mesures

Percentiles

Un xe percentile est la mesure pour laquelle 100-X % des mesures sont supérieures . Exemple : le 25" percentile est le 1er quartile

Moyenne._.

Égale

Écart-type o

Indice de dispersion des valeurs autour de la moyenne . Au sein d'une distribution normale, 96 % des valeurs se retrouvent dans l'intervalle fJ ± 2o

(= standard

à la somme des mesures divisée par l'effectif total

deviation) Variance

Égale à la moyenne du carré des écarts égal à sa racine carrée

Étendue

Différence entre les valeurs maximale et minimale de l'échantillon

(= range)

10

à la moyenne, elle définit l'écart-type qui est

Généralités

Exemple

Prenons en exemple 11 mesures de glycémie chez un patient diabétique : Glycémie (mmpm/L)

12

8

4

•• •• •• ••• ••

Série

œvaleurs :

4, 4, 5, 5, 6, 6, 7, 8, 12, 12 Mayenne (SD) = 6,7 (2,7) Médiane (IQR) = 6 (3)

Ici, l'étendue est de 8 (4-12), la médiane est de 6 (5 valeurs au-dessus, 5 en dessous) et 25 % des valeurs sont inférieures au 1er quartile qui est de 5. On voit que la moyenne est supérieure à la médiane de 0, 7, ce qui s'explique par le fait que 2 valeurs de glycémie hautes sont enregistrées, ce qui pousse la moyenne vers le haut mais ne modifie pas la médiane.

Variables qualitatives Les variables qualitatives correspondent à des catégories. Elles peuvent être : • binaires (mort ou vivant, récidive ou non, score de Rankin > 2 ou non) ; • non binaires (modalités d'imagerie réalisée pour le diagnostic (IRM, scanner ou écho), grade de sévérité de la pancréatite) ; • ordinales : variables quantitatives qui ont été discrétisées, c'est-à-dire qu'on a réduit le nombre de valeurs autorisées en créant des catégories (par exemple, âge (< 65 ans ou entre 65 et 85 ans ou > 85 ans) ; nombre de micrométastases à la dissection ganglionnaire (0, < 3, 3-7, > 7), etc.). On ne peut pas les qualifier en termes de moyenne ni de médiane, mais plutôt en termes de proportions de sujets dans chaque catégorie. On remarque que les scores et les grades peuvent être décrits comme des variables quantitatives ou bien des variables qualitatives ordinales. Pour trancher, il faut voir si les auteurs calculent des effectifs par catégorie (variable qualitative ordinale), ou si les scores sont décrits avec moyenne/médiane/écart-type etc. (variable quantitative).

Variables censurées Une variable est dite censurée si elle témoigne d'une information qui peut ne pas être connue complètement pour chaque patient au moment de l'analyse. C'est l'exemple 11

Cours

classique de la survie, qui peut être mesurée tant que le patient donne des nouvelles, puis ne pas être connue à partir d'une date de perte de vue, qui correspondrait à la date des dernières nouvelles et de censure. Dans ce cas, l'information sur la survie n'est que partielle : on sait que le patient a survécu un certain temps, mais son statut ultérieur est inconnu. Sa valeur n'est donc que partiellement connue lors de l'analyse, elle est censurée. ! La survie est une variable censurée, mais qu'il ne faut pas confondre avec une variable qualitative binaire non censurée : la survie à X jours. On ne s'intéresse à la variable qu'au Xe jour : les patients sont soit morts, soit vivants, soit de statut inconnu en cas de données manquantes. Dans ce dernier cas, la valeur de la variable n'est pas partiellement connue mais est totalement inconnue.

1O. Caractéristiques d'un critère de iugement principal Le critère de jugement principal est celui sur lequel toute l'étude repose, et le seul sur lequel on est autorisé à conclure (en plus de l'analyse de sécurité). Tout comme les variables (11air plus haut, paie 9), il en existe plusieurs types, recensés ici . Caractéristique

I

Définition Un seul critère est

Unique

Multiple (et)

composite (ou)

Quantitatif

Qualitatif

utilisé pour l'analyse principale L'analyse principale de l'essai porte sur

I

Exemple Mortalité à post-AVC

30 j

I

À savoir C'est le cas standard qui s'oppose au critère combiné (catégorie qui comprend les critères multiples et les composites)

TVP et embolie pulmonaire à 10 j d'une chirurgie de hanche

C'est une exception, que les auteurs doivent justifier dans le protocole

Il existe plusieurs

Récidive d'IDM

• Intérêt : augmente la puissance

sous-critères qui valident le CJP. La réalisation d'un seul de ces sous-critères suffit à valider le critère entier

à 30 1· ou

via le nombre d'événements, et réduit donc le NSN • Limite : nécessite que les composantes du CJP soient de pertinence comparable (IDM ou AVC ou arrêt cardiovasculaire, et non IDM ou AVC ou apparition d'une verrue) • On ne pourra conclure que sur le critère composite au total, et pas seulement sur une de ses composantes

plusieurs critères en parallèle

Variable dont la valeur prend des

données numériques de grandeur Variable dont la valeur prend des catégories ou des modalités

morta ité à 30 j ou nécessité d'une assistance ventriculaire à

30 i

Distance parcourue en 6 min ; pression artérielle Mortalité à 30 j ; score CTSI d'une pancréatite aiguë

! Les scores et les échelles peuvent être analysés en variables quantitatives (valeurs du score comparées) ou qualitatives (par exemple, comparaison de la proportion de patients avec un score de Glasgow >7)

-+ 12

Généralités

Caractéristique

Censuré (= censored)

Binaire

1

Définition

1

Exemple

1

À savoir

Variable dont la valeur peut être inconnue sur une partie de la période étudiée

Survie sans récidive ; survie globale à 3 mois

Va usuellement de pair avec les données de survie en LCA, donc avec une courbe de Kaplan-Meier, une anaxse en log-rank et un modèle e Cox associé à des HR (c'est le« pack survie»)

Variable dont la valeur ne peut être choisie qu'entre

Mortalité; récidive

Caractéristique fréquente des variables qualitatives

deux options

Final/clinique/ cliniquement pertinent (= clinica~

Intermédiaire (= surrogate)

Critère sur lequel le clinicien souhaiterait idéalement évaluer une différence clinique (ça change la vie du patient), ou poser un diagnostic

Récidive d'IDM à l an ; apparition d'un d iabète gestationnel

• Critère qu i ne changera pas la vie du patient, n' établit pas de diagnostic • Utilisé car il est

Taille des uretères au scanner en cas de colique néphrétique ; taux de cholestérol ; pression artérielle

Appréciation au cas kar cas : plus on s' éloigne de a variable « mortalité », plus le critère est probablement intermédiaire

Critère dont la mesure n'est pas soumise à interprétation (et donc qui ne peut pas être influencée par le point de vue d ' un intervenant) et fidèlement reproductible

Mortalité ; mesure biologique (hémoglobinémie, CRP, bêtaHCG, etc .) ; mesure calibrée par une machine (VEMS)

• Pour la question délicate de l'imagerie, cela peut varier en fonction des correcteurs mais le plus souvent, on considérera que tout ce qui est mesuré sur un scanner/lRM est plutôt objectif • Dans une étude ouverte, il est fondamental que le critère soit objectif sinon il pourrait être trde influencé par la connaissance e l'exposition par exemple

Critère dont la mesure est soumise à interprétation, et qui peut varier d'un évaluateur à l'autre

Sentiment d'amélioration ; échelle visuelle ; b ien-être/ qualité de vie ; examen clinique

Pour l' imagerie, on considérera habituellement que l'échographie est subjective (à pondérer en fonction du sujet, car elle est plus objective qu'un simple examen clin ique) . L'idéal est donc d'avoir les mêmes évaluateurs pour tous les patients, mais il est aussi intéressant d'avoir plusieurs évaluateurs pour chaque patient.

C'est une appréciation au cas par cas, j'utilise souvent l'astuce « Est-ce que ça change la vie du patient ? » pour décider

accessible plus facilement

Objectif

Subjectif

13

Cours

Exemple

Soit un nouveau traitement que l'on teste contre placebo. Le CJP de l'essai est le critère composite « thrombose veineuse du membre inférieur », « embolie pulmonaire » ou « mort à 3 mois ». Voici les critères validés par nos 7 patients au bout du suivi : Thrombose veineuse du Ml

-

--

Patient 1 Patient 2 Patient 3 Patient 4 Patient 5 Patient 6 Patient 7

Embolie ulmonaire (EP)

Mort à 3 mois

X X

X

X

On voit que 3/7 patients ont validé le CJP. Les patients qui valent deux composantes du CJP ne comptent qu ' une fois. On a donc une incidence à 3 mois du CJP de 3/7 :::: 43 %. Quand on y regarde de plus près, tous les sujets ayant validé le CJP l'ont fait avec au moins l'événement thrombose veineuse périphérique . Aucun mort n'a été repéré. On est cependant obligés de conclure (si l'analyse est positive) que le traitement est associé à une différence en termes de mort ou d'EP ou de TV.

Cela met en évidence l'importance de trouver des composantes de gravité comparables (EP et mort : pourquoi pas, mais la thrombose veineuse périphérique et la mort ne devraient pas faire partie du même CJP) !

11. Interprétation du tableau 1

Q

Dans toutes les études, le tableau 1 est celui qui décrit les caractéristiques des patients de chaque groupe (âge, sexe, ethnie, etc.) . Il est une source de questions très appréciée des rédacteurs. Son interprétation ne doit pas poser de problèmes. Il faut savoir que : • il est habituel de ne pas réaliser de tests comparatifs sur deux bras randomisés en raison de l'inflation du risque alpha. Les comparaisons doivent se faire à l' œil. Il est cependant possible que des p-values soient proposés, en raison de petits effectifs, de différences cliniquement parlantes, ou bien dans les essais sans randomisation (cas-témoin par exemple) ; • parcourir les caractéristiques des patients peut permettre de se faire une idée sur le patient-type de l'échantillon, de s'imprégner de l'ambiance, et de comparer échantillon et population cible (si essai sur l'AVC et médiane d'âge à 30 ans, la validité externe est faible) ; • il faut faire attention aux questions sur les moyennes (m ean) vs médianes (median), effectifs vs proportions, étendue vs quartiles ; • des questions sont fréquemment posées sur les petites lignes sous le tableau avec les astérisques, qui complètent parfois pertinemment les données . Il n'est pas essentiel de passer du temps dessus mais ces petites lignes ont parfois de grandes conséquences (données manquantes, ajustements, etc.) . Pour vous en convaincre, jetez un œil aux « petites lignes » du tableau 1 du sujet 1 de 2020. On y apprenait pêle-mêle que les valeurs étaient

14

Généralités

exprimées en moyenne et écart-type, qu'aucune différence n'existait entre les groupes (sauf pour certaines caractéristiques !), etc. Bref, un mini paragraphe à ne pas louper ! • le tableau 1 est toujours commenté par les auteurs dans la partie résultats du texte de l'article. Une question sur le tableau 1 doit donc vous faire chercher la réponse dans la triade : tableau 1, petites lignes du tableau, et texte qui commente le tableau 1 dans la partie résultats. Exemple

Coun Canada

84 (57%)

86 (55%)

USA

63 (43%) 65.1 (7. 13; 48-80)

69 (45%) 65.0 (7.56; 48-81)

132 (90%) 15 (10%) 8 (5%)

141 (91%) 14 (9%) 12 8%) 28.9 (4.56; 18.7-46. 1) 31 (20%) 44.2 (19. 17; 13.5-120. 1) 5.8 2.60; 0 .3-10.3) 11 .0 (9 .28; 0 .0-48 .0)

A e,

ears

Race White Non-white Black

Prostate volume ml Total MAX-PC score

28 .3 (5 .57; 21.3-59.2) 30 (21%) 43 .2 (15.32; 14.6-79.8) 5.6 2.52; 0 .4-11.0) 11 .3 (8.84; 0 .0-45.0)

Di ital rectal examination Focal abnormali

127 86% 20 (14%)

142 92%)

0 147 (100%) 10.0% (5 .3-33 .3)

1 (1%) 154 (99%) 10.0% (4.5-40)

8.0% (0-48)

8.0% (0-45)

1.4 (0.2-9.3) 7.7 (6 .30; 0 .0-29.0)

1.3 (0.2-11.0) 7.8 (5.73; 0.0-24.0)

13 (8%)

Gleason score

5 6 Median percentage of cancer-positive cores Median maximum percentage of core involved

Data are n (%), mean (SD; range), or median (range). MAX-PC=Memorial Anxiety Scale for Prostate Cancer.

12. Fluctuations d'échantillonnage Deux groupes générés par tirage au sort strict au sein d'une même population (par randomisation par exemple) ne devraient pas être différents, aux fluctuations d'échantillonnage près. Il faut donc les évoquer lorsque des différences entre deux groupes sont mises en évidence sur le tableau 1. 15

Cours

! Une défaillance de la randomisation est une autre explication moins probable mais toutefois possible.

À l'inverse, lors de la génération manuelle de deux groupes (par appariement de cas et de témoins sur certaines caractéristiques ou par sélection de patients selon un facteur d'exposition pour une cohorte) les caractéristiques des patients ne sont pas présumées identiques. En effet, un tiers facteur sépare les deux groupes (maladie pour les cas-témoins, exposition pour les cohortes) . Ce tiers facteur a pu avoir des conséquences sur les autres variables. Les fluctuations d'échantillonnage sont toujours possibles mais l'hypothèse d'un lien entre les caractéristiques des groupes et la variable d'intérêt est souvent le plus probable. Exemple

Une étude cas-témoin compare des patients obèses et des patients de poids normal. La prévalence de diabète de type 2 sera très certainement plus élevée dans le groupe des obèses, probablement en raison du lien direct entre obésité et diabète de type 2 .

13. Flow-chart

e

Le diagramme de flux(= jlow-chart) constitue classiquement la figure 1 de l'étude, et définit la suite des événements qui sont arrivés aux patients, depuis leur considération pour rentrer dans l'essai jusqu'à leur analyse ou leur exclusion . C'est un graphique à visée pédagogique, apprécié du correcteur. Il est codifié par la convention CONSORT 2010 sous cette forme : CONSORT 2010 Flow Diagrma Assessed for elig ibility (n= Excluded (n= ) • not meeting inclusion criterio (n= ) • declined ta porticipote (n= ) • other reoson (n= )

16

Allocoted ta invention (n= ) • received ollocoted intervention (n= ) • did not recieve ollocoted intervention (give reosons) (n= )

Allocoted ta intervention (n= ) • received ollocoted intervention (n= ) • did not recieve ollocoted intervention (give reosons) (n= )

Lost ta lollow-up (give reosons) (n= ) Discontinued intervention (give reosons) (n=)

Lost ta lollow-up (give reosons) (n=) Discontinued intervention (give reosons) (n= )

Anolysed (n= ) • excluded lrom onolysis (give reosons) (n= )

Anolysed (n= ) • excluded lrom onolysis (give reosons) (n= )

Généralités

La principale difficulté posée par le correcteur est la définition des différentes populations en fonction du flow-chart. Ces notions seront détaillées plus tard, mais on peut déjà noter que : • l'ITT se définit par l'analyse de tous les patients randomisés (moins les patients ayant retiré leur consentement), dans leur bras de randomisation ; • l'analyse en per-protocole n'analyse que les patients ayant suivi le protocole à la lettre, à savoir uniquement les patients qui ont eu le traitement initialement attribué (mais on restera attentif à toutes les situations ayant conduit à la violation du protocole: perdus de vue, traitement reçu différent de celui alloué, etc.) ; • l'analyse en traitement reçu analyse en plus de la population per-protocole les patients ayant reçu l'autre traitement que celui alloué, dans le bras du nouveau traitement effectivement reçu (on étudiera donc en particulier le nombre de patients ayant changé de traitement). Voici un exemple annoté (la notion d'ITT modifié sera abordée plus tard) : 425 patients assessed for eligibility - - - - - - - - - 11 did not meet inclusion criteria

Nombre de patients évalués pour inclusion

◄.__--Nombre de patients non inclus parmi ces patients

! l calcul popuation per-protocole, en traitement reçu et en ITT modifiée

4 hod missing dota

202 patients included in efficocy analyses

200 patients included in efficocy analyses

Nombre de patients inclus dans l'analyse principale (ici différent du nombre de patients randomisés moins les retraits de consentements •> c'est une ITT modifiée)

14. Test significatif, hypothèse nulle En statistiques, un résultat est jugé significatif si la probabilité p qu'il soit dû uniquement au hasard en l'absence de résultat réel est inférieure à un seuil concédé appelé risque alpha. L'absence de résultat correspond à l'hypothèse nulle HO. En LCA, cette dernière correspond à l'hypothèse que l'on souhaite rejeter en commençant l'étude : • pour un essai de supériorité, c'est que le nouveau traitement est égal ou inférieur au traitement usuel ; • pour un test d'équivalence, c'est qu'il existe une différence d'effet entre les deux traitements ; • pour un essai de non-infériorité unilatéral, c'est que le traitement contrôle est supérieur; • pour un essai d'épidémiologie analytique, c'est qu'il n'existe pas de différence de risque entre les deux groupes. Un essai non significatif n'aura pas réussi à rejeter HO, mais cette hypothèse n'est pas acceptée pour autant: on peut rejeter HO mais pas l'accepter. En effet, il existe toujours la possibilité que l'hypothèse nulle observée ne soit en réalité qu'un manque de puissance. 17

Cours

En cas de résultat significatif, on peut en revanche accepter H1, hypothèse alternative qui correspond à ce que veulent montrer les auteurs au début de l'article (équivalence, supériorité, non-infériorité). La probabilité p qu'un résultat au moins aussi important soit retrouvé dans un monde où l'hypothèse nulle est vraie est calculée à l'aide de tests statistiques qui sont spécifiques au type de données analysées. Ces tests déterminent la valeur de p (p value) qui, si elle est inférieure au seuil fixé alpha, permet de conclure à un résultat significatif(= on se dit qu'il est peu probable que l'effet soit seulement expliqué par le hasard) et de rejeter la possibilité que l'hypothèse nulle soit vraie, au risque alpha près de se tromper. Si cette valeur de p est supérieure à ce seuil, alors le résultat est jugé non significatif et l'hypothèse nulle n'est ni rejetée, ni acceptée. Exemple d'hypothèse nulle

On souhaite savoir si les sujets atteints de sarcoïdose ont des taux d'enzyme de conversion (EC) plus importants que ceux de la population générale. On mesure ces taux dans deux échantillons de sujets malades et témoins, que l'on compare à l'aide d'un test statistique. On admet un risque alpha de 5 %. L'hypothèse nulle HO est que les moyennes des taux d'EC sont égales entre les deux groupes. L'hypothèse alternative est que ces moyennes sont différentes. Le test statistique indique une p value de 0,003, indiquant qu'il existe 0,3 % de chance de retrouver une différence de moyennes au moins aussi grande sous l'hypothèse nulle. Cette valeur est inférieure à notre seuil alpha = 0,05 : elle est donc significative et l'étude est concluante au risque alpha = 5 %.

15. Causes de négativité du résultat Un résultat peut être négatif(= non significatif), entre autres, en raison d'un manque de puissance ou en raison de l'absence d'effet réel. Dans le premier cas, le résultat pourra montrer une tendance vers la significativité (p proche de 0,05, OR/RR/HR loin de 1), mais les bornes de l'IC seront trop larges pour conclure. Les grands effectifs resserrent les bornes et augmentent la puissance. Dans le second cas, !'estimateur de la différence entre les groupes ou de l'OR/RR/HR sera très loin de la significativité et on aura l'impression que, même en resserrant les bornes, rien n'y changera. Probablement pas de différence réelle

E

le

J

Différence réelle probable

_Ql"' uz .2



J

Q)

C: Q)

E O>

:±: Q)

a... Q)

:o-o

Eje

18

370

53

35

0.94 (0.51, 1.71)

0.82 (0.19, 3.55)

0.95 (0.21, 4.25)

T2 278-370

42

47

0.55 (0.30, l .00)

0.7 4 (0.27, 2.04)

0.7 6 (0.27, 2 .15)

Ti < 278

55

34

1.00

1.00

1.00

1.000

0.814

0.969

T3

p for trend Protein, g/d 44

45

0.49 (0.27, 0.80)

0.32 (0 . l 0, 1.02)

0.99 (0.23, 4.31)

T2 65-95

46

41

0.56 (0.31, 1.03)

0.49 (0 .19, 1.26)

0.97 (0.31, 3.00)

Ti< 65

60

30

1.00

1.00

1.00

0.031

0.079

0.990

T3

> 95

p for trend

Ici, il n'existe une relation dose-effet que pour les protéines dans le modèle univarié (p < 0,05) . Celle-ci disparaît lors de l'analyse multivariée : elle était probablement due à des facteurs de confusion.

24. Modèles statistiques en LCA Un modèle statistique est une proposition mathématique qui tente d'expliquer par des hypothèses quantifiées des observations statistiques réelles. En pratique, c'est une façon de traduire des effets réels (majoration des risques de cancer par le tabac par exemple) par des équations. L'intérêt de passer par un modèle est la capacité qu 'il nous offre de se plier à des contraintes nouvelles pour expliquer les données. Le modèle construit un ensemble d'équations qui traduisent une hypothèse de fonctionnement du monde qui expliquerait les données fournies . À partir de ce monde simplifié et quantifié, l'investigateur peut ensuite mesurer l'impact de différentes adaptations du modèle à de nouvelles contraintes. En LCA, il est souvent là pour ajuster l'effet de variables, par exemple en analyse multivariée (voir plus loin) . Exemple

OK modèle, qu 'est ce qui se passerait si en fait l'effet du tabac était annulé ? Est-ce que le fait d'être un homme serait tout de même associé au risque de cancer? Et quelle serait la force de cette nouvelle association indépendante du tabac ? Seules des variables mesurées peuvent être introduites dans un modèle (pas d'ajustement sur une donnée non mesurée) . Il existe des modèles différents pour différentes questions. Les plus fréquents sont : • le modèle de Cox en analyses de survie , pour les variables censurées ; • le modèle de régression logistique , pour les variables qualitatives ; • le modèle de régression linéaire , pour les variables quantitatives .

30

Généralités

25. Analyse de sensibilité C'est une analyse supplémentaire ayant pour objectif de tester la robustesse du résultat principal à l'égard de changements dans les méthodes (analyse en per protocole en plus d'une ITI, etc.), dans la définition des variables (modification du CJP, etc.) ou dans les hypothèses statistiques. En LCA, c'est une analyse qui ressemble à l'analyse principale mais qui diffère selon un aspect dont on cherche à connaître l'impact sur la significativité du résultat. Si le résultat est le même ou change peu, l'analyse principale est robuste vis-à-vis de ce changement et la confiance en ce résultat augmente. Si l'analyse principale et les analyses de sensibilité sont discordantes, alors du recul est nécessaire vis-à-vis du résultat principal (qui reste néanmoins valide).

& On ne conclut pas sur l'analyse de sensibilité, qui reste une analyse exploratoire ! Il n'y a pas besoin d'ajuster le risque alpha ici malgré une analyse supplémentaire : l'analyse est en fait une réanalyse des mêmes données. Les analyses de sensibilité sont une bonne pratique et sont attendues dans le protocole de tous les essais contrôlés randomisés de qualité. Elles sont prévues dans l'idéal a priori mais peuvent être réalisées a posteriori. Exemple

Dans des essais cliniques de phase 3 pour des chimiothérapies avec un CJP de survie sans récidive, il arrive d'utiliser une mesure du CJP qui peut être une récidive clinique ou radiologique. Il est de bonne pratique de réaliser, en plus, une analyse de sensibilité en n'utilisant que les données des sujets avec une progression radiologique prouvée, et non seulement clinique, pour vérifier que le résultat principal n'est pas biaisé.

26. Analyse univariée vs multivariée Une analyse est dite univariée si elle teste le lien brut entre deux variables sans prendre en compte les autres. Une analyse multivariée analyse ce même lien, mais en corrigeant l'impact (ajustement) d'autres variables sur ce lien . C'est une méthode forte pour corriger les facteurs de confusion. Il faut avoir en tête les trois types d'analyse multivariée cités dans le glossaire du Collège de LCA. Ce genre de question, même peu tombable, pourrait permettre de faire une énorme différence. Ce sont de toute façon des mots quel' on croise tout le temps dans les articles : je propose donc de faire le point en quelques mots : • modèle de Cox pour les HR (Cox proportional-hazards mode0 de données de survie ; • régression logistique pour les OR/RR de données qualitatives ; • régression linéaire pour les OR/RR de données quantitatives. Il faut avoir identifié et mesuré les variables qui vont servir d'ajustement avant de les intégrer dans le modèle multivarié.

31

Cours

Une dernière chose à savoir, déjà tombée plusieurs fois : quand l'ajustement sur une variable modifie peu un résultat, l'impact de la variable qui a servi d'ajustement sur la variable analysée est faible . C'est un critère de validité interne. Au contraire, si un fort effet de confusion est mis en valeur par des ajustements dont l'impact sur les OR est élevé, on doit suspecter des biais de confusion sous-jacents. Exemple

Prenons l'exemple du cancer du poumon : considérons les facteurs de risque tabac, amiante, sexe et café. Considérons que le tabac et l'amiante sont les deux seuls facteurs réellement à risque de cancer, et qu'il y ait un lien entre sexe et tabac ; sexe et amiante et tabac et café. En raison de leur lien réel avec le cancer du poumon, ou de leur lien avec un facteur lié réellement au cancer du poumon, tous les facteurs considérés sortent comme « à risque » en analyse univariée. Quand on utilise un modèle qui ajuste l'effet de chaque variable, l'impact du tabac sur le café est annulé, et la variable n'est plus considérée comme à risque en analyse multivariée. C'est tout l'intérêt de ces analyses. Elles ne sont cependant pas parfaites et il faut connaître et mesurer les variables pour les ajuster entre elles. Analyse univariée

Modèle multivarié ajusté

Amiante

Cancer du poumon

p

-~ 1- - - - - - - - - - - + - - - - ::,

;i;Q) ~C: Q)

~

1 l month

1 2 months

2

Follow-up (months)

60

1 3 months

Not a risk

3

2

No of events

0

0

3

.

Analyse de survie

Pour aller plus loin avec la LCATBC

Il est possible que vous rencontriez également un autre type de courbe, bien que plus rare : la courbe actuarielle. La logique reste la même mais au lieu d'avoir « des marches d'escalier», on a une courbe qui relie directement les différents points. Représentation graphique

Kaplan-Meier

Actuarielle

Temps de participation

Après construction de la courbe de Kaplan-Meier, l'étude prend toujours la même tournure: 1) Les auteurs comparent les surfaces sous deux courbes de Kaplan-Meier via le test du Log-Rank (correspondant à l'analyse univariée des études de survie). Celui-ci s'interprète de manière très simple et similaire aux autres tests : on compare la valeur de p au risque alpha de l'étude pour conclure ou non à une différence significative. 2) Il est ensuite classiquement réalisé un ajustement sur les facteurs de confusion (donc une analyse multivariée) dans un modèle de Cox ayant pour résultat des Hazard Ratio (voir plus bas). Avant de s'intéresser à ces analyses comparatives, les correcteurs aiment beaucoup poser une question d'interprétation graphique : calculer la médiane de survie.

2. Calcul d'une médiane de survie ! C'est un piège très fréquent et il faut vraiment être au point là-dessus. Il faut atteindre au moins 50 % d'événements au cours du suivi pour calculer une médiane de survie sans événement ! Une fois qu'on a vérifié que c'était bien le cas, la médiane correspond graphiquement au temps nécessaire pour valider 50 % d'événements. 50 % de survie correspond à 50 % d'événements. Certaines courbes de Kaplan-Meier sont exprimées en termes de survie, d'autres de probabilité cumulée d'événements (voir le sitjet 1 de 2020, p,~îJC 20.J) : c'est globalement la même chose (survie = 1-événement).

61

Cours

Survie sans événement

0

2m

4m

6m

Sm

Temps de suivi

• Ici, on peut calculer la médiane de survie de la courbe rouge, environ égale à 4,75 mois. On ne peut pas calculer la médiane de survie de la courbe bleue, qui n'atteint pas 50 % de survie au terme des 9 mois de suivi. • Les bâtons verticaux sont les patients censurés. ! Note au sujet des courbes de Kaplan-Meier : plus l'échantillon est petit, plus chaque événement créera une marche d'escalier importante dans la courbe. Cela s'explique en comprenant que chaque décroché correspond à la perte d'un patient au numérateur du calcul de la probabilité de survie : c'est minime sur 1000 patients, mais énorme pour 20 patients (- 5 %) ! Exemple

La courbe rouge a des marches toutes petites (voir ci-dessous) et donc un grand échantillon mais c'est l'inverse pour la courbe bleu qui est un petit échantillon. Les deux courbes sont en revanche à peu près équivalentes en termes de probabilité de survie car elles sont superposables .

62

Analyse de survie

3. Hazard ratio(= HR = rapport de risques instantanés) Le hazard ratio (HR) est défini par le rapport des risques instantanés de réaliser l'événement dans un groupe par rapport au groupe de référence. Il concerne toute la période de suivi d'intérêt, et pas seulement une date précise, à l'inverse des RR et OR qui s'établissent au moment de la mesure des critères de jugement. Par exemple, un HR à 2 signifie que le risque instantané de présenter l'événement dans le groupe contrôle est deux fois plus grand dans le groupe à l'essai que dans le groupe contrôle, sur la durée du suivi. On ne peut pas vous demander de calculer un HR. C'est !'estimateur utilisé dans les études de survie où la mesure du critère de jugement est continue et qui permet d 'établir des risques instantanés de présenter l'événement. Son interprétation numérique est identique à celle des OR et RR, qui est détaillée dans la partie « études épidémiologiques » (voir page suivante). Exemple

Considérons une étude sur l'efficacité sur la survie sans métastase cérébrale de la prévention des métastases cérébrales par irradiation « encéphale in toto », dans une population de patients souffrant de cancer du sein avancé . Le HR de l'événement composite (mort ou métastase cérébrale) est de 0,7 dans le groupe irradié (IC à 0,5 - 0,9). On peut donc dire que l'irradiation réduit de 30 % le risque instantané de mort ou de métastase cérébrale par rapport à l'abstention dans le cancer du sein avancé. La courbe de survie de Kaplan-Meier ressemblerait à celle-ci et la médiane de survie sans événement serait de 7 mois dans le groupe contrôle et de 11 mois dans le groupe irradiation :

100%

HR = 0,7 (0,5-0,9) Logronk p = 0,003

"E Q) E Q)

C: • Q)

>

• Q)

"' C:

50%

lil Q)

-~

::,

T e 1 ::. ~ pl , , f 1 ncLnC" • c ro.1es. ...

C'O. 1de

LC•I

t du Ve>' pue c•c,pt re

lc.epie•l nou•, •,c,mme, cle muni•,, ,1 plu..;; pC'rso:1ne ne : t · :::e , no\. s 1e >ouv nD •t VC•U' ~ e> l' me• t •".: ci0•, bute, clc Il' l ",

r.r -ommC"> r07oignc-z-ro•1~ qur ~C' 0~ram (m~mC' lC'q boor~rs qui o-t- pC'U.,. qu0 C"C' 'c,Lt e'e)mPllepi •, C 'e' t vr. 1me•n~ ,, 'lple I fL \TC)',l' 11 IOUVC">:i;' 1 c·e PDF qrcl u1t. • ma. \t, 5oyez ra :.sonnablo et venez ,.. t iJC'r, vo·..i,· y q ign rC'Z ')

Article du sujet 1

Erlotinib as maintenance treatment in advanced nonsmall-cell lung cancer: a multicentre, randomised, placebo-controlle dphase 3 study Federico Coppuzzo, TudorCiu/eonu, Lilia Stelmokh, Soulius Cicenos, Aleksandra Szczésna, Erzsébet Juhâsz, Emilio Esteban, OlivierMolinier, Wolfram Brugger, Ivan Melezinek, Gaëlle K/inge/schmitt, Barbara Klughammer, Giuseppe Giaccone

SUMMARY Background: First-line chemotherapy for advanced non-small-cell lung cancer (NSCLC) is usually limited to four to six cycles. Maintenance therapy can delay progression and prolong survival. The oral epidermal growth factor receptor (EGFR) tyrosine-kinase inhibitor erlotinib has proven efficacy and tolerability in second-line NSCLC. We designed the phase 3, placebo-controlled Sequential Tarceva in Unresectable NSCLC (SATURN; BO18192) study to assess use of erlotinib as maintenance therapy in patients with nonprogressivedisease following first-line platinum doublet chemotherapy. Methods: Between December, 2005, and May, 2008, 1949 patients were included in the run-in phase (four cycles of platinum-based chemotherapy) . At the end of the run-in phase, 889 patients who did not have progressive disease were entered into the main study, and were randomly allocated using a 1: 1 adaptive randomisation method through a third-party interactive voice response system to receive erlotinib (150 mg/ day; n=438) or placebo (n=451) until progression or unacceptable toxicity. Patients were stratified by EGFR immunohistochemistry status, stage, Eastern Cooperative Oncology Group performance status, chemotherapy regimen, smoking history, and region . Co-primary endpoints were progression-free survival (PFS) in ail analysable patients irrespective ofEGFR status, and PFS in patients whose tumours had EGFR protein overexpression, as determined by immunohistochemistry. This study is registered with www.ClinicalTrials.gov, number NCT00556712. Findings: 884 patients were analysable for PFS; 437 in the erlotinib group and 447 in the placebo group . After a median follow-up of 11- 4 months for the erlotinib group and 11 ·5 months for the placebo group, median PFS was significantly longer with erlotinib than with placebo: 12 · 3 weeks for patients in the erlotinib group versus 11-1 weeks for those in the placebo group (HR 0-71, 95% CI 0·62-0·82; p11,000 cells/ mm 3) or leucopenia (85

55 (35.5)

4 (23 .5)

51 (37.0)

0.42

50-85

89 (57.4)

11 (64.7)

78 (56.5)

0 .61

50%

112 (72 .3)

14 (82 .4)

98 (71.0)

0 .40

30-50%

14 (9.0)

1 (5.9)

13 (9 .4)

1

55 mm Hg

1 (0.6)

1 (5.9)

0(0)

0.11

Hemoglobin, g/dl

13.9 ± 1.6

14.2 ± 1.6

13 .9±1.6

0.75

Platelet count

241.7 ± 81 . 1

247.9 ± 156.4

240.9 ± 78 .8

0 .66

Leukocytes

7.3 ± 2.4

7.1 ± 2.6

7 .3 ± 2.4

0.38

Type of surgery lsolated CABG

67 (43 .2)

6 (35.3)

61 (44.2)

0 .61

lsolated AVR

35 (22 .6)

4 (23.5)

31 (22 .5)

1

CABG + AVR

34 (21.9)

5 (29.4)

29 (21.0)

0.53

Other

20 (12 .9)

2 (11.8)

18 (13.0)

1

BMI >27 kg/m

329

ECNi 2018 - Sujet 1

Characteristics

Total (n = 155)

pValue

Clamp time, minutes

73.3 ± 32.9

90.9 ± 39 .6

71.1 ± 31.5

0 .047

CPB time, minutes

88.9 ± 40.6

115 .4 ± 49.4

85.6 ± 38.3

0.013

Intervention duration, minutes

351.7 ± 100.5

444.2 ± 228.5

340.4 ± 63 .8

0.008

Values are mean ± SD or n (%). AYR= aortic valve replacement; BMI = body mass index; CABG = coronary artery bypass graft surgery; CPB = cardiopulmonary bypass; eGFR = estimated glomerular filtration rate; LVEF = left ventricular ejection fraction ; POP = postoperative pneumonia; sPAP = systolic pulmonary artery pressure.

Table 2. Postoperative Complications Complications

1

Total (n = 155)

POPGroup

No- POPGroup

(n = 17)

(n = 138)

p Value

Transfusion

73 (47.1)

9 (52 .9)

64 (46.4)

0.62

Intubation, hours

12.1 ±24.6

28.4 ± 73.3

10.1 ± 4.5

0.07

Bleeding at 24 hours, ml

481.5 ± 211.5

506.5 ± 226.6

478.4 ± 210.3

0.64

Need for vasopressors

47 (30.3)

9 (52 .9)

38 (27.5)

0 .048

Chest radiograph

41 (26.5)

9 (52.9)

32 (23.2)

0 .017

Condensation

5 (3 .2)

3 (17.6)

2 (1.4)

0.010

Pleural effusion

35 (22.6)

6 (35 .3)

29 (21 .0)

0.22

Atelectasia

14 (9.0)

6 (35 .3)

8 (5 .8)

0 .001

Intensive care unit stay, days

5 .1 ± 4 .2

9.7 ± 8.2

4 .5 ± 3.0

0 .002

Hospital stay, days

12.7 ± 8.3

21.7±17.8

11.6 ± 5 .5

12.l ng/ml

0.02 0.048 0 .001

4.91 (l .3218 .33) 1.01 (l.001.02) 7.36 (2 .1625.07)

Cl = confidence interval; OR = odds ratio.

6- - - - - - -

.

g E 4

al

â. ~

3

C:

"

:, 2

!

12

Fig 2. Time to initiation of antibiotic therapy for postoperative pneumonia patients (n ¼ 17).

332

,COMMENT Postoperative pneumonia after cardiac surgery is still a major and common problem. Despite several steps forward in anesthetic skills, and improvements in surgical techniques and equipment, cardiac surgery patients are increasinglyolder,with numerous comorbidities, and are therefore susceptible to pulmonary complications. Identifying patients at high risk of having pulmonary dysfonction could allow early detection and rapid intervention to minimize morbidity and mortality. This diagnostic dilemma warrants a new and specific biomarker that could help to make the diagnosis of postoperative pneumonia earlier. ln recent years, many perioperative biomarkers have been tested and proposed in clinical trials. Procalcitonin has been widely tested in cardiac surgery to detect postoperative infection, but its utility remains controversial. Indeed, cardiopulmonary bypass and cardiac surgery may affect serum levels of several biomarkers, such as PCT and endocan, among others [14-17]. Sorne researchers clearly describe a relationship between PCT and onset of postoperative infection [18] and also ventilator-associated pneumonia [15], but underline that the diagnostic properties of PCT may not be clearly evident during the first 2 days after surgery [18]. In contrast, endocan appears to be an early marker that carries prognostic value in the early hours after surgery. Furthermore, Heredia-Rodriguez and colleagues [19] showed that the predictive value of PCT may be affected by acute kidney injury [19], and endocan has similarly been shown to be correlated to decreasing kidney fonction [20]. Other authors, such as Chakravarthy and associates [21] found no significant difference in serum PCT levels between patients with or without bacterial infection after cardiac

Énoncé

surgery. C-reactive protein is reportedly less specific, and peaks later than PCT [22, 23]. Contrary to PCT or CRP, endocan seems to be specific to pulmonary failure. Mikkelsen and associates [11] showed that in major trauma, low endocan blood levels at hospital admission were associated with subsequent acute lung injury. They hypothesized that the association between lower serum endocan levels and the development of acute lung injury in patients after major blunt trauma reflects dysregulation in leukocyte recruitment. Tang and colleagues [24], in a cohort of 42 ARDS patients, showed that high endocan concentrations predict mortality. Furthermore, they also showed that in ARDS patients, baseline endocan levels are able to predict shock, renal failure, and coagulopathy. They also found a significant link between endocan levels and PCT, but no significant correlation between endocan and CRP levels [24]. In a study including 20 patients, Palud and colleagues [12] found a relationship between low endocan blood levels at hospital admission in septic shock patients and the onset of pulmonary failure at day 3, suggesting that endocan makes it possible to differentiate, among septic patients, those who will go on to have subsequent lung injury. More recently, Ioakeimidou and associates [25] confirmed in a series of 175 septic patients that those who subsequently had ARDS had low endocan levels at admission. Based on these literature data, we decided to conduct a prospective study to test endocan as a diagnostic marker for pneumonia after cardiac surgery. Patients with off-pump surgery were excluded from this analysis to ensure a more homogenous population. Apart from there being no cardiopulmonary bypass in off-pump surgery, another difference between on-pump and off-pump surgery relates to management of ventilation during

surgery. During on-pump surgery, ventilation is ongoing, whereas in our institution we completely stop ventilation during cardiopulmonary bypass. This difference could perturb the results. Indeed, endocan is released progressively into the blood flow during maintained ventilation, whereas it accumulates in the lung during the time that ventilation is stopped, with a washout once ventilation is resumed, causing a difference in release kinetics that is unrelated to potential lung damage. Our study showed that endocan levels were significantly elevated in patients with postoperative pneumonia even before induction of anesthesia, and also 6 hours after surgery. Patients with high blood levels of endocan preoperatively (cutoff 3 .7 ng/mL) and 6 hours postoperatively (cutoff 12. lng/mL) had postoperative pneumonia as often as seven times more frequently than patients with levels below the cutoff values. The kinetics of endocan had a similar profile in both groups, but with consistently higher values in the postoperative pneumonia group. Endocan levels after cardiac surgery, even in patients with uneventful outcome, probably increase because of a proinflammatory systemic response to surgery and subsequent pulmonary dysregulation. Independent predictive factors of subsequent postoperative pneumonia were the same preoperatively and at hour 6, namely, obesity (body mass index greater than 27kg/m 2), length of operation, and endocan levels above the cutoff value. Many studies agree that the duration of surgery has an impact on incidence of postoperative pneumonia [1, 26]. Obesity is also known to be an important risk factor for respiratory complications [27]. Postoperative respiratory failure is increased in obese patients by their supine position during prolonged surgery, a greater propensity to alveolar collapse and obstructive sleep apnea syndrome, and greater 333

ECNi 2018 - Sujet 1

sensitivity to the respiratory depressive effect of sedating drugs and opiates [28]. Endocan is produced mainly by the pulmonary endothelial cells in response to various bacterial components or proinflammatory cytokines. Endocan exhibits antiinflammation specifically by inhibiting leukocyte extravasation [29-31] . Endocan can be viewed as a negative feedback of the inflammation cascade. Depending on the clinical context, an increase in endocan indicates an early pulmonary response to injury. Conversely, absence of an increase, or even a decrease in endocan could indicate insufficient Jung protection against injury. According to the findings of Palud and colleagues [12], Mikkelsen and colleagues [11], and Ioakeimidou and associates [25], low blood endocan in intensive care unit patients is linked to subsequent Jung disease. Indeed, in these studies, blood samples were collected in the context of ongoing disease (septic shock and major trauma, respectively) whereas in our study, blood samples were collected from the start of aggression (cardiac surgery). In the former cases, the endocan plasma level increases in response to surgery, but the increase is greater when the Jung starts to undergo injury by infectious or inflammatory factors, where pulmonary endothelial cells respond by de novo synthesis and release of endocan. In the studies by Palud and colleagues [12], Mikkelsen and colleagues [11], and Ioakeimidou and associates [25], the low blood endocan may be due to either a failure to maintain the pulmonary response or to accelerated degradation by neutrophil proteases. Indeed, endocan can be cleaved by neutrophil-derived cathepsin G to generate a peptide fragment named p 14, which is not detected by the immunoenzymatic assay [30]. Our findings have clinical implications. Although the moderate sensitivity and specificity of endocan preclude starting 334

antibiotic treatment on the basis of endocan results alone, patients with high endocan levels preoperatively or at 6 hours may benefit from aspiration of subglottic secretions, introduction of inclinometers to enhance semirecumbent position, and reinforcement of oral care with chlorhexidine, which have ail been shown to prevent postoperative pneumonia [32]. Moreover, these patients could be strictly monitored to detect signs of pulmonary infection earlier, enabling earlier initiation of antibiotic therapy. In routine practice [33], as in our patients, the average time to formai diagnosis of pneumonia after cardiac surgery is 4.6 3. 7 days. Early treatments are known to reduce postoperative complications and public health care costs [34]. In conclusion, we found that higher serum endocan levels were associated with the subsequent development of postoperative pneumonia after cardiac surgery. The rise in endocan starts as early as induction of anesthesia. The fair sensitivity and specificity of endocan precludes initiation of antibiotic treatment on this basis alone, but enables screening of patients at risk. Lunginnov SAS, Lille, France, provided the endocan assay kits free of charge. The authors wish to thank Mamadou Touré for statistical analysis.

References 1.

2.

3.

4.

H orta! J, M unoz P, Cuerpo G, et al. Ventilator-associated pneumonia in patients undergoing major heart surgery: an incidence study in Europe. Crit Care 2009; 13 :RS0. Michalopoulos A, Geroulanos S, Rosmarakis ES, et al. Frequency, characteristics, and predictors of microbiologically documented nosocomial infections afrer cardiac surgery. E11rJ Ca rdiothorac S11rg 2006;29:456-60. Stephens RS, Shah AS, W hitman GJ. Lung injury and acute respiratory distress syndro me after cardiac surgery. Ann T/10rac S11rg 20 13;95:11 22-9. Bouza E, Perez A, M unoz P, et al. Ventilato r-associated pneu mon ia after h eart surgery: a prospec ti ve analysis and th e va lue of surveill ance. Crit Ca re Med 2003; 31 : 196470.

Énoncé

5.

6.

7.

8.

9.

10 .

11 .

12.

13.

14.

15.

16.

17.

18.

19.

20.

Kirklin JK. Westaby S, Blackscone EH, et al.. Complement and the damaging effeccs of cacdiopuimonary bypass.J ·nwrac Cardiovasc Surg l 983;86:845-57 . Lalfey JG. Boylan JF, Cheng OC. The systemic inflammatory response tu cardiac surgery: impiicatio11s for the anesthes,ologm. Anesrimiology 2002,'>7:215- 52. Abraham E, Matthay MA, Dinarello CA. et .1l. Consensus conlèrence definitions for sepsis. septic shock. acuce long injury, and acute respiracory distress syndrome: time for a reevaluanon . c,-,·r Care Med 200028:232-5. Lassalle P. Molec S,Janin A. et al.. ESM-1 is a nuvel human ,endocheiial cell-,pecific moiecule expressed in long aud regulaced by cytokines.] Bio/ C/,en, 1996:271 :20458-64. Sarrazin S,Adaru E. Lyon M. et al. Endocan or endochelial cell spec1fic molecule-1 (ESM- 1); a pocennal novel endothelial cell market and a new target for cancer therapy. Biuchim Biophys Acta 2006;1765 :25-37 . Gaudet A, Chenev1er-Gobeaux C, Parmenner E. et al. Endocan ,s a stable circularing molecule in !CU panencs. Clin Biochem 2017 April 18: [E-Pub ahead of pFintJ . Mikkeisen ME. Shah CV, Scherpereei A. et al. Lower serum endocan levels are issociated with the developmem of acure lung injury after m:!jo,r tra uma .] Cric Care 2012:27:522. Palud A, Parmemier-Decrucy E. Pastre J, et al. Evaluation of endotheiial biomarkers as prediccors of organ failuJ\!s in sepuc shock patients. Cytokine 2015;7] :2 l 3- 8. Garner JS,Jarvis WR. Emori TG, et al. CDC ddimtions for nosocomial infections, 1988 . Am J it!fecc Contrai 1988;16: 128-40. Madhivathanan PR, Fletcher N. Gaze O. et al. Perioperative kinetics of endocan in patients undergoing cardiac surgery w1tÎ1 and without cardiopulmonary bypass . Cywkine 2016;83: 8- 12. Jiao J, Wang M, ZhangJ, et ail. Procalcitomn as a d11agno,,tic marker of vencilacor-associaced pneumonia in cardiac surgery patients. Exp Tiier Med 2015;9: 1051-7. Amin DN. Pruittr JC., Schuetz P. Influence rn f major cardîopulmonary surgery on sernm levels of procalc1tonin and otlhe1r inflammatory markers. Anaesrli Tnremitie Care 2012;40: 760-6. Heinsel M,Volk T. Docke WD. et al. H yperprucalcit,Jnemia in patients with noninfrctious SIRS and pulmonary dys-function associated with cardio1pu.l:mon:.ry bypas:;. Anesrhesio/ogy 1998;89:93-104. Jebali MA, Hausfater P. Abbes Z, eoc al. Assessment oit" the accuracy of procalcitonin to diagnos,e poscoperativ,e infection after c:ardiac surgery.. Ane.sthni,o/ogy 2007;107:232-8. Heredia--Rod1rig1ue:z M, Bustam.ante-Munguira J, Fierro 1, et al. Procalcitonin can:not be used as a biomarker of inlèct:ion in he.art surgery patients w:ith acute kidney injury. J Crit Care 201 6;33:233-9. Yilm.az Ml, Siriopol D., Saglam M, et al. Plasma endocan levels associate w1th inflammation, vascular ab normalities, cardiovascular events, and surviv,al in chronic kidney disease. Kid11ey /nt 2014;86: 1213-20.

21. Chakravarthy M. Kavar,1gan,1halli D, l!argaofikar S, el r.l. Elevated poscoperative ,erum procaicitonin is nor. indicative of b,,ccerial infection in rnrd,ac surgical pat,ent:5. Arm Card Anaeslh 2015; 18:2 10-4. 22. Dong Z. Jianxm Z, Haraguchi G, e, al. [Procaiciconin for the difterencial diagnosis of intèctious and no11--infecôious sysrernic infL1111maroty respunse rryndromt= afi:er car.d1ac oper,u,on.l Zhongl@I Wei Ziw ,ig Bing Ji ]11, Yi X,ie 21) 14;26:478-•9. 23 . Simon L, Gauvm F, Anue DK, et al. Serum procaiciconin and C--reacrive proleii 1 levels as rnarkerS of bacteriaj infec-tion: a ~y-stematic review and meta--anaiysis. Cii11 bifea Vis 2004;39: 206- 17. 24. Tang L, Zhao Y. Wang D, tt ::il Endocan levds in periphernl blood predict outcomes of acute respirarory di,oress syndrome. Mediawrs Jnflùmm 2014:2014:625180. 25. loakeimido u A. Pagaiou E. Koncog10rgi M. et al. lncrease of circula ting endûcan lJver sepsis follow- up is assùc1:aced with ptogn:ssion i111tû urgan dysfunctiun . Eur j Clin Mi,tobiol Infect Ois 2017 April 28 ; [E- Pub ahead of pri11tJ. 26. Horta! J, Giannella M, Perez MJ, et al. Incidence and risk factors for vencilator-associaced pneumonia aî:ter major heart surgery. lmensive- Care Med 2009;35: 151 8--25. 27. Aki11nusi ME. Pineda LA, El Solh AA. Effect of obesity on intensive care morbid11y and mortality: a m,, ta-analy,is. Cric Cme Med 2008;36: 151 -8 . 28. Benumof JL. Obsrrnctive sle 27 kg/m 2 D. Pourrait s'expliquer par un état pro-inflammatoire propice au développement d'une pneumonie postopératoire E. Est associée à la survenue d'une pneumonie postopératoire, indépendamment de la durée d'intervention

010. Une concentration d'Endocan inférieure à 12, 1 ng/ml à la 6 8 heure postopératoire a une faible valeur décisionnelle pour le diagnostic d'exclusion de la pneumonie postopératoire car: A. La sensibilité est de 71 % B. La spécificité est de 75 % C. Le taux de faux négatif est de 29 % D. Le taux de faux positif est de 25 % E. Le rapport de vraisemblance négatif est inférieur à 0

Q 11. Une concentration d'Endocan supérieure ou égale à 12, 1 ng/ml à la 68 heure postopératoire a une faible valeur décisionnelle pour le diagnostic positif de pneumonie postopératoire car : A. La sensibilité est de 71 % B. La spécificité est de 75 % C. Le taux de faux négatif est de 29 % D. Le taux de faux positif est de 25 % E. Le rapport de vraisemblance positif ne peut pas être calculé 012. Dans cette étude, il manque une comparaison des performances en discrimination de l'Endocan à celles : A. De la procalcitonine B. De la C-reactive protein C. De l'analyse microbiologique du liquide de lavage broncho-alvéolaire D. D'un modèle de prédiction clinique E. Des hémocultures réalisées en préopératoire 013. Cette étude démontre que l'Endocan : A. Réduit significativement le délai d'initiation d'une antibiothérapie dans les pneumonies postopératoires B. A une sensibilité et une spécificité médiocres pour la prédiction des pneumonies postopératoires C. Identifie les patients susceptibles de bénéficier d'une surveillance rapprochée des signes de pneumonie postopératoire D. Identifie les patients susceptibles de bénéficier d'un renforcement des mesures de prévention de pneumonie postopératoire E. A des performances en discrimination supérieures à celles de la C-reactive protein pour la prédiction des pneumonies postopératoires 014. La conclusion de l'article suggère que l'Endocan pourrait être utilisé pour identifier précocement les patients à risque élevé de pneumonie postopératoire. Quel schéma d'étude serait le plus adapté pour valider cette hypothèse? A. Une étude de cohorte prospective multicentrique avec dosage systématique de l'Endocan chez des patients bénéficiant d'une chirurgie cardiaque programmée B. Une étude cas-témoin rétrospective comparant la concentration d'Endocan chez des patients avec versus sans pneumonie postopératoire au décours d'une chirurgie cardiaque programmée

337

ECNi 2018 - Sujet 1

C. Un essai contrôlé d'intervention sur deux bras parallèles avec randomisation du dosage de l'Endocan chez des patients bénéficiant d'une chirurgie cardiaque programmée D. Une étude multicentrique transversale d'évaluation des performances diagnostiques de l'Endocan chez les patients avec une suspicion de pneumonie postopératoire E. Un essai contrôlé avec randomisation en cross-over du dosage de l'Endocan chez des patients bénéficiant d'une chirurgie cardiaque programmée

338

015. Pour quelle(s) raison(s) l'utilisation du dosage de l'Endocan serait prématurée pour le diagnostic précoce de pneumonie postopératoire en routine clinique ? A. La valeur de l'Endocan ne diffère significativement en fonction de la présence d'une pneumonie que dans les 6 premières heures postopératoires B. La reproductibilité des performances de l'Endocan pour le seuil décisionnel retenu n'a pas été vérifiée sur une cohorte de validation indépendante C. La valeur ajoutée de l'Endocan par rapport aux biomarqueurs courants d'infection n'a pas été étudiée D. La signification physiopathologique de l'élévation de la concentration d'Endocan est complexe compte tenu des résultats discordants des études antérieures E. Le bénéfice pour les patients des décisions cliniques fondées sur le dosage de l'Endocan reste à démontrer

Corrigé du sujet 1 Énoncé p. 336

Seconde étude diagnostique en 2 ans. Celle-ci était aussi atypique car elle était largement discutable. En témoignent de nombreuses questions sur les limites de l'article, et une nouvelle fois la nécessité de cocher que les résultats sont « médiocres »... On s'en sortait mieux que les autres étudiants en connaissant les objectifs d'une étude diagnostique.

Question 1 Le rationnel de cette étude repose sur le fait que : A. La pneumon ie postopératoire est une complication fréquente de la chirurgie cardiaque B. Le diagnostic précoce de pneumonie postopératoire permettra it de raccourcir le délai d' initiation de !'antibiothérapie C. Les tests biologiques diagnostiques actuellement disponibles peuvent être mis en défaut dans les 2 premiers jours postopératoires D. La concentration d' Endocan dans le sang circulant augmente en cas de sepsis E. La concentration d' Endocan est prédictive d'atteinte respirato ire aiguë dans le choc septique

Première question très classique, qui porte sur le rationnel de l'étude. Les réponses se trouvent dans l'introduction du texte, et pa,fois dans la discussion . Item A : The development of postoperative pneumonia is a frequent complication after cardiac surgery and is associated with increased inhospital morbidity and mortality.

Item B : for/y detection of postoperative pneumonia makes if possible to initiale appropriate therapy more quickly in these patients.

Item C: ln this context, the diagnosis of infection is chaltenging, because conventional clinica/ and biologica/ signs may be misleading.

Des informations sur le délai de 2 jours de positivité de la PCT étaient disponibles dans la discussion. [. ..] and a/so ventilator-associated pneumonia, but underline that the diagnostic properties of PCT may not be clearly evident during the first 2 days after surgery.

Item D: Blood endocan increases in the context of sepsis as a result of de nova synthesis and secretion [. . .].

Item E: [. .. ] endocan as an early predictor of acute lung iniury or respira tory foi/ure after maior trauma ans in spetic shock [. .].

339

ECNi 2018 - Sujet 1

Question 2 La population cible de l'étude est constituée de patients adultes avec : A. Une chirurgie cardiaque programmée B. Une suspicion de pneumonie postopératoire au décours d'une chirurgie cardiaque programmée C. Une pneumonie postopératoire confirmée au décours d'une chirurgie cardiaque programmée D. Une valeur normale d'Endocan avant une chirurgie cardiaque programmée E. Une valeur anormale d'Endocan à la 5e heure postopératoire d'une chirurgie cardiaque programmée

Une nouvelle question classique qui ne pose pas trop de difficultés si l'on a bien compris le texte et le concept de population cible. :) Voir le point de cours sur les populations, l'inférence et la généralisation p. 9.

Item A : ici, les patients constituant la population cible sont tous les patients adultes consentants programmés pour une chirurgie cardiaque (hors les critères d'exclusion explicités dans le texte). Item B : la subtilité de cette question vient du fait que les auteurs ont choisi de recruter des patients tout-venant avant chirurgie cardiaque. Après inclusion, ils étaient suivis afin de déterminer s'ils développaient une pneumonie postopératoire. Les performances du test étaient mesurées sur toute la population recrutée avant chirurgie cardiaque, sans présager de leur futur diagnostic de pneumonie. La population d'intérêt n'est donc pas celle qui est suspecte d'une pneumonie postopératoire. La proposition B aurait pu être un autre plan d'étude valable, en appliquant le test à des sujets suspects de pneumonie, puis en mesurant les caractéristiques du test contre un gold-standard. Item C : la population cible est constituée de sujets chez qui la maladie n'a pas été encore diagnostiquée, et chez qui la valeur du test n'est pas encore connue. Cette population ne pouvait donc pas être celle de sujets avec une pneumonie confirmée puisque le test a précisément pour but d'orienter le diagnostic chez des sujets à risque de développer cette infection. Item D : la valeur du test en préopératoire ne peut pas constituer un critère définissant la population cible puisque cette valeur fait l'objet d'une analyse dans l'article. Les auteurs mesurent en effet la valeur prédictive d'un Endocan anormal en préopératoire sur le risque de développer une infection. Item E : la population cible ne peut pas être celle qui a un test anormal. Il n'est pas possible de calculer les caractéristiques d'un test chez des sujets ayant tous un test positif Question 3 Il s'agit d'une étude: A. Transversale B. De cohorte prospective C. Randomisée D. Pronostique E. Diagnostique

Soyez bien à l'aise avec ces différentes notions développées dans la partie cours de ce livre, et vous assurerez les points sur ce genre de question qui semble être apprécié des rédacteurs d'épreuves. 340

Corrigé

Items A et B : un échantillon de population est recruté selon des critères définis, puis est suivi dans le temps. Il s'agit donc d'une cohorte prospective, et non d'une étude transversale. :) Voir le point de cours sur les différents types d'études épidémiologiques p. 66.

Item C : il n'y a pas eu de randomisation dans cet essai où tous les sujets ont suivi le même protocole. :) Voir le point de cours sur la randomisation p. 44.

Item D et E : si des calculs analytiques ont effectivement été réalisés (calcul d'OR dans le tableau 4), on ne pouvait pas classer l'étude comme pronostique pour autant. Son objectif principal est de déterminer si le taux d'Endocan est un bon marqueur diagnostique de pneumonie postopératoire. L'analyse principale est la détermination de ses caractéristiques intrinsèques. On voit dans les figures une courbe AUROC. C'est donc bien une étude diagnostique. Question 4 Les tests diagnostiques de pneumonie postopératoire évalués dans cette étude incluent : A. La concentration sanguine d'Endocan mesurée à la 6° heure postopératoire B. La rad iographie pul monai re C. L'analyse m icrobiolog ique du liquide de lavage broncho-alvéolaire D. La concentra tion sanguine de la C-reactive protein mesurée à la 24° heure postopératoire E. La co ncentra tio n sangui ne de la procalc itonine mesurée à la 24° heure postopératoire

Question incontournable des études diagnostiques, qui cherche à s'assurer que vous avez bien compris le protocole : que teste-t-on et selon quelle riférence ? Ne vous laissez pas piéger par la jàrmulation au pluriel, il est tout àjàit possible qu'elle n'appelle qu'une seule réponse. Item A : le calcul du NSN est fait pour l'Endocan : c'est l'outil diagnostique principal évalué ici . Les seuls calculs de sensibilité et de spécificité qui ont été réalisés l'ont été uniquement pour les valeurs d'Endocan. En ce sens, c'est le seul test diagnostique qui ait été évalué pour cette étude diagnostique. Items B, D et E : des analyses secondaires ont certes été faites pour d'autres tests, mais aucune n'a bénéficié d'une évaluation de son caractère diagnostique . C'est d'ailleurs un des reproches que le correcteur fait à l'étude un peu plus tard dans l'énoncé . Item C : l'analyse microbiologique du liquide de LBA n'est pas évaluée dans cet essai où elle représente le diagnostic de vérité: c'est ici le gold-standard. Question 5 Quelle(s) information(s) manque(nt) à la description de la stratégie pour établir le diagnostic de référence de pneumonie postopératoire ? A . L'adjudication par un comité indépendant B. L'expertise par plusieurs évaluateurs C. L'adjud ica tion en aveugle de la concentration sanguine d'Endocan D. La durée de suivi des patients E. L'adj ud ica tio n en aveugle de la co nce ntrati o n sa ngui ne de C-reactive protein

341

ECNi 2018 - Sujet 1

Une question plus déroutante que les précédentes, car elle ne trouve pas sa réponse formellement détaillée dans le texte. On pouvait s'en sortir avec de la reflexion et du bon sens ! Items A et B : le diagnostic est établi ici sur la microbiologie au LBA. Aucune information n'est donnée sur la définition exacte de ce qui constitue une pneumonie postopératoire (quels germes? À quel seuil?) . Ainsi, une adjudication par comité indépendant ou l'expertise par plusieurs évaluateurs auraient pu être intéressantes. :) Voir le point de cours sur le comité d'adjudication p. 81.

Items C et E : l'Endocan et la CRP ne sont pas utilisés pour le diagnostic dans le protocole de l'étude : ce sont de toute façon des variables objectives dont la mesure en aveugle n'est pas indispensable. :) Voir les points de cours sur les types de variables p. 9 et sur l'aveugle p. 28.

Item D : selon que le suivi des patients soit de quelques heures ou de quelques jours, l'apparition des signes cliniques pourrait ne pas être repérée par l'investigateur et le LBA pourrait ne pas être réalisé. Il aurait donc été intéressant de préciser les modalités de ce suivi dans les méthodes (durée, etc.) . Question 6 Dans le tableau 1, trois valeurs différentes du degré de signification (P values) sont présentées pour la comparaison de l'âge discrétisé en catégories(< 60, 60-70 et> 70 ans) entre les patients avec une pneumonie postopératoire versus ceux sans pneumonie postopératoire. Pourquoi cette façon de procéder est-elle inappropriée ? A. Les tro is classes d'âge ne sont pas indépendantes B. Les tests de comparaison sont multipliés inutilement C. La catégorie de référence pour la classe d'âge intermédiaire (60-70 ans) mélange les patients des catégories < 60 ans et> 70 ans D. Elle est à l'origine d'une inflation du risque d'erreur statistique de ire espèce (alpha) E. Les différen ces observées résulten t forcé ment de fluctuations aléatoires d'échantillonnag e

C'est une question difficile et une notion importante à comprendre. Items A et C : les catégories d'âge sont bien indépendantes et il n'existe pas de chevauchement entre les catégories d'âge des groupes. Items B et D : lorsque l'on veut comparer des variables quantitatives comme l'âge, on réalise typiquement un seul test qui indique si les deux échantillons ont des âges probablement semblables ou non. Ici, en groupant (= discrétisant) la variable d'âge et en créant notamment 3 groupes avec de faibles effectifs (moins de 10 sLtjets dans chaque catégorie d'âge pour les pneumonies), on multiplie le nombre de comparaisons. 4 p values sont rapportées pour comparer les catégories d'âge entre elles, quand une seule aurait pu être utilisée en comparant les moyennes. Cela augmente le risque de mettre en évidence une différence qui n'existe pas : c'est l'inflation du risque alpha :) Voir le point de cours sur l'inflation du risque alpha p. 6.

Item E : Une différence observée peut toujours être réelle, et ne se justifie pas systématiquement par une inflation d'alpha ou des fluctuations d'échantillonnage.

342

Corrigé

Question 7 Quelle information manque pour l'interprétation des estimations ponctuelles des caractéristiques informationnelles intrinsèques de l'Endocan sur la figure 1 ? A. La prévalence de la pneumonie postopératoire B. Les valeurs prédictives négatives C. Les rapports de vraisemblance du test positif D. Les intervalles de confiance à 95 % E. Les écarts-types

Ne cherchez pas trop loin dans cette question à réponse unique, mais profitez-en pour vous refraîchir la mémoire sur les notions qu 'elle évoque ! :, Voir le point de cours sur les caractéristiques intrinsèques et extrinsèques d'un test p. 38.

Item A et B : la prévalence de la maladie étudiée n'est d'aucune utilité pour interpréter les caractéristiques intrinsèques d'un test (Se, Sp, RV+, RV-) . Elle est utile pour les caractéristiques extrinsèques (VPP et VPN) . On élimine donc A et B. Item C : le R V+ est une caractéristique intrinsèque du test, et non une information supplémentaire nécessaire à son interprétation . Item D : bon réflexe que pointe ici le correcteur ! Lorsque l'on calcule une estimation ponctuelle, il est essentiel de présenter en même temps l'intervalle de confiance de cette valeur, à savoir la fourchette dans laquelle se trouve le résultat. Item E : l'écart-type comme la variance sont des caractéristiques d'une donnée obtenue sur un échantillon réel, alors que les IC caractérisent des données issues d'une estimation, c'est-à-dire d'un calcul et non d'une mesure en population (calcul d'un RR, d'une spécificité, etc.). Question 8 L'indice de masse corporelle supérieur à 27 kg/m 2 et la durée d'intervention ont été introduits dans le modèle d'analyse multivariée (tableau 4) pour : A. Déterminer le seuil optimal de la concentration sanguine d'Endocan (3,67 ng/mL) en péri ode préopératoire B. S'affranchir de l'effet de ces deux facteurs de confusion potentiels C. Identifier les prédicteurs indépendamment associés à la pneumonie postopératoire D. Contrôler les fluctuations aléatoires d'échantillonnage E. Corriger le biais lié à la subjectivité du diagnostic de référence de pneumonie postopératoire

Une question qui peut sembler difficile au premier abord, mais qui est en fait une question de cours sur l'analyse multivariée. :, Voir le point de cours sur l'analyse uni- et multivariée p. 31.

Items A, B et C : l'étude comporte finalement deux versants : • le premier est celui d'une étude diagnostique avec la détermination du seuil d'Endocan optimal et des caractéristiques du test ; • le second est finalement plutôt épidémiologique et analytique avec la détermination des variables prédictives du risque de POP (post-operative pneumonia) (tableau 4) . L'aspect diagnostique est l'analyse principale et l'aspect analytique est secondaire. 343

ECNi 2018 - Sujet 1

La réalisation cl' analyses exploratoires est justifiée ici par la volonté de profiter de la cohorte construite pour trouver des fac teurs prédictifs précoces du risque de POP. Comme dans les analyses de fac teurs prédictifs ou de risque, les analyses ont lieu d'abord en univarié puis à l'aide de modèles multivariés. C'est la seconde étape qui, en contrôlan t les facteurs de confusion iden tifiés au préalable, signale les variables indépendamment associées à l'événement considéré . La proposition A pourrait sembler vraie en elle- même, mais ne répond pas à l'énoncé, contrairement aux items B et C. Item D : l'ajustemen t sur les variables de confusion n'a rien à voir avec les fluctua tions d'échantillonnage, qui surviennent lors de la constitution de l'échantillon . :) Voir le point de cours sur les fluctuations d'échantillonnage p. 1 S.

Item E : on a vu que le diagnostic n ' était pas vraiment subjectif (microbiologie). De plus, l'éventuelle subjectivité du CJP est un biais de mesure, non corrigé par une analyse multivariée qui corrige juste des facteurs de confusion. :, Voir le point de cours sur les biais de confusion p. 2S.

Question 9 Une concentration sanguine d'Endocan supérieure à 3,67 ng/ml en période préopératoire d'une chirurgie cardiaque programmée : A. Ne peut pas constituer un test diagnostique de pneumonie postopératoire B. Est un facteur pronostique potentiel de pneumonie postopératoire C. N'est pas significativement associée à la survenue d'une pneumonie postopératoire, après ajustement sur l'indice de masse corporelle> 27 kg/m 2 D. Pourrait s'expliquer par un état pro-inflammatoire propice au développement d'une pneumonie postopératoire E. Est associée à la survenue d'une pneumonie postopératoire, indépendamment de la durée d'intervention

Une question assez difficile, nécessitant d'allier interprétation des résultats et rijlexion personnelle.

Items A , C et E : d'un point de vue physiopathologique évident, un test préopératoire ne peu t pas constituer un test diagnostique d'une pathologie par définition postopératoire . Toutefois, il se trouve que dans cette étude, une courbe ROC a été tracée pour l'Endocan préopératoire. L'utilisation de cette courbe est presque un abus : l'intérêt était ici de montrer la force prédictive (et non diagnostique) de ce test, et c'est donc autour de !'OR et non des caractéristiques intrinsèques du test que l'on va raisonner (car cet OR est la mesure formelle de la capacité prédictive d'un taux d'Endocan posi tif en préopératoire) . Il est ici significatif en multivarié (ajustement en tre autres sur l'IMC et la durée d'intervention) c'est donc peu t-être un bon marqueur de risque de POP. Item B : aucune analyse pronostique n'était proposée dans cette étude.

& Attention à ne pas confondre marqueur de risque et facteur pronostique. Une variable peut marquer un sur-risque de pathologie sans présager de son pronostic ! :) Voir le point de cours sur les marqueurs et facteurs de risque et pronostique p. 8.

344

Corrigé

Item D : les auteurs exposent dans la discussion les liens entre inflammation et concentration d'Endocan. Bien que nous n'ayons pas d'informations supplémentaires pour clarifier le lien entre Endocan préopératoire et pneumonie postopératoire, il est difficile de ne pas cocher cette proposition naïve et au conditionnel. Question 10 Une concentration d'Endocan inférieure à 12, 1 ng/ml à la se heure postopératoire a une faible valeur décisionnelle pour le diagnostic d'exclusion de la pneumonie postopératoire car: A. La sensibilité est de 71 % B. La spécificité est de 75 % C. Le taux de faux négatif est de 29 % D. Le taux de faux positif est de 25 % E. Le rappo rt de vrai se m blance négatif est infé ri eur à 0

Une question classique sur l'interprétation des résultats d'une étude diagnostique, qui requiert d'être incollable sur les dif,nitions de sensibilité et spécificité. On trouve les réponses dans la figure 1. :, Voir le point de cours sur les caractéristiques intrinsèques et extrinsèques p. 38.

Items A , B , C et D : dans la figure 1, on voit que la sensibilité est estimée à 71 %, soit un taux de faux négatifs à 29 %. Item E : le rapport de vraisemblance négatif n'est pas indiqué dans le texte, mais on pouvait le calculer. Toutefois, les meilleurs étudiants n'ont pas eu à le faire en se rappelant sa définition : c'est un facteur de multiplication de probabilité, donc il est forcément positif Un rapport de vraisemblance inférieur à 0, comme le suggérait la proposition, aboutirait à une probabilité post-test négative ce qui est impossible. On gagnait donc 5 min et pas mal d'énergie en excluant la proposition Epar définition ! Question 11 Une concentration d'Endocan supérieure ou égale à 12, 1 ng/ml à la se heure postopératoire a une faible valeur décisionnelle pour le diagnostic positif de pneumonie postopératoire car : A. La sensibilité est de 71 % B. La spécificité est de 75 % C. Le tau x de faux négatif est de 29 % D. Le taux de faux positif est de 25 % E. Le rapport de v raise m blance pos it if ne peut pas être calculé

Question quasi identique à la précédente ! Items A , B , C et D : pour le diagnostic positif(= l'inclusion du diagnostic), on discute cette fois de la spécificité. Toujours en lisant la figure 1, on voit qu'elle est de 75 % pour ce test diagnostique. Le taux de faux positifs est donc de 25 %. Item E : la justification est très proche de celle de la question précédente. Le R V + peut tout à fait être calculé : R V+ = Se/(1-Sp). Cette possibilité de calculer n'a de toute façon aucun lien avec la valeur décisionnelle du test.

345

ECNi 2018- Sujet 1

Question 12 Dans cette étude, il manque une comparaison des performances en discrimination de l'Endocan à celles: A. De la procalcitonine B. De la C-reactive protein C. De l'analyse microbiologique du liquide de lavage broncho-alvéolaire D. D'un modèle de prédiction clinique E. Des hémocultures réalisées en préopératoire

Voilà une question inhabituelle, qui a pu déstabiliser beaucoup d'étudiants. Réfléchir avec votre bon sens clinique pour cocher ou non les items vous sera bien souvent d'une aide très précieuse !

Items A, B et D : tout l'intérêt de l'Endocan est d'offrir un meilleur modèle de décision en postopératoire précoce, à la fois pour prédire le risque et pour, peut-être, apporter un argument diagnostique. Dans ce contexte, l'Endocan doit faire mieux que les autres moyens à disposition : CRP, PCT, clinique. Or, aucune comparaison avec ces modèles de décision n'est proposée ! C'est dommageable (et même étonnant) qu'aucune comparaison avec ces tests ne soit proposée, alors que toute l'introduction de l'article est tournée vers l'ambition de faire mieux que ce qui est disponible. Item C : l'Endocan en tant que test diagnostique précoce de POP est comparé au LBA : c'est à partir du diagnostic posé au LBA, considéré comme la vérité, que sont calculées les caractéristiques de l' endocan (sensibilité, spécificité). Item E : on en a déjà parlé, on ne peut pas faire le diagnostic de POP en préopératoire. Par définition, des hémocultures préopératoires ne seraient d'aucune utilité: aucune n'a été réalisée et aucune analyse n'est faite à ce sujet. Question 13 Cette étude démontre que l'Endocan : A. Réduit significativement le délai d'initiation d'une antibiothérapie dans les pneumonies postopératoires B. A une sensibilité et une spécificité médiocres pour la prédiction des pneumonies postopératoires C. Identifie les patients susceptibles de bénéficier d'une surveillance rapprochée des signes de pneumonie postopératoire D. Identifie les patients susceptibles de bénéficier d'un renforcement des mesures de prévention de pneumonie postopératoire E. A des performances en discrimination supérieures à celles de la C-reactive protein pour la prédiction des pneumonies postopératoires

Chaque sujet de LCA possède une question type « que peut-on retenir de l'article ? » . Pour y répondre, n'oubliez jamais qu'on ne peut conclure que sur l'analyse principale et pas sur les analyses exploratoires . Item A : la preuve d'une réduction du délai avant antibiothérapie nécessiterait une étude thérapeutique avec ou sans mesure d'Endocan systématique, et un CJP de type délai d'antibiothérapie. Ce n'était pas le schéma de cette étude.

346

Corrigé

Item B : seule cette propos1t10n fait appel au résultat principal de l'étude. J'ai trouvé le correcteur assez critique de l'article tout au long du sujet et ça ne me choque pas de conclure à un test « médiocre » en résultat principal. Pour aller plus loin avec la LCATBC

Un ordre de grandeur possible pour un bon test peut être une ROC à 0,8 et on en est ici loin. Si l'on souhaite comparer les R V de ce test au tableau proposé plus haut (voir le point de cours sur les rapports de vraisc111bla11ce et le 1101110,1;ra111111e de Faga11 page 40), on retrouve un R V+ aux alentours de 2 (c'est-à-dire faible) et un R V- aux alentours de 0,5 (faible aussi) . Items C et D : le résultat principal est ici le calcul des caractéristiques de l'Endocan pour le diagnostic d'une pneumopathie postopératoire. Une association probable entre les valeurs d'Endocan en pré- et postopératoire précoce, et le risque ultérieur de pneumonie est retrouvée en analyse exploratoire. Cependant, ce résultat est basé sur l'interprétation de données d'analyse secondaires : ce n'est pas l'objectif de l'étude. Aucune démonstration sur ce sujet ne peut être faite . Une étude dédiée est nécessaire pour conclure là-dessus en analyse principale (notamment une étude épidémiologique analytique). Item E : Il n'a pas été fait de comparaison entre Endocan et CRP. Question 14 La conclusion de l'article suggère que l'Endocan pourrait être utilisé pour identifier précocement les patients à risque élevé de pneumonie postopératoire. Quel schéma d'étude serait le plus adapté pour valider cette hypothèse ?

A. Une étude de cohorte prospective multicentrique avec dosage systématique de l'Endocan chez des patients bénéficiant d'une chirurgie cardiaque programmée B. Une étude cas-témoin rétrospective comparant la concentration d'Endocan chez des patients avec versus sans pneumonie postopératoire au décours d'une chirurgie cardiaque programmée C. Un essai contrôlé d'intervention sur deux bras parallèles avec randomisation du dosage de l'Endocan chez des patients bénéficiant d'une chirurgie cardiaque programmée D. Une étude multicentrique transversale d'évaluation des performances diagnostiques de l'Endocan chez les patients avec une suspicion de pneumonie postopératoire E. Un essai contrôlé avec randomisation en cross-over du dosage de l'Endocan chez des patients bénéficiant d'une chirurgie cardiaque programmée

Il ne fallait pas se laisser déstabiliser par la tournure de cette question 14 qui pourrait nous mettre la pression de ne pas avoir coché C et D à la question précédente ! Cependant, l'énoncé ici utilise « suggère que » et« pourrait être utilisé pour identifier» en opposition à « démontre que » et « identifie », utilisés à la question précédente. C'est d'ailleurs sur cette subtilité que joue cette question : il faut trouver un schéma pour « valider » cette hypothèse émise suite aux résultats exploratoires de l'article. C'est une question très difficile, pour laquelle il est difficile de choisir une réponse avec certitude. Item A et B : on souhaite ici mettre en évidence un lien suspecté entre la présence d'une exposition (Endocan élevé en périopératoire) et un événement. Une étude analytique semble la plus adaptée. Ici, on a le choix entre une étude de cohorte multicentrique

347

ECNi 2018 - Sujet 1

prospective et un cas-témoins. Rappelons les caractéristiques de l'exposition et de l' événement: l'exposition (Endocan élevé) est plutôt fréquente (moyenne du dosage à 10,5 ng/mL et écart-type à 7, 9 en postopératoire, pour un eut-off à 12, 1, donc de nombreux sujets sont au-dessus du eut-off) et un événement plutôt rare (moins de 9 % de sujets ayant présenté l'événement). On voit donc que ces caractéristiques sont plutôt en faveur du cas-témoins. Cependant, il est difficile de ne pas cocher une cohorte prospective multicentrique, qui est un schéma possible ici, et de grade de preuve B (c'ontre C pour le cas-témoin). :, Voir le point de cours sur le niveau de preuve des études p. 35.

Ainsi, dans l'absolu, le schéma B est le plus astucieux et le plus raisonnable. Mais étant donné qu'un essai de grade B était possible et proposé, la proposition A me paraît la bonne. Items C et E : si l'objectif avait été d'évaluer le bénéfice du dépistage systématique de l'Endocan en périopératoire, ces propositions, interventionnelles, auraient pu être considérées. Toutefois, la randomisation en cross-over de l'item E était inadaptée (il n'était pas possible pour un patient d'être d'abord testé pour l'Endocan avant chirurgie puis non testé pour l'Endocan avant chirurgie ... ). L'item C était plus adapté dans l'hypothèse où l'on aurait souhaité montrer un bénéfice du dosage de l'Endocan en périopératoire de chirurgie cardiaque. Item D : une étude transversale était inadaptée dans ce contexte où un suivi était nécessaire aux différents temps de l'essai. Question 15 Pour quelle(s) raison(s) l'utilisation du dosage de l'Endocan serait prématurée pour le diagnostic précoce de pneumonie postopératoire en routine clinique ? A. La valeur de l'Endocan ne diffère significativement en fonction de la présence d'une pneumonie que dans les 6 premières heures postopératoires B. La reproductibilité des performances de l'Endocan pour le seuil décisionnel retenu n'a pas été vérifiée sur une cohorte de validation indépendante C. La valeur ajoutée de l'Endocan par rapport aux biomarqueurs courants d'infection n'a pas été étudiée D. La signification physiopathologique de l'élévation de la concentration d'Endocan est complexe compte tenu des résultats discordants des études antérieures E. Le bénéfice pour les patients des décisions cliniques fondées sur le dosage de l'Endocan reste à démontrer

La dernière question de l'épreuve est bien souvent une question d'ouverture, qui s'intéresse aux chan-

gements que l'article va impliquer sur votre pratique clinique. Elle est tournée ici de manière assez inhabituelle, en vous demandant directement les freins à la généralisation de la pratique du dosage de l'endocan au quotidien. C'est une façon déguisée de vous demander les limites de l'étude!

Item A : le fait que l'Endocan ne diffère que dans les 6 premières heures n'est pas un frein à son implémentation si on l'utilise comme un marqueur de risque en postopératoire immédiat ou un marqueur de risque en préopératoire. Item B et E : avant de valider l'utilisation d'une procédure diagnostique, il faut : • déterminer les caractéristiques du test (cette étude) ; • confirmer ce résultat par une seconde étude indépendante. Cet aspect n'est pas propre aux études diagnostiques : que d'autres études indépendantes aient pu reproduire le même résultat est un aspect crucial de l' Evidence Based Medecine ;

348

Corrigé

• démontrer le bénéfice de la nouvelle procédure en testant sa supériorité (ou sa non-infériorité si autre avantage) sur les autres méthodes diagnostiques par une étude dédiée (non fait ici). Il manque donc ici les propositions B et E . Item C : ce point a déjà été développé précédemment, l'Endocan n'a pas été comparé aux marqueurs traditionnellement utilisés pour diagnostiquer une infection. Il paraît dont difficile de l'utiliser à leur place avant d'avoir obtenu des résultats complémentaires. Item D : il serait intéressant d'avoir des bases physiopathologiques pour interpréter l'Endocan, notamment en raison de sa cinétique variable, comme l'expliquent les auteurs : Depending on the clinical context, an increase in endocan indicates an early pulmonary response to iniury. Converse/y, absence of an increase, or even a decrease in endocan could indicate insufficient Jung protection against iniury.

349

Article du sujet 2 --·-A Randomized Trial of Laparoscopie versus Open Surgery for Rectal Cancer H.Jaap Bonjer, M.D., Ph.D., Charlotte L. Deijen, M.D., Gabor A. Abis, M.D., Miguel A. Cuesta, M.D., Ph.D., Martijn H.G.M. van der Pas, M.D., Elly S.M. de Lange-de Klerk, M.D., Ph.D., Antonio M. Lacy, M.D., Ph.D., Willem A. Bemelman, M.D., Ph.D.,John Andersson, M.D., Eva Angenete, M.D., Ph.D.,Jacob Rosenberg, M.D., Ph.D., Alais Fuerst, M.D., Ph.D., and Eva Haglind, M.D., Ph.D., for the CO LOR Il Study Group"'

Colorectal cancer is the third most common cancer worldwide and accounts for nearly 1.4 million new cases and 694,000 deaths per year.Approximately one third of ail colorectal cancers are localized in the rectum.1-4 Less than a half century ago, rectal cancer had a poor prognosis, with cancer recurrence rates in the pelvic or perineal area 0ocoregional recurrence) of up to 40% and 5-year survival rates afi:er surgical resection of less than 50%.5·6 In the 1980s, Heald and R yall 6 introduced a new surgical technique of complete removal of the fatty envelope surrounding the rectum (mesorectum), called total mesorectal excision. The adoption of total mesorectal excision combined with neoadjuvant chemoradiotherapy in selected patients has reduced locoregional recurrence rates to below 10% and improved cancer-free survival rates to more than 70%. 7- 10 Laparoscopie surgery has progressively replaced open colonie surgery in recent decades owing to favorable short-term outcomes, such as less pain, reduced blood loss, and improved recovery time. 350

11

Initially, there was concern regarding the safety of laparoscopie colectomy after reports of cancer recurrence in the abdominal wall. 12 •13 In various trials in which patients with colon cancer were randomly assigned to undergo either open or laparoscopie surgery, evidence was obtained that laparoscopie surgery was associated with similar disease-free and overall survival rates as open surgery. 14 •15 However, evidence is lacking from large, randomized clinical trials indicating that survival after laparoscopie resection of rectal cancer is not inferior to open surgery. We previously reported that laparoscopie surgery in patients with rectal cancer was associated with similar surgical safety and improved recovery time, as compared with open surgery. 16 ln the Colorectal Cancer Laparoscopie or Open Resection (COLOR) II trial, we report the longterm rates of locoregional recurrence and survival in patients who were randomly assigned to undergo one of the two procedures.

Article

METHODS Study design and oversight The COLOR II trial was a noninferiority, openlabel, multicenter trial conducted at 30 centers in 8 countries. The study was designed by members of the protocol committee. The local investigators and the trial manager gathered the data. The authors analyzed the data and vouch for the accuracy of the data and the analyses and the fidelity of the study to the protocol (available with the full text of this article at NEJM.org). The authors wrote the manuscript and made the decision to submit the manuscript for publication. The sponsor of the study, Ethicon Endo-Surgery Europe (a subsidiary otJohnson & Johnson), had no role in the study design, data gathering, analyses and interpretation, or writing of the manuscript.

Patients Patients with a solitary adenocarcinoma of the rectum within 15 cm from the anal verge without distant metastases who were candidates for elective surgery were eligible for inclusion. The localization of the tumor was categorized as the upper rectum (distal border oftumor, 10 to 15 cm from the anal verge), middle rectum (5 to 10 cm from the anal verge), or lower rectum (

-~

60 Open surgery

50

:1 Ill

..,al .'"

40 30 20

70 60 50

.::

40

i5

20

Open surgery

30

10

10

0

0 0

0

2

2 Years

Years No. at Risk Laparoscopie 187 surgery Open surgery 92

170

150

126

80

74

61

No. at Risk Laparoscopie 230 surgery Open surgery 124

181

151

129

93

75

57

Figure 2. Oisease-free Survival, According to Oisease Stage.

of disease-free survival was 64.9% in the laparoscopic-surgery group and 52.0% in the open-surgery group (difference, 12. 9 percentage points; 95% CI, 2.2 to 23.6). At 3 years after surgery, 145 patients had died, accounting for an overall survival rate of 86.7% in the laparoscopic-surgery group 356

and 83.6% in the open-surgery group (difference, 3.1 percentage points; 95% CI, -1.6 to 7.8) (Fig. 3). Overall survival rates according to disease stage were also similar in the two groups. Distant metastases at 3 years after surgery were reported in 19.1% of the patients in

Article

A Ali Stages

B Stage 1 Laparoscopie surgery

100

Open surgery

100

90

90

80

80

~

70

~

70

ni >

60

ni >

60

::, Ill

50

::, Ill

50

-~ ~

~

Open surgery

-~

.

40

~

30

0

>

40 30

20

20

10

10

0

Laparoscopie surgery

0 0

2

3

0

2

3

240

230

191

114

112

90

Years

Years

No. at Risk

No. at Risk

Laparoscopie 692 surgery Open surgery 344

659

612

511

322

304

247

Laparoscopie 247 surgery Open surgery 117

D

C Stage Il 100

Stage 111 100

Open surgery

90

90 Laparoscopie surgery

80

80

~

70

~

70

ni >

60

ni >

60

::, Ill

50

::, Ill

50

-~

.

-~

.

~

40

~

>

30

0

0

>

40 30

20

20

10

10

0

Open surgery

0 0

2

0

2

3

213

189

160

109

97

75

l

Years

Years No. at Risk

No. at Risk Laparoscopie 187 surgery Open surgery 92

179

167

143

88

85

73

Laparoscopie 230 surgery Open surgery 124

Figure 3. Overa/1 Survivol, According to Diseose Stage.

the laparoscopic-surgery group and 22.1 % of those in the open-surgery group, induding one portsite metastasis in the laparoscopic-surgery group and one tumor recurrence in the laparotomy wound in the open-surgery group.

DISCUSSION In this trial, we compared the rates oflocoregional recurrence of rectal cancer after laparoscopie or open resection. Locoregional recurrences were recorded in 5.0% of

357

ECNi 2018- Sujet 2

I

I

I

the patients in each of the two groups. ln the Dutch trial of total mesorectal excision by Kapiteijn et al.,8 among 1805 patients with rectal cancer who underwent open resection, the locoregional recurrence rate at 2 years was 5.3%, a rate similar to that in our study. ln the Conventional versus LaparoscopicAssisted Surgery in Colorectal Cancer (CLASICC) trial, the first multicenter, randomized study to determine the effect of laparoscopie surgery on rectal-cancer outcomes involving 381 patients, the locoregional recurrence rate at 3 years was 9. 7% after laparoscopie surgery and 10.1 % after open surgery. 17 The presence of involved circumferential resection margins, which predispose patients to locoregional recurrence, were observed in 16% of the patients after laparoscopie surgery in the CLASICC trial, as compared with 10% of those in the laparoscopicsurgery group in our study. 18•19 Recently, in the Comparison of Open versus Laparoscopie Surgery for Mid or Low Rectal Cancer after Neoadjuvant Chemoradiotherapy (COREAN) study 10 involving 340 patients with cancer of the middle or lower rectum who had received preoperative chemoradiotherapy, rates of locoregional recurrence were 2.6% after laparoscopie surgery and 4.9% after open surgery. The presence of involved circumferential resection margins in the COREAN trial (2.9% after laparoscopie surgery and 4.1 % after open surgery) were lower than those in our study. 20 However, we considered circumferential resection margins as being involved when tumor cells were present within 2 mm from the lateral surface of the mesorectum, whereas the COREAN study group used a 1-mm margin . The use of a 2-mm margin yields a higher rate of involved circumferential resection margins. 16 ln our study, laparoscopie surgery in patients with cancer in the lower third of the rectum 358

~

z

V

!'l

Z

nt

was associated with a lower rate of involved circumferential resection margin and a lower locoregional recurrence rate than was open surgery. During laparoscopie surgery, narrow spaces such as the lower pelvis are better visualized than in open surgery owing to the use of a laparoscope, which projects a magnified and well-illuminated image of the operative field on the monitors. A clear view is of paramount importance to accomplish a resection of the cancer with sufficient margins. As a result of tapering of the mesorectum at the level of the pelvic floor, tissue margins around low rectal cancers are smaller than those around tumors located in the middle or upper rectum, which predisposes such tumors to incomplete radical resection. 21 Therefore, a procedure called extralevatory abdominoperineal rectum extirpation (ELAPE), in which a part of the pelvic floor musculature is resected through a perineal approach, has been introduced. During the past decade, the ELAPE principle was introduced but was not included in the CO LOR II study protocol. 22 However, the debate on the value of this technique continues. The disease-free survival rates at 3 years in our study were 74.8% after laparoscopie surgery and 70.8% after open surgery, as compared with rates of 79 .2% and 72. 5%, respectively, during the same follow-up period in the COREAN study. 10 ln our study, among patients with stage III disease, disease-free survival rates were 64. 9% after laparoscopie surgery and 52.0% after open surgery. A similar finding was reported by Lacy and colleagues 15 among patients who underwent laparoscopie resection oflymph-node-positive colon cancers. These observations may confirm the experimental findings that less surgical trauma associated with the use of laparoscopie techniques reduces tumor recurrence. 23 ln a study involving patients undergoing laparoscopie and open colonie resection, laparoscopie surgery was followed ,

V'","1 ,

r 'J 'JI'

1)

Article

by attenuated stress responses and improved preservation of immune fonction. 24 Further studies are necessary to determine whether laparoscopie surgery for cancer is associated with improved survival. The size of the cohort in our study allowed for the use of a noninferiority margin of 5 percentage points, whereas in the smaller COREAN trial, the noninferiority margin was 15 percentage points. 20 Since centers in eight countries in Europe, North America, and A ia participated in our study, the outcomes appear to be applicable to surgical praccice in general. Rectal- cancer surgery, regardless of which technique is used, is technically demanding and requires sufficient training to be perfurmed satèly. We verified the surgical quality of laparoscopie total mesorectal e c1s10n by reviewing unedited recordings of five consecutive laparoscopie procedures for each center. Laparoscopie surgical expertise is diŒcult to measure ol:,jectively but is reflected to a certain extent by operative time and conversion rate. 25 The median operacing rimes foT laparoscopie procedures were 240 minutes in our scudy and 245 minutes in the COREAN criai; the latter obviously as recorded by highly skilled surgeons, given the low conversion race of only 1% in that study. 20 The conversion rate in our srudy rernained 16% throughouc the scudy period, whereas a decline in the conversion race from 38% in the firsc year to 16% in the Jase year of the trial was reported by the CLASICC group. 19 In our S'tudy, patients with T 4 and T3 lesions within 2 mm of the endopelvic fascia were excluded because laparoscopie resection of these large tumors is very diŒcult and could result in less-than-complete resection with ubsequent higher rates of locoregional recurrence. Therefore, we do not recommend laparoscopie surgery in patients with

T4 or T3 rectal cancers with threatened circumferential margins. A limitation of our study is the absence of centralized macroscopic and microscopie evaluation of the resected specimens. However, ail pathologists adhered to a detailed standardized protocol. Another limitation is the use of dif-. ferent imaging methods to determine the location of the tumor. I t would have been prefèrable to standardize the imaging technique of the pelvis and calibrate the measurements centrally by independent professionals. Sorne surgeons insert one of their hands through a gastight port in the abdomen during laparoscopie colorectal surgery to allow for manual retraction of tissues and tactile tèedback, a procedure called hand-assisted laparoscopie surgery. 26 The group who designed the study thought that a hand would obstruct the laparoscopie view of the narrow pelvis, so this technique was not part of the current protocol. In conclusion, long- term outcomes of the COLOR II trial indicate chat laparoscopie surgery is as safe and effective as open surgery in patients with rectal cancers without invasion of adjacent tissues. Supported by Ethicon Endo-Surgery Europe; grants from the Swedish Cancer Society (2010/593 and 2013/497); the Health and Medical Care Committee of the Regional Executive Board, Region Vastra Gôtaland, and an agreement concerning research and education of doctors, Sahlgrenska University Hospital, Gothenburg, Sweden; the Departments of Surgery and Biostatistics, Erasmus University Medical Center, Rotterdam, the Netherlands; the Department of Surgery, Dalhousie University, Halifax, NS, Canada; and the Department of Surgery, VU University Medical Center, Amsterdam.

359

ECNi 2018 - Sujet 2

Disclosure forms provided by the authors are available with the full text ofthis article at NEJM.org. We thank Karen lnglis and Kevin Druhan of Dalhousie University for coordinati ng the trial and gathering and processing data .

References 1.

2.

3.

4.

5. 6.

7. 8.

9.

1O.

11.

12.

13.

Ferlay J, Soerjomataram 1, Ervik M, et al. GLOBOCAN 2012: estimated cancer incidence, mortality, and prevalence worldwide in 2012. Lyon, France: International Agency for Research on Cancer, 2013 (http://globocan.iarc.fr). Cancer facts and figures 2014. Atlanta: American Cancer Society, 2014 (http://www.cancer.org/acs/groups/ content/@)research/ documents/webcontent/acspc042151.pdf.) National Bowel Cancer Audit annual report 2013. London: Health and Social Care Information Centre, 2013 (http:// www.hqip.org.uk/assets /NCAPOP-Library/ NCAPOP2013-14/Bowel-Cancer-Audit-Jul-2013-MA INREPO RT.pdf). Van Leersum NJ, Snijders HS, Henneman D, et al. The Dutc h Surgi cal ColorectalAudit. E11 rJ 011co/ 2013;39: 106370. Slaney G. Results oftreatment of carcinoma of the colon and rectum. Mod Trends Surg 1971 ;3:69-89. Heald RJ, Ryall RD. Recurrence and survival after total mesorectal excision for rectal cancer. Lancer 1986; 1: 147982. Macfarlane JK , Ryall RD, Heald Rj . Mesorectal excision for rectal cancer. La11cet 1993;341:457-60. Kapiteijn E, Marijnen CA, Nagtegaal ID, et al. Preoperative radiotherapy combined with total mesorectal excision for resectable rectal cancer. N E11gl J Med 2001 ;345 :638-46. Laurent C, Leblanc F, Wütrich P, Scheffier M, Rullier E. Laparoscopie versus open su rgery for rectal cancer: longtem1 oncologie results. A1111 S11rg 2009; 250:54-61. Jeong SY, Park JW, Nam BH, et al. Open versus laparoscopie surgery for midrectal or low-rectal cancer after neoadjuvant chemoradiotherapy (COREAN trial): survival outcomes of an open-label, noninferiority, randomised controlled trial. La11cet 011co/ 2014; 15:767-74. Veldkamp R, Kuhry E, Hop WC, et al. Laparoscopie surgery versus open surgery for colon cancer: short-term outcomes of a randomised trial. La11cet 011co/ 2005;6: 477-84. Berends FJ , Kazemier G, Bonjer HJ, Lange JF. Subcutaneous metastases after laparoscopie colectomy. La11cet 1994;344: 58. Cirocco WC, Schwartzman A, Golub RWAbdominal wall recurrence after laparoscopie colectomy for colon cancer. S11,gery 1994;116:842-6.

14. Colon Cancer Laparoscopie or Open Resection Study Croup. Survival after laparoscopie surgery versus open surgery for colon cancer: long-term outcome of a randomised clinical trial. La11cet 011col 2009;10:44-52. 15. Lacy AM, Garcîa-Valdecasas JC, Delgado S, et al. Laparoscopy-assisted colectomy versus open colectomy for treatment of non -metastatic colon cancer: a randomised trial. La11cet 2002; 359:2224-9. 16. van der Pas MH, Haglind E, Cuesta MA, et al. Laparoscopie versus open surgery for rectal cancer (COLOR 11): shorttern1 outcomes of a randomised, phase 3 trial. La11cet 011col 20 13; 14:210-8. 17. Jayne DG, Guillou PJ, Thorpe H, et al. Randomized trial offaparoscopic-assisted resection of colorectal carcinoma: 3-year results of the UK MRC CLAS lCCTrial Croup .J C/i11 011co/ 2007;25:3061-8. 18. Nagtegaal ID, Marijnen CA, Kranenbarg EK, van de Velde CJ, van Krieken JH . Circumferential margin involvement is still an important predictor offocal recurrence in rectal carcinoma: not one millimeter but two millimeters is the li mit. A111 J S11 rg Pat ho/ 2002;26:350-7. 19. Guillou PJ, Quirke P, Thorpe H , et al. Short-term endpoints of conventional versus laparoscopic-assisted surgery in patients with colorectal cancer (MRC CLASICC trial): multicentre, randomised controlled trial. La11cet 2005;365:1718-26. 20. Kang SB, Park JW,Jeong SY, et al. Open versus laparoscopie surgery for mid or low rectal cancer after neoadjuvant chemoradiotherapy (CO REAN trial): shorttem1 outcomes of an open-label randomised controlled trial. Lancer 011col 2010;11:637-45. 21. Marr R, Birbeck K, GarvicanJ, et al.The modern abdominoperineal excisi on: the next challenge after total mesorectal excis ion. A nn S11,g 2005;242:74-82. 22. Hohn T, Ljung A, Haggmark T, Jurell G, Lagergren J. Extended abdominoperineal resection with gluteus maximus ffap reconstruction of the pelvic Aoor for rectal cancer. Br J S11,g 2007;94 :232-8. 23. Bouvy ND, Marquet RL,Jeekel J, Bonjer HJ. Laparoscopie surgery is associated with Jess tumour growth stimulation than conventional surgery: an experimental study. Br J S11,g 1997;84 :358-61. 24. Veenhof AA,Vlug MS, van der Pas MH, et al. Surgical stress response and postoperative immune fonction after laparoscopy or open surgery with fast track or standard perioperative care: a randomized trial. Amr S11rg 2012;2 55 :216-21. 25. Harrysson IJ, Cook J, Sirimanna P, Feldman LS, Darzi A, Aggarwal R. Systematic review of leaming curves for minimally invasive abdominal surgery: a review of the methodology of data collection, depiction of outcomes, and statistical analysis. A1111 S11rg 2014;260: 37-45. 26. Milsom JW, de O liveira O Jr, Trencheva KI, Pandey S, Lee SW, Sonoda T. Longtenn outcomes of patients undergoing curative laparoscopie surgery for mid and low rectal cancer. Dis Colo11 Rect11111 2009; 52: 1215-22. Copyright© 2015 Massachusetts Medical Society.

360

,

Enoncé du sujet 2 Corrigé p. 364

-----01. Selon les auteurs, qu'est-ce qui justifie cette nouvelle étude ? A. Les études précédentes manquaient de puissance statistique pour formuler des recommandations B. La laparoscopie a progressivement remplacé la chirurgie ouverte pour le traitement des cancers du rectum C. Les études antérieures n'étaient pas multicentriques D. Les critères d'éligibilité des études antérieures étaient trop limitatifs E. La preuve de la non-infériorité de la laparoscopie comparativement à la chirurgie ouverte manquait pour le critère de survie dans le traitement du cancer du rectum 02. Sur le plan méthodologique, il s'agit d'une étude: A. Observationnelle B. Randomisée C. En double-aveugle D. De supériorité E. Rétrospective 03. Ouelle(s) est (sont) la (les) caractéristique(s) de la randomisation de cette étude ? A. La randomisation a été réalisée avec un ratio 2: 1 B. La randomisation était stratifiée sur la localisation du cancer C. La randomisation était centralisée D. Une liste de tirage au sort a été générée pour chaque centre participant E. La randomisation était équilibrée 04. Le critère de jugement principal de l'étude est un critère : A. Composite B. Intermédiaire C. Subjectif D. Identique pour les deux bras de l'essai E. Évalué par des investigateurs en aveugle du bras de l'essai

05. Ouelle(s) est (sont) la (les) caractéristique(s) de l'analyse statistique du critère de jugement principal? A. L'estimation ponctuelle de la différence d'incidence du critère de récidive locorégionale est encadrée d'un intervalle de confiance unilatéral à 95 % B. L'analyse principale a été réalisée en intention de traiter C. Le calcul du nombre de sujets nécessaire effectué a priori était égal à 1 000 D. La marge de non-infériorité était fixée à 5 points de pourcentage pour la différence d'incidence du critère de récidive locorégionale de la chirurgie laparoscopique par rapport à la chirurgie ouverte E. Une analyse supplémentaire a été réalisée en per-protocole 06. À propos du flux des patients dans l'étude: A. Le recrutement des patients a été réalisé entre janvier 2004 et mai 2010 B. La figure 1 suggère qu'il s'agissait d'un essai en cross-over C. 692 patients du bras laparoscopie ont été inclus dans l'analyse en intention de traiter D. 697 patients ont été inclus dans le groupe laparoscopie dans l'analyse en traitement reçu E. L'information sur le critère de jugement principal à 3 ans n'était pas disponible pour 26 % des patients randomisés 07. À propos de la découverte de métastases à distance: A. La proportion de patients exclus en raison de la découverte d'une métastase à distance est identique dans les deux bras de l'essai B. Les patients avec une métastase à distance de découverte peropératoire n'auraient pas dû être randomisés C. Les patients avec une métastase à distance de découverte peropératoire auraient dû être analysés dans leur groupe de randomisation initial

361

ECNi 2018 - Sujet 2

D. Le délai de découverte des métastases à distance aurait dû être explicité E. La chirurgie ouverte permet une meilleure visualisation des métastases à distance que la chirurgie laparoscopique 08. D'après le tableau 1 : A. Les patients ont été correctement appariés entre les deux bras de l'essai B. La proportion des données manquantes est significativement plus élevée dans le bras laparoscopie C. La distribution des caractéristiques à l'inclusion est homogène entre les deux bras de l'essai D. Le déséquilibre de l'effectif de patients entre les deux bras de l'essai témoigne d'un probable effet-centre E. Le nombre de ganglions prélevés (lymph nodes harvestecf) est supérieur ou égal à 10 chez tous les patients des deux bras de l'essai 09. Les limites de la chirurgie laparoscopique sont: A. La nécessité de maîtriser cette technique B. Une durée de procédure plus longue de 52 min comparativement à la chirurgie ouverte C. Une durée de séjour prolongée d'un jour comparativement à la chirurgie ouverte D. Une incidence plus élevée de fuites anastomotiques comparativement à la chirurgie ouverte E. La conversion en chirurgie ouverte pour 16 % des patients

010. En analyse en intention de traiter: A. L'estimation ponctuelle de l'incidence de la récidive locorégionale à 3 ans était de 5 % dans les deux bras de l'essai B. L'estimation ponctuelle de la différence d'incidence de la récidive locorégionale à 3 ans entre les deux bras de l'essai était de 0 point de pourcentage C. La borne supérieure de l'intervalle de confiance bilatéral à 90 % de la différence d'incidence de la récidive locorégionale à 3 ans entre les deux bras de l'essai était de 2,6 points de pourcentage D. L'estimation ponctuelle de l'incidence de la récidive locorégionale à 3 ans dans le bras laparoscopie était égale à la marge de non-infériorité (5 points de pourcentage) de l'essai E. L'incidence de la récidive loco-régionale à ·3 ans observée dans le bras laparoscopie

362

(31 patients) est double de celle observée dans le bras de chirurgie ouverte (15 patients) 011. À propos de la figure 2: A. Il s'agit de courbes de survie établies par la méthode de Kaplan-Meier B. La survie médiane sans récidive est de 3 ans C. Les panels B, C, et D sont des analyses de sous-groupes D. Chaque courbe représente l'estimation de la survie sans récidive en fonction du temps E. La décroissance des effectifs au cours du temps résulte des censures, des récidives locorégionales de cancer et des décès 012. À propos de la figure 3: A. La survie globale ne diffère pas significativement entre les deux bras de l'essai pour l'ensemble des patients B. Le chevauchement des écarts-types des deux courbes indique qu'il n'y a pas de différence entre les deux bras de l'essai pour le sous-groupe des patients de stage Il C. La survie globale est plus élevée dans le bras de chirurgie ouverte pour le sousgroupe des patients de stage 1 D. La survie globale est plus élevée dans le bras laparoscopie pour le sous-groupe des patients de stage Ill E. Le bénéfice en termes de survie globale de la chirurgie laparoscopique comparativement à la chirurgie ouverte varie en fonction du stage du cancer du rectum 013. Qu'est-ce qui pourrait expliquer les résultats divergents entre l'étude COLOR Il et les études antérieures ? A. Les résultats à 3 ans de l'étude CLASICC ont été publiés en 2007 B. Les marges de résection chirurgicale des cancers étaient différentes entre les études COLOR Il et COREAN C. La maîtrise technique de la chirurgie laparoscopique s'est améliorée au cours du temps D. La prévalence de la radio-chimiothérapie néo-adjuvante différait entre les études COLOR Il et COREAN E. La procédure ELAPE (extralevatory abdominoperinea/ rectum extirpation) était réalisée systématiquement dans l'étude COLOR Il

Énoncé

014. Qu'est-ce qui limite la confiance dans les résultats de cette étude ? A. Le caractère ouvert de l'étude B. L'absence de standardisation de l'imagerie permettant la classification de la localisation tumorale par rapport à la marge anale C. L'absence de centralisation de l'analyse anatomopathologique des pièces de résection chirurgicale D. La durée de la période de recrutement des patients E. Le financement de l'étude par un industriel

015. Quelle(s) option(s) les résultats de cette étude permettent de proposer en réunion de concertation pluridisciplinaire pour les patients avec un adénocarcinome du rectum situé à moins de 15 cm de la mage anale et sans envahissement locorégional ni métastase à distance? A. Réserver la chirurgie laparoscopique aux patients avec un cancer de stage Ill B. Adresser ces patients à des opérateurs expérimentés en chirurgie laparoscopique carcinologique du rectum C. Contre-indiquer la chirurgie laparoscopique aux patients avec un cancer de stage 1 D. Ne pas proposer la chirurgie laparoscopique pour ces patients, dans l'attente de la publication des résultats d'essais randomisés indépendants des industriels E. Laisser aux patients le choix de la technique opératoire

363

Corrigé du sujet 2 Énoncé P· 36 1

Article assez simple où beaucoup de questions font appel directement au texte . Un sujet similaire sur le même article est proposé à la fin du Collège de LCA. Sa correction lacunaire est revue ici. Je vous conseille vivement de vous entraîner aux sujets de la fin du Collège car ils définissent visiblement bien les contours de ce qu'attendent les correcteurs.

Question 1 Selon les auteurs, qu'est-ce qui justifie cette nouvelle étude? A. Les études précédentes manquaient de puissance statistique pour formuler des recommandations B. La laparoscopie a progressivement remplacé la chirurgie ouverte pour le traitement des cancers du rectum C. Les études antérieures n'étaient pas multicentriques D. Les critères d'éligibilité des études antérieures étaient tro limitatifs E. La preuve de la non-infériorité de la laparoscopie comparativement à la chirurgie ouverte manquait pour le critère de survie dans le traitement du cancer du rectum

Première question des plus classiques sur le rationnel de l'étude.

:>

Voir le point sur la justification de l'étude p. 3.

Comme toujours, les réponses se trouvent essentiellement dans l'introduction, mais aussi pa,fois dans la discussion. Item A : le grand effectif de cet essai, et donc sa forte puissance, permet de fixer des marges de non- infériorité plus contraignantes, et donc d'apporter de meilleurs arguments pour les recommandations. Cet argumen t est exposé en discussion . The size of the cohort in our study allowed for the use of a noninferiority margin of 5 percentage points, whereas in the smaller COREAN trial, the noninferiority margin was 15 percentage points.

Items B et C : on retrouve dans l'introduction la notion selon laquelle la laparoscopie a bien remplacé la chirurgie ouverte, et on lit dans la discussion le fait que cette étude est la première à être multicentrique (et randomisée) . ln the Conventional versus Laparoscopic-Assisted Surgery in Colorectal Cancer (CLAS/CC) trial, the first multicenter, randomized study to determine the effect of laparoscopie surgery [. .. ].

Item D : rien n'indique dans l' article que cette étude élargisse les critères d'éligibilité par rapport aux précédentes études. Au contraire, de fait de l'exclusion des patients T3 et T4, les auteurs préviennent qu'aucune conclusion ne pourra être faite sur ces patients. Item E : il s'agit de la traduction pure d'une phrase de l'introduction . However, evidence is lacking from large, randomized clinicol trials indicoting that survival after laparoscopie resection of rectal cancer is not inferior to open surgery.

364

Corrigé

Question 2 Sur le plan méthodologique, il s'agit d'une étude : A. Observati onnelle

B. C. D. E.

Randomisée En double-aveugle De supériorité Rétrospective

Question de lecture pure, qui utilise un vocabulaire que vous devez absolument maîtriser ! :) Voir le point de cours sur les études thérapeutiques p. 42.

Items A , B , C et D : il s'agit d'une étude interventionnelle (par opposition à observationnelle) randomisée ouverte multicentrique de non-infériorité. The COLOR Il trial was a noninferiority, open-label, multicenter trial conducted al 30 centers in 8 countries. Randomization was performed al the patient level.

Item E : une étude interventionnelle est toujours prospective. Question 3 Quelle(s) est (sont) la (les) caractéristique(s) de la randomisation de cette étude ?

A. B. C. D. E.

La randomisation a été réalisée avec un ratio 2:1 La randomisation était stratifiée sur la localisation du cancer La randomisation était centralisée Une liste de tirage au sort a été générée pour chaque centre participant La randomisation était équilibrée

La randomisation et la stratification sont deux notions clefs en LCA, indispensables pour comprendre

les protocoles d'étude mais également pour répondre à beaucoup de questions en épreuve. :) Voir les deux points de cours sur la randomisation p. 44 et la stratification p. 4S.

Items A et E : la randomisation est déséquilibrée en 2: 1. Items B et D : cette randomisation est notamment stratifiée sur la localisation du cancer et le centre. On peut donc cocher qu'il existe au moins une liste de tirage générée dans chaque centre (imprécision cochée systématiquement juste dans les corrections officielles de partiels). Item C : la randomisation est centralisée, comme dans la plupart des essais multicentriques de bon niveau. Question 4 Le critère de jugement principal de l'étude est un critère : A . Composite

B. C. D. E.

Intermédiaire Subjectif Identique pour les deux bras de l'essai Évalué par des investigateurs en aveugle du bras de l'essai

365

ECNi 2018 - Sujet 2

Voilà une nouvelle question (la 3e de suite !) qui aborde des notions à bien comprendre : après la randomisation et la stratification, place au critère de jugement principal! :) Voir le point de cours sur le critère de jugement principal p. 12.

L'amplitude des possibilités de propositions n'est pas si large qu'il y paraît, et vous aurez rapidement balayé toutes les questions possibles à force d'entraînement. Le critère de jugement principal est la récurrence locorégionale à 3 ans. Il s'agit d'un critère : • item A: unique et non composite (l'événement est unique, il n'est pas composé d'autres événements) ; • item B : intermédiaire (un critère final aurait été la mortalité. La récurrence locorégionale en cancérologie est considérée comme intermédiaire) ; • item C : subjectif (lecture de scanners/IRM, il n'y a pas de mesure incontestable, nous verrons ça plus tard) ;

/1 On

considère classiquement que l'échographie est une modalité d'imagerie plus subjective que les scanner ou l'IRM, ce qui conduit même certains auteurs à considérer que ces deux derniers outils sont des méthodes d'évaluation objective. Il n'y a pas de réponse tranchée à la question « objectif vs subjectif » : essayez de percevoir le ton de l'auteur du texte et du rédacteur du sujet (généralement plus critique à l'égard d'une modalité subjective).

• item D : identique entre les deux groupes ; • item E : évalué en ouvert. C'est regrettable, le radiologue aurait pu être aveugle (c'est un comble !) . Question 5 Quelle(s) est (sont) la (les) caractéristique(s) de l'analyse statistique du critère de jugement principal? A. L'estimation ponctuelle de la différence d'incidence du critère de récidive locorégionale est encadrée d'un intervalle de confiance unilatéral à 95 % B. L'analyse principale a été réalisée en intention de traiter C. Le calcul du nombre de sujets nécessaire effectué a priori était égal à 1 000 D. La marge de non-infériorité était fixée à 5 points de pourcentage pour la différence d'incidence du critère de récidive locorégionale de la chirurgie laparoscopique par rapport à la chirurgie ouverte E. Une ana lyse su pplémentai re a été réa lisée en per-protocole

Une question qui peut sembler difficile au premier abord, mais pour laquelle toutes les réponses se trouvent directement dans le texte. Item A : l'estimation ponctuelle de la différence en termes de récidive locorégionale est ici encadrée de son intervalle de confiance unilatéral à 95 %, comme expliqué dans le texte. La borne supérieure de cet intervalle unilatéral à 95 % correspond à la borne supérieure d'un intervalle de confiance bilatéral à 90 %. The one-sided 95% confidence interval for the between group difference in locoregional recurrence corresponds to the upper limit of the two-sided 90% confidence interval for this difference.

366

Corrigé

Item B : l'analyse principale est en ITT en accord avec un essai thérapeutique de grande envergure. Ali analyses were performed on an intention-to-treat basis. :, Voir le point de cours« ITT, per-protocole et traitement recu » p. 50.

Item C : le calcul du NSN aboutissait en effet à 1000 patients. :, Voir le point de cours sur le NSN p. 7.

Item D : il s'agit de la définition du seuil de non-infériorité concédé. Laparoscopie surgery was considered to be noninferior to open surgery if the one-sided 95% confidence interval for the difference in locoregional recurrence rates excluded an absolute difference of 5 percentage points or more.

Item E : une analyse supplémentaire (que l'on pourrait qualifier de sensibilité) a été réalisée en traitement reçu et non en per-protocole. ln addition, we performed as-treated analysis for locoregional recurrence, disease-free survival, and overalf survival.

! La conclusion générale de l'étude porte sur l'analyse principale, mais elle est toujours renforcée si les analyses de sensibilité vont dans le même sens !

Question 6

À propos du flux des patients dans l'étude : A. Le recrutement des patients a été réalisé entre janvier 2004 et mai 2010 B. La figu re 1 suggè re qu' il s'agissait d'un essa i en cross -over C. 692 patients du bras laparoscop ie ont été inclus dans l'analyse en int ention de t ra iter D. 697 patients ont été inclus dans le groupe laparoscopie dans l'analyse en traitement reçu E. L'information sur le critère de jugement principal à 3 ans n'était pas disponible pour 26 % des patients randomisés

Les items C et D étaient les plus difficiles de cette question : calculer (même une simple somme) n'est pas toujours facile avec la pression de l'épreuve et du chronomètre, d'autant qu'il fallait préalablement bien maîtriser certaines difinitions . :, Voir le point de cours « ITT, per-protocole et traitement recu » p. 50.

Item A : le recrutement s'est étalé de janvier 2004 à mai 2010. From January 2004 through May 2010, a total of 1103 patients with rectal cancer underwent randomization.

Item B : Les deux bras sont bien parallèles dans le f1ow-chart et il n'est fait aucune mention de cross-over dans le protocole. Item C : La population laparoscopie en ITT modifiée comprend ici les 739 patients randomisés dans ce groupe, auxquels sont soustraits 40 patients exclus (caractère « modifiée » de l'ITT), donnant au final 699 patients dans ce groupe.

367

ECNi 2018 - Sujet 2

Item D : La population laparoscopie en traitement reçu comprend tous les patients ayant reçu la laparoscopie, soit 692 patients depuis le groupe laparoscopie (699 patients moins 7 ayant reçu la chirurgie ouverte) et 5 patients randomisés dans le groupe chirurgie ouverte mais ayant reçu la laparoscopie, soit 697 patients au total. 699 Were included in the analysis 7 Underwent open surgery

345 Were included in the analysis 5 Underwent laparoscopie surgery

Figure 1. Enrollment and Outcomes.

Item E : le texte auquel renvoie la figure 1 indique en effet que 74 % des patients de l'analyse ITT ont une mesure du CJP à 3 ans, donc la mesure est absente pour 26 % des sujets. At the 3-year follaw-up, data were available for 771 patients (74%) regarding locoregianal recurrence, 923 (89%) regarding disease-free. Question 7

À propos de la découverte de métastases à distance : A. La proportion de patients exclus en raison de la découverte d'une métastase à distance est identique dans les deux bras de l'essai B. Les patients avec une métastase à distance de découverte peropératoire n'auraient pas dû être randomisés C. Les patients avec une métastase à distance de découverte peropératoire auraient dû être analysés dans leur groupe de randomisation initial D. Le délai de découverte des métastases à distance aurait dû être explicité E. La chirurgie ouverte permet une meilleure visualisation des métastases à distance que la chirurgie laparoscopique

Cette question est vraiment difficile, car elle n'est ni de la simple lecture du texte, ni du cours pur et dur. Chaque item nécessitait son propre raisonnement et donc un temps considérable. Item A : cette réponse se retrouve dans le flow-chart, où on apprend que 12 patients sur 739 (1,6 %) et 2 patients sur 364 (0,5 %) ont été exclus en raison de la découverte de métastases à distance. On est sur une différence absolue minime (1, 1 %) mais un rapport de plus de 3. Donc s'il existe quelque chose à dire à ce sujet, c'est que ces deux proportions ne sont pas identiques. Item B : la découverte peropératoire de métastases se fait par définition au cours de la chirurgie, et celle-ci a été allouée en fonction de la randomisation. Les patients ont donc dû subir l'inclusion puis la randomisation puis la chirurgie (dans cet ordre) pour que les métastases à distance soient découvertes. Il est impossible de ne pas les inclure sur une information dont on ne dispose pas au moment de l'évaluation de l'éligibilité, on peut tout au plus les exclure (ce qui a été fait). Item C : il existe peu de raisons acceptables d'exclure un patient de l'analyse en ITT. Ces dernières sont : • le retrait du consentement (ce n'est pas le cas ici) ; • une erreur humaine sur l'éligibilité à l'inclusion (erreur sur l'âge, les antécédents, etc .) l'éligibilité du patient était en effet erronée. Ici, l'inclusion à tort de certains patients n'était pas due à une erreur humaine ou même à une erreur, mais juste à une information accessible plus tard dans la prise en charge de ces patients ; 368

Corrigé

• le patient n'a jamais reçu aucune des deux interventions (ce n'est pas le cas ici). On est donc ici hors de ces trois options. Les sujets n'auraient donc pas dû être exclus de l'analyse ITT : ils auraient bien du être analysés dans leur groupe de randomisation initiale. Item D : on peut imaginer que connaître le délai d'apparition des métastases à distance aurait pu permettre de préciser les données. Seule la proportion de patients présentant cet événement à 3 ans est reportée. Item E : il n'y a pas de discussion des performances diagnostiques de la chirurgie pour la découverte de métastases à distance. On note toutefois que 3 fois plus de métastases peropératoires ont été trouvées en cœlioscopie. C'est un détail plutôt intéressant car on pourrait imaginer que certains chirurgiens soient attachés au bilan d'extension peropératoire qu'offre la chirurgie ouverte. On montre ici indirectement que la cœlioscopie ne semble pas moins bonne pour cet aspect de la prise en charge, même si aucun test n'est réalisé (on ne conclura pas sur cette information qui n'est pas l'analyse principale de l'étude) . Question 8 D'après le tableau 1 : A. Les patients ont été correctement appariés entre les deux bras de l'essai B. La proportion des données manquantes est significativement plus élevée dans le bras laparoscopie C. La distribution des caractéristiques à l' inclusion est homogène entre les deux bras de l'essai D. Le déséquilibre de l'effectif de patients entre les deux bras de l'essai témoigne d' un probable effet-centre E. Le nombre de ganglions prélevés (lymph nodes harvested) est supérieur ou égal à 10 chez tous les patients des deux bras de l'essai

La.figure 1 de l'étude fait très souvent l'objet d'une ou plusieurs questions. :) Voir le point de méthodologie sur l'interprétation du tableau 1 p. 14.

Item A : il n'y a pas eu ici d'appariement mais une randomisation déséquilibrée, ce qui n'est pas la même chose ! Aucun matching n'est réalisé à l'échelle individuelle comme dans un appariement et les deux groupes sont formés par tirage au sort du bras de traitement. :)

Voir le point de cours sur l'appariement p. 71.

Items B et C : du fait de la randomisation, les deux groupes sont jugés comparables et il n'est fait mention d'aucune différence significative. Item D : la randomisation étant déséquilibrée, il est normal que les effectifs ne soient pas identiques. L'effet-centre est par ailleurs un biais que l'on recherche dans les résultats des analyses dans le cas d'essais non stratifiés sur le centre : aucun rapport avec cet essai et ce tableau 1. Item E : les questions sur l'interprétation de l'étendue, des IQR et de la médiane sont un grand classique ! Le piège traditionnel est de confondre les valeurs maximales et minimales avec les valeurs des quartiles. Ici, la borne inférieure de l'IQR de la variable « nombre de ganglions prélevés » était à 10, ce qui signifie que le premier quartile était à 10. Autrement dit, chez 75 % des patients à l'essai, au moins 10 ganglions avaient été prélevés. À l'inverse, 25 % ont eu moins de 10 ganglions prélevés.

369

ECNi 2018 - Sujet 2

Si vous avez un doute, pas de panique ! Il est toujours écrit quelque part autour du tableau (à l'intérieur, ou bien dans les lignes en dessous) si les valeurs entres parenthèses correspondent aux valeurs maximales et minimales ou aux quartiles !

Question 9 Les limites de la chirurgie laparoscopique sont : A. La nécessité de maîtriser cette technique B. Une durée de procédure plus longue de 52 min comparativement à la chirurgie ouverte C. Une durée de séjour prolongée d'un jour comparativement à la chirurgie ouverte D. Une incidence plus élevée de fuites anastomotiques comparativement à la chirurgie ouverte E. La conversion en chirurgie ouverte pour 16 % des patients

Cette question, à l'exception de l'item A, nécessite simplement de retrouver et de traduire un unique paragraphe de résultats . Ce n'est pas rare que le correcteur se concentre sur un seul paragraphe et traduise simplement celui-ci en plusieurs propositions : soyez vigilants et ce sont des points aisément gagnés ! Item A : 5 patients n'ont pas pu recevoir une laparoscopie en raison de l'absence de chirurgien formé à la technique. On peut s'imaginer qu'en situation réelle, les contraintes seraient encore plus fortes que pour cet essai réalisé au sein de centres probablement universitaires et spécialisés. Dans un souci de validité externe, il faut que les caractéristiques des opérateurs de l'essai témoignent de celles des opérateurs qui prennent en charge ce genre de pathologies dans la vraie vie (ni trop experts, ni pas assez). Item B : le temps opératoire est effectivement plus long de 52 min en cœlioscopie, ce qui peut poser des problèmes médicaux et économiques (quasiment 1 h de plus par bloc). ln the laparoscopoc-surgery group, the operating lime was 52 minutes longer.

Item C : contrairement au temps opératoire, le temps de séjour hospitalier était à l'inverse un jour plus court dans le groupe laparoscopie. ln the laparoscopoc-surgery group [. .. ] the hospital stay was 1 day shorter thon in the open-surgery group.

Ceci contrebalance peut-être le surcoût lié à une intervention plus longue (intérêt d'une analyse médico-économique ?). Item D : aucune différence n'a pu être mise en évidence au sujet des fistules anastomotiques (anastomotic leakage dans le texte, ou fistula) entre les deux groupes. There were no significant differences in the rates of anastomotic leaking, complication.

Item E : la conversion en chirurgie ouverte a effectivement concerné 16 % des laparoscopies. The conversion rate from laparoscopie surgery to open surgery was 16%.

370

Corrigé

Question 10 En analyse en intention de traiter : A. L'estimation ponctuelle de l'incidence de la récidive locorégionale à 3 ans était de 5 % dans les deux bras de l'essai B. L'estimation ponctuelle de la différence d'incidence de la récidive locorégionale à 3 ans entre les deux bras de l'essai était de O point de pourcentage C. La borne supérieure de l'intervalle de confiance bilatéral à 90 % de la différence d'incidence de la récidive locorégionale à 3 ans entre les deux bras de l'essai était de 2,6 points de pourcentage D. L'estimation ponctuelle de l' incidence de la récidive locorég ionale à 3 ans dans le bras laparoscopie était égale à la marge de non-infériorité (5 points de pourcentage) de l'essa i E. L'incidence de la récidive loco-régionale à 3 ans observée dans le bras laparoscopie (31 patients) est double de celle observée dans le bras de chirurgie ouverte (15 patients)

Une question pas si simple qui allie lecture du tableau des résultats et rijlexion. Les items D et E ont pu gêner beaucoup d'étudiants! Items A et B : on retrouve dans le tableau 2 que l'estimation ponctuelle de l'incidence de la récurrence dans la population ITT est bien égale à 5 % dans les deux groupes (cercle bleu). Le corollaire de cette notion est que l'estimation ponctuelle de la différence est de 0 (cercle rouge). Item C : on voit entre parenthèses que la limite supérieure de l'intervalle de confiance à 90 % de cette différence est de 2,6 (cercle vert). Item D : La marge de non- infériorité est une différence de taux d'incidence, et non un taux d'incidence. Ainsi, il n'y a pas sujet à comparer les récidives dans un ~roupe avec la marge de non-infériorité qui s'intéresse à la différence entre les groupes . A noter que la proposition pourrait être considérée comme exacte si l'on s'intéressait uniquement à la valeur chiffrée (5 %), mais nous ne faisons pas ce choix ici. Item E : si l'on veut être très rigoureux, une incidence correspond au nombre de cas dans une période donnée. Il ne faut pas confondre avec le taux d'incidence, qui est lui une incidence rapportée à un nombre de personnes exposées. Ainsi, même si le nombre de cas incidents (et donc l'incidence) est double dans le groupe laparoscopie (ce qui valide l'item E), le taux d'incidence est égal entre les deux groupes en raison d'un nombre de sujets double dans le groupe laparoscopie.

371

ECNi 2018 - Sujet 2

Table 2. lnvalved Circumferential Resectian Morgin and Lacoregional Recurrence. lnvolved Circumferential

Locoregional Recurrence in

Locoregional Recurrence

Resection Morgin*

lntention-to-T reat Population

in As-Treated Population

>-

Type of Lesion and

Patients with

Between-Group

Surgery

Findingt

Difference

*

no./total no.

percentage

(%)

points (95% Cl)

Between-Group

Rate

%

Difference ~

* -

centage po~ (90%CII

Rate

%

Between-Group Difference

*

percentage 1 points (90% Cl)

Ali lesions Laparoscopie surgery / i--:s6/588 (10)' y0.5 1-4.9 to 3.5) Open surgery

'5.o\

ro .g)(-2.6 to~)

~ .o)

' r-J0/300 (lOJ., 1

4.3

-2.0 1-4.7 to 0.7)

6.3

Upper rectal lesion Laparoscopie surgery

18/19619)

Open surgery

9/97 (9)

-0. l 1-8.2 to 6.4)

3.5

0 .6 1-2.9 to 4.1)

2.9

3.0

-0.9 (-4.6 to 2.8)

3.9

Middle rectal lesion Laparoscopie surgery

22/228 110)

Open surgery

4/11513)

6.2 I0. l to l l .2)

6.5

4. l (0.7 to 7.5)

5.7

l .6 1-2.3 to 5.5)

4.1

2.4

Lower rectal lesion Laparoscopie surgery

15/16419)

Open surgery

17/79122)

-12.41-23.2 to -3.0)

4.4 11.7

-7.3 1-13.9 to -0.7)

3.8

-8.9 (-15.6 to -2.2)

12.7

Question 11

À propos de la figure 2 : Il s'agit de courbes de survie établies par la méthode de Kaplan-Meier La surv ie méd iane sans récid ive est de 3 ans Les panels B, C, et D sont des analyses de sous-groupes Chaque courbe représente l'estimation de la survie sans récidive en fonction du temps E. La décroissance des effectifs au cours du temps résulte des censures, des récidives locorégionales de cancer et des décès

A. B. C. D.

Les notions de censure et de survie semblent tenir à cœur des correcteurs ! Je vous invite à vous faire une idée claire à ce sujet pour ne pas être pris au dépourvu par un énoncé un peu plus subtil ! :, Voir le point de cours sur la survie p. 57.

Item A : visuellement, ce sont des courbes de survie de type Kaplan-Meier. Il n'y a pas de piège possible. La réponse est aussi dans les méthodes en cas de doute : We used the Kaplan-Meier method to compare rates of recurrence, disease-free survival, and overa/1 survival at 3 years.

Item B : ici, il est impossible de calculer la survie médiane puisque le seuil nécessaire de 50 % d'événements n'a pas été atteint. Items C et D : les panels B, C et D intéressent des groupes de patients au sein de la population globale de l'échantillon : c'est par définition une analyse en sous-groupes. L'ordonnée de chaque courbe est la survie sans récidive, et l'abscisse est le temps .

372

Corrigé

Item E : dans une courbe de Kaplan-Meier, il existe 2 façons de faire baisser l'effectif de la population à risque : réaliser l'événement ou être censuré. Ici, la récidive ou le décès réalisaient l'événement donc cette proposition est exacte. Question 12

À propos de la figure 3 : A. La survie globale ne diffère pas significativement entre les deux bras de l'essai pour l'ensemble des patients B. Le chevauchement des écarts-types des deux courbes indique qu'il n'y a pas de différence entre les deux bras de l'essai pour le sous-groupe des patients de stage Il C. La survie globale est plus élevée dans le bras de chirurgie ouverte pour le sous-groupe des patients de stage 1 D. La survie globale est plus élevée dans le bras laparoscopie pour le sous-groupe des patients de stage Ill E. Le bénéfice en termes de survie globale de la chirurgie laparoscopique comparativement à la chirurgie ouverte varie en fonction du stage du cancer du rectum

Une nouvelle question sur les résultats de l'étude . Même quand l'énoncé ne mentionne qu'un tableau ou une figure (comme ici:I

'TU

I ,

u t

I

Corrigé

Items A, B et D : le suivi des patients débutait en 1992 et pouvait s'étendre jusqu'en 2008. Les cas incidents sont les cas totaux apparus au cours du suivi . Ici, ce nombre est bien de 42, dont 5 cas incidents identifiés par analyse des registres de décès . Persan-lime was calculated from the date of return of the 1992 questionnaire until the date of first onset of ALS symptoms (37 cases), death from ALS or any other cause (5 cases), or the end of follow-up (December 31, 2008).

Item E : tous les patients auraient contribué au même nombre de PA si la durée de suivi avait été identique pour chaque patient, ce qui n ' est pas le cas en raison des sorties d'études (décès, présentation de l'événement, perdus de vue, etc .). Item C : c'est de la lecture pure : ln total, we identified 42 cases of ALS in 565, 125 person-years contributed by 40,046 men. Question 10 Pourquoi le tabagisme aurait pu constituer un facteur de confusion expliquant, en partie, l'association observée entre l'alopécie et la survenue d'une sclérose latérale amyotrophique dans cette étude ? A. Le tabagisme est un facteur de risque potentiel de sclérose latérale amyotrophique rapporté dans la littérature B. Le tabagisme est associé à un risque accru d'alopécie dans la littérature C. L'i nformation recueillie sur le tabagisme est de nature déclarative dans cette étude D. L'ajustem ent sur le tabag isme en analyse multivariée m od ifi e peu l'estim ation ponctuelle du risque relatif E. La prévalence du tabag isme décroît avec la sévérité de l'a lopéci e

Item s A et B : on apprend dans l'introduction que le tabac est un FdR commun à la maladie et à l'exposition : c'est donc un facteur de confusion potentiel. Smoking has been suggested ta increase the risk of ALS ( 14), as we/1 as alopecia ( 15).

A+------ - • M + ? Item C : le fait que l'information sur le tabagisme ait été recueillie de manière déclarative n'est pas un argument pour dire que le tabagisme est un biais de confusion. En effet, un facteur de confusion peut tout à fait être mesuré objectivement : le mode de recueil n'a rien à voir avec le caractère confusionnel ou pas. Item D : Le fait que l'aj ustement m odifie peu l'estimation du RR n'est pas un argument en faveur du fait que le tabac soit un facteur de confusion . En effet, le propre de l'ajustement est précisément de se départir de l'influence des facteurs de confusion . Si une fois l'ajustement réalisé le RR est peu modifié, cette influence est faible. On peut

391

ECNi 2017 - Sujet 1

donc penser que le facteur considéré n 'a pas une grande influence sur le lien entre les deux variables et que ce lien est probablement indépendant. Item E : il est impossible de répondre E même si le tableau 1 semble indiquer ce résultat ! En effet, aucun test n'est réalisé et l'affirmation « effet-dose » est donc abusive. Une relation dose-effet entre en revanche dans les critères de causalité . Si elle avait été retrouvée, même inverse, elle aurait pu être un argument pour présenter le tabagisme comme un facteur de confusion . Question 11 Ouelle(s) stratégie(s) utilisent les auteurs pour s'affranchir de l'effet de l'utilisation de finastéride dans l'analyse de l'association entre l'alopécie et la sclérose latérale amyotrophique? A. L'ajustement à l'aide d'un modèle multivarié B. La stratification sur la prise ou non de finastéride C. L'appariement des cas et des témoins sur l'utilisation de la finastéride D. La standardisation sur la prise de finastéride E. La restriction de l'analyse aux non-utilisateurs de finastéride

Le finastéride est un médicament utilisé dans le traitement de l'alopécie et qui modifie l'effet de la testostérone dans le corps. La testostérone est potentiellement impliquée dans le développement de la SLA. Dans un cas limite où la finastéride causerait la SLA et où tous les patients avec alopécie seraient traités par finastéride , un RR élevé entre alopécie et SLA serait retrouvé mais ce serait l'effet du médicament et non celui propre de l'alopécie qui serait mesuré .

A+-------• M +

Item E : dans cet essai, pour se départir de cet effet, les auteurs ont réalisé une analyse complémentaire en excluant tous les patients sous finastéride. L'effet retrouvé étant similaire, l'impact du finastéride dans le résultat principal est jugé faible. Ta avoid the potentional influence of alopecia-associated drug use, we excluded finastéride users in a secondary analysis /2 cases among 716 users). ln this analysis (which required moving the baseline from 1992 to 1996, when finastéride use was first assessed), the multicariable adjusted relative risk of ALS comparing extensive alopecia with no alopecia was 2, 85 /95 % confidence interval: 1. 10, 7.41).

Item A : les auteurs auraient pu réaliser une analyse multivariée ajustée sur la prise de finastéride mais ils ne l'ont pas fait . Item B : si aucune randomisation n'a été réalisée, il est évident qu 'aucune stratification de la randomisation n'a été proposée. Cependant, nous avons déjà vu que le terme d'analyse stratifiée pouvait parfois être utilisé comme une méthode d'analyse des OR/RR en se dégageant des effets de confusion. Une analyse stratifiée par modèle de Cox est 392

Corrigé

effectivement réalisée ici, mais le finastéride n'est pas pris en compte dans le modèle. Si ça avait été le cas, la question aurait fait un carnage, beaucoup d'étudiants n'envisagent le terme« stratification» qu'en lien avec la randomisation, alors que c'est aussi un synonyme d'analyse multivariée. Items C, D et E : il n'y a pas eu plus d'appariement que de standardisation dans cette étude. En effet, pour se départir de l'effet du finastéride, les auteurs ont tout simplement réalisé une analyse complémentaire en excluant tous les patients sous finastéride. L'effet retrouvé étant similaire, l'impact du finastéride dans le résultat principal est jugé faible : To avoid the potentional influence of alopecia-associated drug use, we excluded finastéride users in a secondary analysis (2 cases among 716 users). ln this analysis (which required moving the baseline from 1992 to 1996, when finastéride use was first assessed/, the multicariable ad;usted relative risk of ALS comparing extensive alopecia with no alopecia was 2,85 (95 % confidence interval: 1. 10, 7.41 ). Question 12 En analyse multivariée, cette étude objective une relation croissante entre le risque de sclérose latérale amyotrophique et l'intensité de l'alopécie. Ce résultat peut potentiellement s'expliquer par: A. Le risque d'erreur statistique de première espèce ou risque a B. Un défaut de puissance statistique C. L'existence de facteurs de confusion résiduels méconnus D. Un biais dans le recueil de l'information sur l'alopécie E. Le codage de l'alopécie en trois catégories au lieu des cinq catégories de la classification de Norwood

Item A : un résultat statistique est jugé significatif au risque alpha de se tromper. Item C : l'existence de facteurs de confusion résiduels méconnus est aussi une hypothèse toujours valide pour expliquer un résultat significatif Nous l'avons vu, seuls les facteurs de confusion identifiés sont corrigés dans le modèle. Item B : devant ce résultat significatif, il n'est pas possible d'évoquer un manque de puissance. Item D : le biais de recueil de l'information sur l'exposition est non différentiel. Ceci signifie que la maladie n'a pas eu d'impact sur la manière dont l'exposition sur l'alopécie a été rapportée . D'après le Collège de santé publique, les biais non différentiels ne peuvent que sous-estimer l'association entre deux variables (contrairement aux biais différentiels qui peuvent sous- ou plus souvent surestimer l'association). Item E : il est très improbable que le choix du nombre de catégories de la classification de Norwood explique la relation dose-effet de l'alopécie sur le risque de SLA. En effet, les auteurs réalisent une analyse de sensibilité qui rétablit les 5 catégories de Norwood et ils indiquent que le résultat reste significatif : When we used 5 alopecia categories instead of 3, the results were similor (P for linear trend= 0.03).

393

ECNi 2017 - Sujet 1

Question 13 L'association entre l'alopécie et le risque accru de sclérose latérale amyotrophique pourrait s'expliquer par: A. Des mutations du gène des récepteurs androgéniques B. Un polymorphisme nucléotidique à proximité du gène TAR DNA-binding protein 43 (TARDBP/TDP-43) C. Une sensibilité augmentée des récepteurs androgéniques D. Une augmentation des taux circulants de dihydrotestostérone E. L'accumulation de la protéine TDP43 dans les follicules du cuir chevelu

On voit avec cette question que les propositions peuvent être larges (TDP-43, dihydrotestostérone, etc.) mais c'est rassurant (je trouve !) de se rappeler qu'aucune connaissance dans la discipline de l'article n'est nécessaire. La méthode reste finalement la même quels que soient les mots del' article: aller chercher dans le texte de quoi parle le correcteur et voir si la proposition s'y trouve. Items A, B et C : la réponse se trouve dans la discussion de l'article. Le paragraphe est dense mais on en retient que ce ne sont pas les récepteurs eux-mêmes qui portent des mutations de sensibilité à l'alopécie mais un polymorphisme du gène TARDBP-TDP-43 qui pourrait réguler la sensibilité des récepteurs aux androgènes. Item D : les auteurs indiquent que les taux de dihydrotestostérone dans l'alopécie ne sont pas significativement différents. Item E : il n'est pas question d'accumulation de TDP dans les follicules. On voit ici que les questions de LCA peuvent être larges (TDP-43, dihydrotestostérone, etc.) mais c'est rassurant Ge trouve !) de se rappeler qu'aucune connaissance dans la discipline de l'article n'est nécessaire. La méthode reste finalement la même quels que soient les mots de l'article : aller chercher dans le texte de quoi parle le correcteur et voir si la proposition s'y trouve. Question 14

L.

n n

Le degré de confiance que l'on peut avoir dans les résultats de cette étude est: A. Limité par le faible nombre de cas de sclérose latérale amyotrophique B. Limité par les caractéristiques de la population de l'étude C. Limité par le fait que les facteurs d'ajustement ne modifient pas les résultats D. Renforcé par le caractère non-différentiel du biais de classement sur l'exposition E. Renforcé par la plausibilité biologique de l'association

c

"Il

Aucune dif,nition ne précise ce que signifie le « degré de confiance dans les résultats de cette étude 1>. On peut s'en sortir en se disant qu'on a confiance en un résultat « valide 1>, et donc que le correcteur nous demande de cocher les propositions en lien avec les validités de l'étude. Item A : même si l'association sort comme significative, 42 cas de SLA pour 560 000 PA est un nombre infime et il est probable que le résultat soit affecté par des fluctuations d'échantillonnage. Ce facteur limite la validité interne (variabilité statistique). Item B : une cohorte de sujets du même sexe, du même âge et de même profession comme celle-ci rend l'extrapolabilité des résultats faible. La validité externe est affectée.

>Ir

C

l

394

r

Ill I

qr

Cm rn

.i

C,

I

l

I

C>..l V

Il

r,

I

y

UV

n

CTl>

Z

I

'

c 1)

Pll

lE

C

U

t

L

Corrigé

Item C : Le fait que les facteurs d'ajustement ne modifient pas les résultats est plutôt rassurant car cela invite à penser que ceux-ci sont indépendants de facteurs de confusion. C'est une chose à bien avoir en tête de manière générale. Item D : nous l'avons vu, le biais de mémoire est ici non-différentiel : c'est un aspect rassurant de cette étude de cohorte. Il est plus grave, en général, qu'une étude soit associée à un biais de classement différentiel qu 'à un biais non-différentiel (pour les raison évoquées à la question précédente). Item E : même s'il n'est pas question de causalité (car il est assez intuitif que l'alopécie ne cause pas la SLA), ces deux pathologies sont liées par des explications physiopathologiques suspectées. Le fait d'avoir ces arguments est en faveur d'une bonne validité externe. Question 15 Les résultats de cette étude incitent à : A. Supplémenter en vitamine E les hommes atteints d'alopécie extensive précoce B. Réaliser un électroneuromyogramme tous les 2 ans chez les hommes atteints d'alopécie extensive précoce C. Mettre en place un essai randomisé évaluant l'efficacité et la sécurité du finastéride pour réduire le risque de sclérose latérale amyotrophique chez les hommes atteints d'alopécie précoce D. Proposer une consultation de conseil génétique aux hommes atteints d'alopécie précoce E. Planifier une étude épidémiologique, en population générale, visant à vérifier l'existence de l'association objectivée

Question typique: on ne répond que sur l'analyse principale. Item A : il n'y a aucun rapport entre l'étude et la vitamine E (il faudrait faire un essai contrôlé randomisé) (item A). Item B : l'étude ne teste pas de procédure de dépistage (il faudrait faire un essai contrôlé randomisé sur cette stratégie de dépistage) (item B). Item C : l'étude n'est pas faite pour conclure sur le finastéride, ni comme un facteur de risque ni comme un facteur protecteur. Sur le plan exploratoire, le fait qu 'il n'ait apparemment pas d'impact important sur le risque de SLA (résultat inchangé avec ou sans finastéride) ne nous invite pas à creuser dans cette direction (item C). Item D : il est trop tôt pour conclure à un lien génétique entre SLA et alopécie, et il faudrait un essai dédié pour adopter une procédure de dépistage génétique. On répond finalement E, par élimination et parce que les limites de l'étude rendent effectivement importante la confirmation des résultats en population générale.

395

Article du sujet 2

--Levosimendan for the Prevention of Acute Organ Dysfunction in Sepsis A.C. Gordon, G.D. Perkins, M. Singer, D.F. McAuley, R.M.L. Orme, S. Santhakumaran, A.J . Masan, M. Cross, F. AI-Beidh, J. Best-Lane, D. Brealey, C.L. Nutt, J.J. McNamee, H. Reschreiter, A. Breen, K.O. Liu, and D. Ashby

ABSTRACT Background: Levosimendan is a calcium-sensitizing drug with inotropic and other properties that may improve outcomes in patients with sepsis. Methods: We conducted a double-blind, randomized clinical trial to investigate whether levosimendan reduces the severity of organ dysfunction in adults with sepsis. Patients were randomly assigned to receive a blinded infusion oflevosimendan (at a dose of 0.05 to 0.2 µg per kilo gram of body weight per minute) for 24 hours or placebo in addition to standard care. The primary outcome was the mean daily Sequential Organ Failure Assessment (SOFA) score in the intensive care unit up to day 28 (scores for each of five systems range from O to 4, with higher scores indicating more severe dysfonction; maximum score, 20). Secondary outcomes included 28-day mortality, time to weaning from mechanical ventilation, and adverse events. Results: The trial recruited 516 patients; 259 were assigned to receive levosimendan and 257 to receive placebo. There was no significant difference in the mean (±SD) SOFA score between the levosimendan group and the placebo group (6.68±3.96 vs. 6.06±3.89; mean difference, 0.61; 95% confidence interval [CI), -0.07 to 1.29; P = 0.053). Mortality at 28 days was 34.5% in the levosimendan group and 30.9% in the placebo group (absolute difference, 3.6 percentage points; 95% CI, -4.5 to 11.7; P = 0.43). Among patients requiring ventilation at baseline, those in the levosimendan group were less likely than those in the placebo group to be successfolly weaned from mechanical ventilation over the period of 28 days (hazard ratio, 0.77; 95% CI, 0.60 to O. 97; P = 0.03). More patients in the levosimendan group than in the placebo group had supraventricular tachyarrhythmia (3.1 % vs. 0.4%; absolu te difference, 2.7 percentage points; 95% CI, 0.1 to 5.3; P = 0.04). Conclusions: The addition oflevosimendan to standard treatment in adults with sepsis was not associated with less severe organ dysfonction or lower mortality. Levosimendan was associated with a lower likelihood of successfol weaning from mechanical ventilation and a higher risk of supraventricular tachyarrhythmia. (Funded by the NIHR Efficacy and Mechanism Evaluation Programme and others; LeoPARDS Current Controlled Trials number, ISRCTN12776039.) 396

Én,oncé

Sepsis is defined as life-threatening organ dysfunction caused by a dysregulated hast response co infection 1 and is a leading cause of death worldwide. Septic shock .is the most :,evere form of the condition and results in circulatory and metabolic abnormalities.2 Persis1ting lhypotension despite adequate fluid -resuscitation is due to a combination of profound vasodilatation, vascular hyporeactivity to catecholamines, and myocardial depression. 3 Although catecholamines are the recommended firstline therapy for septïc shock, 4 high doses of .administered catecholamines and high levels of circulating catecholamines are associated with poor outcomes and severe sicle effocts, including rnyocardial injury and peripheral ischemia .5- 7 Levosimendan is a calcium-sensitizing drug with inotropic and vasodilator properties that is licensed in numerous countries (not including the United States) to treat decompensated heart failure. 8 ln contrast to catecholamines, levosimendan causes increased myocardial contraction with a minimal increase in oxygen demand, 9 and diastolic relaxation is not impaired. Small studies that have investigated the use of J.evosimendan in patients with septic shock have shown improvements in hemodyna- vana - 61 es, 10 m1croc1rcu 1atory fl ow, 11 an d mIC 12 10 rena! and hepatic function, as compared with dobutamine. Other important noninotropic effects have also been shown, including antiinflammatory, 13 antioxidative, 14 and antiapoptotic 15 effects and possibly protection from ischemia and reperfusion injury. 16 A recent metaanalysis supported the use of levosimendan in patients with sepsis, but only 125 patients in total had been treated. 17 The Levosimendan for the Prevention of Acute Organ Dysfunction in Sepsis (LeoPARDS) trial was designed to test whether the addition of levosimendan to standard care would reduce the severity

of organ dysfonction among patients with septic shock and to assess its safety profile in patients with this condition.

IM IETHODS Trial Design and Participants We conducted this multicenter, randomized, double-blind, placebo- controlled clinical trial in 34 general adule intensive care units (ICUs) in the United Kingdom. The trial protocol, available with the full text of this article at NEJM.org, was designed by the trial management committee and has been published previously. 18 The LondonHarrow Research and Ethics Committee approved the protocol. The trial was funded by the National [nstitute for Health Research and Tenax Therapeutics and sponsored by [rnperial College London. Data management and analysis were performed by the Imperia! Clinical Trials Unit. Orion Pharma provided levosimendan and placebo free of charge. The funders, the sponsor, and Orion Pharma had no role in designing the trial, gathering or analyzing the data, writing the rnanuscript, or making the decision to submit the manuscript for publication. The first author vouches for the data and analyses, as well as for the fidelity of this report to the trial protocol.

Enrollment Criteria and Randomization Adult patients who had septic shock and had received vasopressors for at least 4 hours were eligible for inclusion. Detailed inclusion and exclusion criteria are provided in the Supplementary Appendix, available at NEJM.org. Patients had to be recruited within 24 hours after meeting the inclusion criteria. Written informed consent

397

ECNi 2017 - Sujet 2

was obtained from either the patient or, in the event that the patient lacked capacity, a persona! or professional legal representative before enrollment in the trial. Retrospective written informed consent was sought from the patient once capacity was regained. Enrollment, randomization, and data collection were performed by means of an online system (lnForm, Oracle). Patients were assigned in a 1: 1 ratio to receive levosimendan or placebo, with the use of variable black sizes of four and six and computer-generated random numbers and with stratification according to recruitment center. The randomization sequence was prepared by an independent statistician. Trial-specific labeling and packaging, to ensure that trial packs were identical, was undertaken by Victoria Pharmaceuticals. Patients and clinical and research staff remained unaware of the trialgroup assignment throughout the trial.

per kilogram per minute, then the infusion rate was reduced to 0.1 µg per kilogram per minute. If necessary to avoid hypotension or severe tachycardia, the rate was reduced to 0.05 µg per kilogram per minute or even discontinued. Other aspects of clinical care were at the discretion of the local physician and were based on the Surviving Sepsis Campaign guidelines (see the Supplementary Appendix). 4 The trial protocol recommended a mean arterial pressure of 65 to 70 mm Hg. This pressure could be varied for individual patients, but investigators were encouraged to use the lowest dose of vasopressor that maintained tissue perfusion in each patient.Additional inotropic agents could be used as clinically indicated (i.e., for ongoing low cardiac output after fluid resuscitation). Dobutamine was the recommended inotrope, with lowering of the dose and discontinuatian once adequate oxygen dehvery had been achieved.

Clinical Treatment Patients were assigned to receive a blinded infusion of either levosimendan or placebo for 24 hours in addition to standard care. Fig. S1 in the Supplementary Appendix shows the infusion algorithm. No bolus loading dose was given. The administration of levosimendan or placebo was started at a rate of 0.1 µg per kilogram of body weight per minute and, in the absence of rate-limiting sicle effects, was increased after 2 to 4 hours to 0.2 µg per kilogram per minute for a further 20 to 22 hours. Patients received intravenous fluid boluses for any clinically significant drop in blood pressure and, if necessary, vasopressors were adjusted to maintain an adequate blood pressure. If the patient had ratelimiting sicle effects - either hypotension or severe tachycardia (heart rate >130 beats per minute, or an increase of >20% if the heart rate was already > 110 beats per minute) - at the dose of 0.2 µg 398

Outcome Measures The primary trial outcome was the mean daily Seguential Organ Failure Assessment (SOFA) score 19 while the patient was in the ICU, as measured from randomization to a maximum of 28 days . The daily SOFA score after baseline was calculated for each patient on the basis of five organ systems: cardiovascular, respiratory, renal, hepatic, and coagulation systems . (Scores for each system range from O to 4, with higher scores indicating more severe organ-system dysfonction; maximum score, 20.) The neurologie system was not included, as in some previous trials, 20 ·21 owing to the diiliculties of accurately scoring the Glasgow Coma Score daily in the presence of sedation . Daily scores were totaled for each patient's ICU stay and divided by the number of days that they remained in the ICU in order to calculate the mean SOFA score for that patient.

Énoncé

To assess the effect oflevosimendan on individual organ systems, the individual SOFA components were analyzed, and several other clinical outcomes were determined a priori for secondary analyses. These outcomes included the number of catecholamine-free and ventilator-free days, the time to weaning from mechanical ventilation, the proportion of patients with a major acute kidney event 22 over a period of 28 days (defined as death, new requirement for renalreplacement therapy, or sustained renal failure [stage 2 or 3 acute kidney injury 23 ] at day 28), and the duration of renal-replacement therapy. Mortality rates at 28 days , at ICU discharge, and at hospital discharge, as well as the length of stay in the ICU and serious adverse events, were also recorded.

Statistical Analysis We calculated that a sample of 500 patients would provide the trial with 90% power to detect a difference of 0 .5 points in the mean SOFA score, assuming a standard deviation of 1.5 and a significance level of0.05. 19 To allow for a 3% rate of withdrawal of consent, the recruitment target was 516 patients. The primary analysis was unadjusted in the intention-to-treat population, and reported the difference in mean SOFA scores between the two trial groups. Because the mean SOFA score was not normally distributed, 95% confidence intervals of the mean difference were calculated with the use of bootstrapping, with the application of the percentile method with 100,000 samples. We used a priori defined regression models to investigate whether the main analysis was sensitive to adjustment for trial-center (i .e., ICU) effects, age, and severity of illness (according to the Acute Physiology and Chronic Health Evaluation [APACHE] II score) with bootstrapped confidence intervals . Because levosimendan is an inotrope

with prolonged hemodynamic effects but is not included as part of the cardiovascular scoring within the SOFA score, the primary analysis was repeated with the exclusion of the cardiovascular component as a sensitivity analysis . We prespecified the use of Bayesian models of multiple imputation for missing data, as described in the Supplementary Appendix; we also performed post hoc analyses using imputation to account for any differential effect of treatment on the rates of ICU discharge or death before 28 days. Time-to-event data were described with the use of Kaplan-Meier plots and Cox regression, with adjustment for age and APACHE II score, allowing for clustering according to ICU. Four subgroup analyses were planned a priori on the basis of the baseline measurement of the cardiac index, if measured (lowest third vs. middle and highest thirds), the central venous oxygen saturation (low [85%]), the serum lactate level (~2 mmol per liter vs. >2 mmol per liter), and the dose of norepinephrine (below vs. above the median infusion rate). The heterogeneity of treatment effect according to subgroup was calculated with the use of a permutation test, which permuted bath the subgroup and the trial-group assignment.24 All the analyses were performed with the use of R software, version (R Project for Statistical Computing). 25 A P value of less than 0.05 was considered to indicate statistical significance, with the use of two-sided tests; no corrections were made for multiple testing.

RESULTS Trial Participants The trial ran from January 2014 through December 2015, when the required sample

399

ECNi 2017 - Sujet 2

of 516 patients were enrolled. Fig. 1 shows the randomization and f low of patients in the trial; 259 patients were assigned to receive levosimendan and 257 to receive placebo. A total of 8 patients (4 patients in each group) did not receive the assigned trial regimen. The family of 1 patient in the levosimendan group withdrew consent after randomization but before the drug was administered. This patient was excluded from all the analyses. The other 7 patients were included in the intention-to-treat analysis. The two groups were well balanced at baseline (Tables 1 and 2, and Tables S 1 and S2 in the Supplementary Appendix). The median time to recruitment was 16 hours after the initiation of vasopressors, and the median dose of norepinephrine was 0.28 µg per kilogram per minute at the time of starting the infusion.

Cardiovascular Effects The infusion was discontinued before the 24-hour time point owing to hemodynamic instability (hypotension or tachycardia) in 33 of 244 patients (13.5%) in the levosimendan group, as compared with 19 of248 patients (7.7%) in the placebo group. The mean arterial pressure was lower in the patients in the levosimendan group than in those in the placebo group in the first 24 hours (the duration of the infusion) but was similar thereafter in the two groups.The rate and duration of the norepinephrine infusion were higher in the levosimendan group than in the placebo group; there was also less frequent use of dobutamine in the levosimendan group. The heart rate over the first 4 days was significantly higher in patients in the levosimendan group than in those in the placebo group. lntravenous-fluid administration, fluid balance, and serum lactate levels were similar in the two groups. Details are provided in Table 400

S3 and Fig. S2 through S6 in the Supplementary Appendix.

Outcomes The percentage of daily SOFA scores that were missing ranged from 2.3% for the cardiovascular component to 12 .8% for the liver component. The primary outcome, the mean (±SD) SOFA score over the stay in the ICU, was 6.68±3.96 in the levosimendan group and 6.06±3.89 in the placebo group (mean difference, 0.61; 95% confidence interval [CI], -0.07 to 1.29; P = 0.053) (Table 3). After adjustment for ICU, age, and APACHE II score in a regression model, the mean difference in the score was 0.59 (95% CI, -0.02 to 1.20; P = 0.06). ln an analysis that considered each component of the total SOFA score independently, the mean daily cardiovascular score was higher in the levosimendan group than in the placebo group (mean difference, 0.25; 95% CI, 0.04 to 0.46; P = 0.01). The prespecified and post hoc sensitivity analyses did not materially change the result (Table 3, and Table S4 in the Supplementary Appendix). The total daily SOFA scores and individual component scores are shown in Fig. S7 through S 12 in the Supplementary Appendix. Secondary outcomes are shown in Table 3. Mortality at 28 days was 34.5% in the levosimendan group and 30.9% in the placebo group (mean difference, 3.6 percentage points; 95% CI, -4.5 to 11.7; P = 0.43).The Kaplan-Meier curves for survival to day 28 are shown in Figure 2. Among patients requiring mechanical ventilation at baseline, those in the levosimendan group were less likely than those in the placebo group to be successfully weaned from mechanical ventilation over the period of 28 days (hazard ratio, 0.77; 95% CI, 0.60 to 0.97; P = 0.03) (Fig. S13 in the Supplementary Appendix).

Énoncé

2382 Patients were assessed for el igibility

1 866 157 12 41 43 127 714 2 83 61 352 47 4 6 2 56 43 90 85 102

,.

Were excluded Were no! in septic shock Were < 18 yr of age Did not have on infection Did not meet SIRS criteria Did not meet vosopressor criteria Were outside 24-hr window since meeting inclusion criteria 82 Had end-stage renal failure Had a history of torsades de pointes Had severe hepatic impairment Had obstruction s allecting ventricular Flow Had a decision regarding treatment limitation Weighed > 135 kg Were pregnant Had received levosimendan within 30 days Had hypersensitivity to levosimendan Were enrolled in another trial Were not enrolled, per physician 's decision Did not give consent or have consent obtained Had problems with staff availability Had other reasons

516 Underwent randomization

i

i

259 Were assigned to receive levosimendan

257 Were assigned to receive placebo

i

i

255 Received levosimendan 4 Did not receive levosimendan 1 Withdrew consent 2 Died 1 Had a clinical decision to withhold drug owing to improvement in condition

253 Received placebo only 1 Received placebo and open-label levosimendan 3 Did not receive placebo 2 Died 1 Was enrolled during period in which trial was temporarily halted

i

i

258 Were included in primary analysis 1 Was excluded owing to withdrawal of consent

257 Were included in primary analysis

i

l

255 Were included in as-treated analysis

253 Were included in as-treated analysis

Figure 1. Recruitment and Randomization of the Patients. Patients could meet more thon one exclusion criterion . Other reasons for nonenrollment included unavailability of levosimendan or placebo, mental health problems, language barrier, and unspecified reasons (in 78 patients) . SIRS denotes the systemic inflammatory response syndrome .

401

ECNi 2017 - Sujet 2

Table 1. Baseline Characteristics.* Characteristic

Levosimendan (N

=258)

Placebo (N

Median age (IQR) - yr

67 (58-75)

69 (58-77)

Male sex - no. (%)

145 (56.2)

144 (56.0)

Median weight (IQR) -

kg

Median body-mass index (IQR)t

76 (65-90)

80 (68-91)

27 (23-30)

28 (24-32)

=257)

Race - no. (%)î Asian

11 (4.3)

10 (3 .9)

Black

4 (1.6)

6 (2.3)

White

240 (93 .0)

240 (93.4)

Other

3 (1.2)

1 (0.4)

94 (36 .4)

95 (37.0)

History of recent surgery -

no. (%)§

no. (%)

Preexisting condition lschemic heart disease

46 (17.8)

31 (12.1)

Congestive heart failure

1 (0.4)

4 (1.6)

Cardiac failure

23 (8 .9)

26 (10. 1)

Severe COPD

16 (6 .2)

11 (4.3)

Chronic renal failure

19 (7.4)

18 (7.0)

Cirrhosis

4 (1.6)

6 (2 .3)

lmmunocompromised condition

23 (8 .9) 59 (22 .9)

51 (19.8)

54 (20.9)

45(17.5)

16 (10-21)

15 (10-20)

Diabetes Beta-blockers normally taken -

no. (%)

Median lime from shock to randomization (IQR) -

hr~

24 (9.3)

Vasoactive-drug dose al randomization Norepinephrine

255

253

0.29 (0.16-0.52)

0.27 (O. 15-0.44)

No. of patients

21

Median dose (IQR) - f)g/kg/min

0.14 (0.07-0.28)

21 O. 13 (0.08-0.38)

No. of patients Median dose (IQR) -

f)g/kg/min

Epinephrine

Vasopressin No. of patients Median dose (IQR) - units/min

33 0.03 (0.02-0.04)

37 0.03 (0.02-0.04)

18

22

5.7 (3.5-8.8)

5.0 (4.4-6.2)

Dobutamine No. of patients Median dose (IQR) -

f)g/kg/min

* There were no significant between-group differences in the demographic choracteristics at baseline . The ra tes of missing values ore shown in Table S l in the Supplementory Appendix . COPD denotes chronic obstructive pulmonory disease, and IQR interquortile range . t The body-mass index is the weight in kilogram s divided by the square of the height in meters. Data were missing for six patients in the levosimendan group and for three in the placebo group. t Race was determined from medical records . § Recent surgery was defined as admission to the intensive care unit from the operating room . 1 The onset of shock was defined as the initiation of vasopressors .

402

Énoncé

Table 2. Acute lllness and Physiological Variables at Baseline. • Levosimendan (N = 258)

Variable

Placebo (N = 257)

Median APACHE Il score (IQR)t

25 (21-31)

25 (21-30)

Median SOFA score (IQR)t

10 (8-12)

10 (7-12)

Respiratory

99 /257 (38 .5)

101 /256 (39 .5)

Renal

77/258 (29.8)

74/256 (28 .9)

Organ failure - no./total no. (%) §

Hepatic

6/252 (2.4)

8/252 (3.2)

Coagulation

16/256 (6.2)

13/255 (5 . 1)

Neurologie

117/224 (52.2)

111/212 (52.4)

Lung

98/257 (38 .1)

103/257 (40.1)

Abdomen

95/257 (37.0)

96/257 (37.4)

Urinary tract

12/257 (4.7)

17/257 (6 .6)

Primary bacteremia

7 /257 (2.7)

3/257 (1 .2)

Neurologie site

4/257 (1 .6)

1/257 (0.4)

Soft tissue or catheter

16/257 (6.2)

10/257 (3.9)

Other

25/257 (9.7)

27 /257 (10.5)

Positive microbiologie culture - no./total no. (%) ~

109/258 (42 .2)

112/256 (43 .8)

Mechanical ventilation - no. (%)

207 (80.2)

210 (81.7)

Renal-replacement therapy - no. (%)

44 (17.1)

45 (17.5)

Moderate or severe ARDS - no. (%)

72 (27.9)

59 (23 .0)

Sinus rhythm

201 /258 (77.9)

218/255 (85 .5)

Atrial fibrillation

32/258 (12.4)

21 /255 (8 .2)

Paced

3/258 (1.2)

2/255 (0.8)

Other irregular rhythm

22/258 (8.5)

14/255 (5 .5)

74 (68-80)

73 (67-79)

97 (82-111)

94 (80-110)

11 (9-15)

12 (8-16)

Source or site of initial infection - no./total no. (%)

Heart rhythm - no./total no. (%)

Median values for physiological variables (IQR)t Mean arterial pressure -

mm Hg

Heart rate - beats/min Central venous pressure - mm Hg 2

2.7 (2 .2-3.7)

3.3 (2.2-4.0)

55.7 (40.0-73 .5)

67.0 (49.4-79.7)

Arterial oxygen saturation - %

97 (95-98)

97 (95-98)

Central venous oxygen saturation - %

75 (69-81)

76 (70-81)

Lactate - mmol/liter

2.2 (1.4-3.5)

2.3 (1 .5-3 .9)

Pao 2 :Fio 2

216 (151-294)

215 (152-296)

Cardiac index - liters/min/m Stroke volume -

-

ml

mm Hg

403

ECNi 2017 - Sujet 2

Table 2. Continued Variable Creatinine Bilirubin -

Levosimendan (N

mg/dl mg/dl

Hemoglobin -

g/liter

Platelet count per mm

3

Glasgow Coma Scale score

=258)

Placebo (N

=257)

1.6 (1.0-2 .4)

1.5 (1.1-2.4)

0.8 (0.5-1.5)

0.9 (0.5-1.6)

108 (94-123)

108 (93- 125)

212,000 (134,000299,000)

216,000 (144,000308,000)

9 (3-15)

8 (3-15)

* There were no significont between-group differences in the charocteristics al baseline, except for stroke volume [P

= 0 .02) . ARDS

denotes the acute respiratory distress syndrome, Fio 2 fraction of inspired oxygen , and Pao 2 partial fressure of arterial oxygen . Scores on the Acute Physiology and Chronic Health Evaluation [APACHE) Il range from O to 72, with higher scores indicating more severe illness and a higher risk of death . Scores on the Sequential Organ Failure Assessment (SOFA) were calculated on the basis of si x organ systems al base- line. Scores range from O to 24, with higher scores indicating more severe illness. § Renal failure was defined as having an acute kidney injury of stage 3 (urinary-output criteria omitted because data were unavailable) 2 3; other organ failures were defined as a SOFA score of 3 or higher. Cardiovascular failure is no! listed here because il was an inclusion criterion . 1 The types of organisms that were identified are shown in Table S2 in the Supplementary Appendi x . f The cardiac index and stroke volume were measured in 84 patients in the levosimendan group and in 73 in the placebo group. The numbers of missing values for other physiological variables listed here are shown in Table S l in the Supplementary Appendix. To convert the values for creatinine to micromoles per liter, multiply by 88 .4 . To convert the values for bilirubin to micromoles per liter, multiply by 17. l. Scores on the Glasgow Coma Scale range from 3 to 15, with lower scores indicating a greater depression of consciousness .

*

Outcome Primary outcome Mean daily total SOFA score

6.68±3.96

6.06±3 .89

0.61 (-0.07 to 1.29)

0.053

Respiratory

1.70± 1.18

1.56± 1.15

0.14 (-0.06 to 0.34)

0.23

Coagulation

0.75± 1.05

0.75± 1.02

0.00 (-0.18 to 0.17)

0.55

Hepatic

0.51±0.84

0.45±0.77

0.06 (-0.08 to 0.19)

0.65

Cardiovascular

2.27± 1.20

2.02± 1.20

0.25 (0.04 to 0.46)

0.01

Renal

1.46± 1.49

1.28± 1.38

0.18 (-0.07 to 0.42)

0.32

Mean daily SOFA score excluding cardiovascular score

4.41 ±3 .13

4.05±3.07

0 .36 (-0.17 to 0.90)

0.12

Mean daily total SOFA score in the sensitivity analysist

7.19±3.72

6.78±3.74

0.41 (-0.24 to 1.06)

89 /258 (34.5)

79/256 (30.9)

3 .6 (-4.5 to 11 .7)

At ICU discharge

83/258 (32 .2)

76/257 (29.6)

2.6 (-5.4 to 10.6)

0.59

At hospital discharge

97 /258 (37.6)

84/256 (32.8)

4.8 (-3 .5 to 13.0)

0.30

Median no. of catecholamine-free days (IQR)

22 (0 to 26)

23 (0 to 26)

- 1.0 (-4.5 to 1.0)

0.09

Secondary outcomes Death -

no ./total no . (%)§

At 28 days

404

0.43

Énoncé

Table 3. Continued Oukome

Levosimendan (N = 258)

Placebo IN= 2sn

Absolute Difference

(9S%cl)•

p Value

Median no. of ventilation-free days (IQR)

16 (0 to 25)

19 (0 to 25)

-3 .0 (-9.5 to 1.0)

0.14

Major acute kidney event over period of 28 days - no./total no. (%)

148/258 (57.4)

139/256 (54.3)

3.1 (-5.5 to 11 .6)

0.54

Need for new renal-replacement therapy

62/257 (24. 1)

62/257 (24. 1)

0 .0 (-7.4 to 7.4)

>0.99

Sustained renal failure at daJ 28 or ICU discharge if before 28 ays

118/258 (45.7)

108/257 (42 .0)

3.7 (-4.9 to 12 .3)

0 .45

Median duration of renal-replacement therapy (IQR) - days

3 .0 (1 .0 to 8.0)

5.0 (2 .0 to 9 .0)

-2.0 (-3.0 to 0.0)

0.24

Median length of ICU stay (IQR) - days Ali patients

7.3(3.2to 14.8)

8.3 (3 .9 to 13.5)

-1 .0 (-2 .6 to 0 .8)

0.66

Survivors

9. 1 (5.0to 16.1)

9.0(4.9to 14.1)

0 .2 (-2.0 to 2.7)

0.31

Nonsurvivors

3.2 (1.4 to 8.9)

5.7 (2.2 to 11.7)

-2 .6 (-5.7 to -0.8)

0.09

Median length of hospital stay (IQR) - days Ali patients

19.6 (10.1 to 40.4)

22.7 (11.7 to 42.3)

-3 . 1 (-7.0 to 2.2)

0 .24

Survivors

30.1 (16 .8 to 48)

27.7 (18 to 52.3)

2.5 (-5 .9 to 8.2)

0 .81

Nonsurvivors

8.2 (3 .4 to 18.6)

11.3 (5.1 to 25.7)

-3 . 1 (-6.5 to 0.7)

0.25

Safety outcomes Any serious adverse event - no. (%)

32 (12.4)

23 (8.9)

3.5 (-2.3 to 9.2)

0.26

Any life-threatening arrhythmia no. (%)

15 (5.8)

6 (2.3)

3.5 (-0.3 to 7.3)

0 .08

Supraventricular tachyarrhythmia

8 (3.1)

1 (0.4)

2.7 (0.1 to 5 .3)

0 .04

Bradycardie

0

2 (0.8)

-0 .8 (-2 .2 to 0.7)

0 .48

Ventricular fibrillation or tachycardie

7 (2.7)

3 (1 .2)

1.5 (- 1.2 to 4.3)

0 .34

Myocardial infarction or acute coronary syndrome - no. (%)

3 (1.2)

1 (0.4)

0.8 (-1 . 1 to 2.7)

0.62

Other - no. (%)~

18 (7.0)

17 (6.6)

0 .4 (-4.3 to 5.1)

>0.99

* Plus-minus values are means ±SD. Absolute differences between percent values are percentage points . Confidence intervals were calculated with the use of bootstrap methods for all continuous variables . P values for continuous outcomes were calculated with the use of a Mann- Whitney test and for binary outcomes with the use of a chi-square test. ICU denotes intensive care unit. t Values may be d ifferent than expected owing to rounding . t A prespecified sensitivity analysis that implemented Bayesian models was performed w ith the use of Markov chain Monte Carlo methods (see the Supplementary Appendix). The absolute difference in this analysis is presented with 95 % credible intervals, and P values are not applicable to this type of analysis. § One patient in the placebo group declined follow-up after discharge from the ICU but before day 28 and hospital discharge. 1 Other events were defined as any serious adverse event that was nota life-threatening arrhythm ia and nota myocard ial infarction or acute coronary syndrome.

405

IECNi ,2017 - Sujet 2

DISCUSSION

100

*f -0

Placebo

75

-~

::,