Originalia | Original Articles
Intensivmedizin | Intensive Care Medicine
A. Luckscheiter · W. Zink · M. Thiel · T. Viergutz

Evaluation von Entscheidungsbaummodellen des maschinellen Lernens für das akute Leberversagen nach Reanimation

Schlüsselwörter Maschinelles Lernen – Entscheidungsbäume – Kardiopulmonale Wiederbelebung – Leberversagen, akut – Entscheidungsfindung – Intensivmedizin
Keywords Maschine Learning – Decision Trees – Cardiopulmonary Resuscitation – Liver Failure, Acute – Decision-making – Critical Care
Zusammenfassung

Hintergrund

Maschinelles Lernen kann mithilfe digitaler Gesundheitsdaten Prognosemodelle für die frühzeitige Entstehung von Organinsuffizienzen erstellen. Ziel der Studie ist es, Entscheidungsbaummodelle für die Vorhersage des akuten Leberversagens (ALF) nach Reanimation zu evaluieren, da ein solches mit erhöhter Letalität und einer schlechteren Gesamtprognose assoziiert ist. 

Patienten und Methodik

Mittels Sekundäranalyse von 347 Patienten einer belgischen Kohorte der Jahre 2007 – 2015, deren anonymisierter Datensatz unter der Creative Common Attribution Licence veröffentlicht wurde, wurden ein Random Forest (RF)- sowie ein J48-Entscheidungsbaummodell erstellt und letzteres zusätzlich mittels AdaBoost verstärkt. Die Evaluation erfolgte mittels Sensitivität, Spezifität, positivem und negativem prädiktivem Wert (PPV / NPV) sowie der Fläche unter der Receiver-Operator-Kurve (AUC-ROC). 

Ergebnisse

184 (53 %) Patienten wiesen ein ALF auf. Der J48-Baum teilte sich hauptsächlich an den Aufnahmewerten von International Normalized Ratio (INR, Grenzwert 1,48) und Gesamtbilirubin (Grenzwert 0,99 mg/dl) auf. Weitere wichtige Knoten waren die chronische Nieren- und Herzinsuffizienz, Adrenalinmenge während der Reanimation und Betalaktamgabe (Sensitivität 0,8, PPV 0,73, Spezifität 0,72, NPV 0,79, AUC-ROC 0,87). AdaBoost verringerte die Sensitivität auf 0,79 bei Steigerung der PPV auf 0,75 und der Spezifität auf 0,74 (NPV 0,77, AUC-ROC 0,85). RF erzielte eine Sensitivität von 0,86 (PPV 0,74) bei einer Spezifität von 0,74 (NPV 0,84) und hatte verglichen zu den anderen Modellen eine signifikant höhere AUC-ROC (0,88).

Schlussfolgerung

Maschinelles Lernen mittels Entscheidungsbaummodellen scheint für die Vorhersage eines ALF nach Reanimation geeignet. Auf Basis der verwendeten Attribute und errechneten Modelle könnten weiterführende Studien an größeren Kohorten zur Weiterentwicklung von Prognosemodellen führen und so in der frühzeitigen Diagnostik und Entscheidungsfindung unterstützen. Klinisch gesehen könnten nach einer prolongierten Reanimation initial erhöhte INR- und Bilirubinwerte, Herz- und Niereninsuffizienz das Risiko für die Entwicklung eines akuten Leberversagens erhöhen.

Summary

Background

Patients after cardiac arrest developing acute liver failure (ALF) show higher fatality rates and worse outcomes. As machine learning is able to support physicians in their decision-making with the help of big data in health records, the aim of this study is to evaluate decision-tree models for the prediction of ALF after resuscitation.

Patients and methods

The study is a secondary analysis of 347 Belgian patients after successful resuscitation from 2007 to 2015, whose anonymised dataset was published under the Creative Common Attribution Licence. For machine learning, a J48 decision-tree model as well as its AdaBoost variation and a random forest model were created. Evaluation was performed by sensitivity, specificity, positive / nega-
tive predictive value (PPV / NPV) and by the area under the receiver operator curve (AUC-ROC).

Results

184 patients (53 %) developed ALF after resuscitation. The main split points in J48 were the attributes international normalised ratio ad admission (INR, threshold 1.48) and total bilirubin ad admission (threshold 0.99 mg/dl). Further splitting was performed in chronic renal and heart failure, administered amount of epinephrine during resuscitation, and the use of beta-lactam antibiotics. J48 yielded a sensitivity of 0.8 and a specificity of 0.72 (0.73 PPV / 0.79 NPV, AUC-ROC 0.83). AdaBoost yielded a comparable sensitivity (0.79) and a higher PPV (0.75) and specificity (0.74, NPV 0.77, AUC-ROC 0.85). Random forest reached a sensitivity of 0.86 (PPV 0.74) and a specificity of 0.74 (NPV 0.84, AUC-ROC 0.87). The random forest achieved a significantly higher test quality in AUC-ROC than the other models.

Conclusion

Machine learning with decision-tree models seems to be suitable for the prediction of ALF after resuscitation. The clinical risk of developing ALF could be increased in conditions with elevated INR and total bilirubin, chronic renal and heart failure as well as prolonged resuscitation. Based on the applied attributes and developed models, further studies in large cohorts could lead to an advancement of the prediction models and therefore support physicians in diagnosis and decision-making.

Deutsch