
Der Teufel steckt in den Daten
Überprüfung des maschinellen Lernens von Millionen von Patientenbesuchen deckt viele unentdeckte Fälle von Selbstverletzung auf
Wenn es darum geht, Big Data zu verstehen, ist es manchmal schwer, den Wald vor lauter Bäumen zu sehen.
Christophe Lambert, PhD, und seine Kollegen vom Center for Global Health der UNM haben jedoch kürzlich eine Methode des maschinellen Lernens verwendet, um ein beunruhigendes Muster zu erkennen, das in Millionen von Abrechnungsunterlagen von Krankenversicherungen verborgen ist.
In einem im letzten Monat in der Zeitschrift der American Medical Informatics Association, berichtete das Team, dass die Fälle von Selbstverletzung bei Menschen mit schweren psychischen Erkrankungen, die medizinische Hilfe suchen, tatsächlich bis zu 19-mal höher sein könnten als in den Abrechnungsunterlagen angegeben.
Das Ergebnis legt nahe, dass Ärzte und andere Leistungserbringer häufig standardisierte Abrechnungscodes für die von ihnen erbrachten Leistungen vergeben, die die Möglichkeit verschleiern, dass die Verletzung eines Patienten tatsächlich auf Selbstverletzung und nicht auf einen Unfall zurückzuführen ist.
Das Ergebnis deutet darauf hin, dass dies einen Einfluss auf die Patientenversorgung haben könnte.
"Künftige Studien von uns legen nahe, dass eine Person einem mehr als dreifachen Risiko ausgesetzt ist, sich selbst zu verletzen, wenn sie dies schon einmal getan hat", sagt Lambert, außerordentlicher Professor an der Klinik für Innere Medizin. Um weitere Selbstverletzungen oder Selbstmorde zu verhindern: "Wenn Sie es nicht codieren, bedeutet dies, dass die zukünftige Behandlung des Patienten möglicherweise beeinträchtigt wird, wenn diese wichtigen Informationen nicht in seiner Vorgeschichte vorliegen", sagt er.
Lambert und sein Team begannen ihre Studie mit einer anonymisierten Datenbank, die die medizinischen Abrechnungsunterlagen von mehr als 130 Millionen Amerikanern von 2003 bis 2016 enthielt. Sie beschränkten ihre Forschung auf eine Untergruppe von etwa 10 Millionen Patienten mit Diagnosen schwerer psychischer Erkrankungen, einschließlich schwerer Depressionen , bipolare Störung, Schizophrenie und schizoaffektive Störung – Personen, bei denen bereits ein erhöhtes Risiko für Selbstverletzungen besteht.
Maschinelles Lernen, bei dem ein Computer einen Algorithmus anwendet, um einen großen Datensatz schnell zu analysieren, kann Muster erkennen, die für den Menschen nicht ohne weiteres erkennbar sind. In diesem Fall versorgten die Forscher den Computer mit 185,000 Variablen, die bei den stationären und Notaufnahmebesuchen jedes Patienten angewendet werden konnten.
"Wir haben tatsächlich die Spüle in die Küche geworfen", sagt Lambert. „Im Grunde war alles, was bei diesen Besuchen passiert ist – einschließlich aller Verfahrens- und Diagnosecodes.“ Zu den Ergebnissen, die sich ergaben, gehörte, dass Fälle von wahrscheinlicher Selbstverletzung drastisch zu wenig gemeldet wurden.
Es gab auch unerwartete Diskrepanzen zwischen Fällen, die als Selbstverletzung bewertet wurden, und solchen, die dies nicht waren.
Personen, die wegen Intoxikation und Vergiftung, Unfällen, Erstickung, Brust- und Kopfchirurgie, Handgelenkswunde, selbstverletzenden Gedanken, Depressionen und Psychotherapie behandelt wurden, wurden häufiger auf Selbstverletzung kodiert als Personen mit einer Drogenstörung oder einer Heroinvergiftung , neurologische Störungen, Verkehrsunfälle oder Stürze.
Das deutet darauf hin, dass ein Teil der Diskrepanz darauf zurückzuführen sein könnte, was Motivationsanbieter einem bestimmten Verhalten zuschreiben, sagt Lambert.
„Wir sehen im Durchschnitt, wenn sich jemand durch eine Opioid-Überdosis oder Drogen mit angenehmer Wirkung verletzt hat – sie werden es weniger wahrscheinlich als Selbstverletzung kodieren“, sagt Lambert. Aber eine Einschätzung der Selbstverletzung ist wahrscheinlicher, wenn jemand Aspirin oder Schlaftabletten überdosiert hat, vermutlich mit selbstverletzender Absicht.
"Männer haben auch häufiger Selbstverletzungen als Frauen", fügte Lambert hinzu, "und Stereotypen, dass Männer weniger wahrscheinlich preisgeben oder Hilfe in Anspruch nehmen als Frauen, wurden durch die Daten widerlegt - es scheint wahrscheinlich eine Voreingenommenheit zu sein." bei der Anbietercodierung basierend auf dem Geschlecht ihrer Patienten."
Als unterkodierte Selbstverletzung aufgedeckt wurde, ergaben sich detaillierte Schätzungen des Risikos in Abhängigkeit von Alter, Diagnose einer psychischen Erkrankung, Geschlecht und US-Bundesstaat. Das höchste Risiko für Selbstverletzung liegt bei Frauen im Alter von 15 Jahren und bei Männern bei 17 Jahren und nimmt ab Mitte der 20er Jahre ab.
Die Selbstverletzungsraten sind seit 2006 landesweit stetig gestiegen, und Menschen mit mehr als einer schwerwiegenden psychischen Erkrankung haben im Alter zwischen 18 und 25 Jahren, wo das Risiko am höchsten ist, eine Wahrscheinlichkeit von 15-26 % pro Jahr, sich selbst zu verletzen.
Die Studie war Teil einer umfangreicheren Forschung, die Lambert mit einem Preis des Patient-Centered Outcomes Research Institute in Höhe von 2.4 Millionen US-Dollar durchführte, um die Wirksamkeit verschiedener Behandlungen für bipolare Störungen zu vergleichen, insbesondere in Bezug auf Fälle von Selbstverletzung, Krankenhausaufenthalt und die Gefahr von Nebenwirkungen.
Während sich die Studie darauf konzentrierte, wie die Patientenversorgung klassifiziert wird, glaubt Lambert, dass die Methode möglicherweise in einem prädiktiven Rahmen verwendet werden könnte.
"Man könnte maschinelles Lernen auf andere Weise verwenden, basierend auf Ihrer Vorgeschichte, einschließlich Fällen von früherer unterstellter Selbstverletzung", sagt er. "Sind Sie aus diesem Grund und/oder anderen Faktoren, bei denen eine proaktive Behandlung helfen könnte, in einer Hochrisikokategorie?"
Lambert ist auch optimistisch, dass eine groß angelegte Datenanalyse nützliche Erkenntnisse für die medizinische Entscheidungsfindung liefern kann.
"Können wir aus diesen Datensätzen etwas lernen?" er fragt. „Codierung ist unvollkommen, Menschen sind unvollkommen, aber wenn wir sehr große Datensätze haben, kann sich ein Großteil dieses Rauschens ausgleichen und wir können aussagekräftige Antworten und Beweise erhalten.“