A MIMIC-III (Medical Information Mart for Intensive Care III) egy nagyméretű, ingyenesen elérhető adatbázis, amely a Beth Israel Deaconness Medical Center kritikus osztályain 2001 között több mint negyvenezer betegre vonatkozó, azonosítatlan egészségügyi adatokat tartalmaz. és 2012. Ez az adatbázis olyan információkat tartalmaz, mint a demográfiai adatok, az ágy mellett végzett életjel-mérések, a laboratóriumi vizsgálati eredmények, az eljárások, a gyógyszerek, a gondozói feljegyzések, a képalkotó jelentések és a mortalitás (kórházban és azon kívül egyaránt). További információk a MIMIC-III adatbázisról, valamint az adatbázis elérésével kapcsolatos információk a Physionet honlapján (https://mimic.physionet.org/) találhatók.

Az adatbázisban található 25 táblázatból, beleértve a BEJELENTKEZÉSEKET, KIÍRÁSOKAT, GONDOZÁSOKAT, FELÍRÁSOKAT, SZOLGÁLTATÁSOKAT és ÁTRUHÁZÁSOKAT, a felhasználók sok információt gyűjthetnek minden egyes páciensről, és ezeket az információkat számtalan gépi tanulási/mély tanulási teszthez és előrejelzéshez használhatják fel. Arra fogok összpontosítani, hogyan használhatom fel ezeket az információkat a betegek mortalitási arányának és a betegek újrafelvételi előrejelzéseinek javítására.

A projekt első néhány hetében arra összpontosítottam, hogy összegyűjtsem az adatkészletet, megértsem, mit jelent, és olyan eszközökkel, mint a pgAdmin4, a Tableau és a Jupyter Notebook, megjelenítsem. Emellett megismertem és kiszámítottam az egyes betegek súlyossági pontszámait, amelyekről a cikk későbbi részében fogok beszélni.

Ha engedélyezve van a hozzáférés a MIMIC-III adatbázishoz, azt javasoljuk, hogy ezeket az információkat egy RDMS-be (relációs adatbázis-kezelő rendszer) vigye át, és a Physionetnek van oktatóanyaga arról, hogyan viheti át az adatbázist a PostgreSQL RDMS helyi példányába, amelyet követtem. . Miután csatlakoztam a PostgreSQL adatbázishoz, egyszerűen tudtam SQL-lekérdezéseket készíteni, és összekapcsolhattam adatbázisomat számos hasznos eszközzel, mint például a pgAdmin4, amely grafikus felhasználói felületet (GUI) biztosít az adatbázishoz.

Ezen a grafikus felhasználói felületen keresztül tudtam megfelelően megjeleníteni a táblákat, és jobban megértettem az adatokat és azok kapcsolatait.

Ezután elkezdtem tanulni az intenzív osztály súlyossági pontszámairól, és arról, hogy ezek hogyan kapcsolódnak a betegek halálozási arányához. Az intenzív osztályos pontozási rendszereket csaknem 30 évvel ezelőtt vezették be azzal a céllal, hogy az intenzív osztály felvételekor rendelkezésre álló fiziológiai adatokat felhasználják az egyes betegek kimenetelének előrejelzésére. Bár ezek az előrejelzések kevéssé használhatók az egyes betegek kezelésében, mechanizmust biztosítanak az intenzív osztály teljesítményének értékelésére azáltal, hogy összehasonlítják az adott populációban elért tényleges eredményeket az előrejelzési algoritmusok kidolgozásához használt referenciapopulációban megfigyelt eredményekkel. A legnépszerűbb súlyossági tesztek közé tartozik az OASIS, a SAPS, a SOFA és a SAPSII. A GitHub adattár: https://github.com/MIT-LCP/mimic-code/tree/master/concepts/severityscores olyan SQL-szkriptekből áll, amelyek a MIMIC adatkészlettel együtt használhatók ezeknek a súlyossági pontszámoknak az alapján a az adatbázisban megadott információkat. Az alábbiakban bemutatjuk az egyes teszteket, valamint a teszteredmények grafikonját, valamint azt, hogy körülbelül 60 000 beteg közül hány beteg érte el a teszt egyes pontszámait. Ezeket a grafikonokat a Tableau-n keresztül hozták létre, miután összekapcsoltam a Tableau-kiszolgálómat a PostgreSQL-adatbázisommal.

KANAPÉ

A szepszishez kapcsolódó szervi elégtelenség értékelési pontszámát először az ESICM konszenzusos ülésén dolgozták ki 1994 októberében, bár végül szekvenciális szervi elégtelenség értékelés (SOFA) pontszámként vált ismertté, mivel szeptikus populációkon kívül alkalmazták (Vincent, 1996). . A pontszám célja az volt, hogy a klinikai közösség objektív mérést adjon a beteg szervi diszfunkciójának súlyosságáról. Hangsúlyozzuk, hogy a pontszám nem a mortalitás közvetlen előrejelzője, hanem inkább a morbiditás mértéke vagy a beteg állapotának mértéke. A pontszámot 6 szervrendszerre értékelik: tüdő-, vese-, máj-, szív- és érrendszeri, hematológiai és neurológiai. Minden rendszer eredménye 0 és 4 közötti pontszámot kap, ami azt eredményezi, hogy a pontszámok 0 és 24 között vannak, ahol a 0 a legkevésbé súlyos állapot, a 24 pedig a legsúlyosabb állapot, és az átlag ›90%-os halálozási valószínűséggel.

SAPS

A Simplified Acute Physiology Score (SAPS) célja az Acute Physiology Score (APS) egyszerűsítése volt, az eredeti 34 évről 13 év feletti életkorra csökkentve a szükséges fiziológiai paraméterek számát (LeGall, 1984). A kiválasztott változók a betegek 90%-ánál jelen voltak az APS kialakulásához használt kezdeti felmérésben (Knaus, 1981). Minél magasabb a SAPS pontszám, annál súlyosabb a beteg állapota.

SAPS II

Az 1993-ban közzétett egyszerűsített akut fiziológiai pontszám II (SAPS II) (Le Gall, 1993) két problémát kívánt orvosolni a SAPS-sel. Először is, a SAPS-ben a változó kiválasztási folyamatot klinikai megítélés alapján végezték, míg a SAPS II egyváltozós jellemzők kiválasztását használta a kórházi mortalitással nem összefüggő jellemzők kiszűrésére. Másodszor, nem volt modell a SAPS-ből származó mortalitás valószínűségének kiszámítására. A SAPS II 0-tól 163-ig terjed, ahol a 0 a mortalitás 0%-át, a 163-as pedig a mortalitás 100%-át jelenti.

OASIS

Az Oxford Acute Severity of Illness Score (OASIS) egy hibrid genetikai algoritmus és részecskeraj-optimalizálási megközelítés felhasználásával kifejlesztett szerény súlyossági pontszám, amely lehetővé tette a súlyossági pontszám közvetlen optimalizálását klinikailag releváns formában, egyidejű többváltozós jellemző kiválasztásával (Johnson, 2013). Az OASIS-t úgy tervezték, hogy rendkívül alacsony adatgyűjtési és minőség-ellenőrzési terhet jelentsen, mindössze 10 funkciót igényel, és nem igényel laboratóriumi méréseket, diagnózist vagy társbetegségekkel kapcsolatos információkat.

Az eredmények megvizsgálása után a PostgreSQL-emet egy helyi Jupyter Notebookhoz csatlakoztattam, ahol látható SQL-lekérdezéseket tudtam végrehajtani. Ezeket a lekérdezéseket arra használtam, hogy meghatározzam a jövőbeli tesztjeimhez használni kívánt csoportot. Ebbe a csoportba tartoznak a felnőttek (azok a betegek, akiknek életkora › 15 év volt az intenzív osztályra való felvételkor), és az első felvételre kerülő betegek csak a visszafogadással való összetéveszthetőség elkerülése végett. A kohorszválasztás megkönnyítése érdekében néhány mintalekérdezést használtam a Physioneten: https://mimic.physionet.org/tutorials/intro-to-mimic-iii/.

Először is kitaláljuk a páciens születési dátumát és az intenzív osztályra való felvétel dátumát:

Ezután kitaláljuk a páciens első felvételi időpontját, hogy ne legyen több nyilvántartásunk ugyanarról a betegről, és hogy betegenként csak egy életkorunk legyen:

Ezután meghatározzuk a páciens életkorát a születési dátum és az első felvétel időpontja közötti különbség alapján. Ezeket a korcsoportokat három kategóriába soroljuk: újszülöttek (‹ 15 éves korig), felnőttek (15-89 éves korosztály) és ›89 évesek:

Végül ezt az információt felhasználhatjuk arra, hogy kategorizáljuk azokat a betegeket, akiket szeretnénk a csoportunkba további vizsgálatokhoz:

Utolsó kohorsz csoportosítások, a férfi és női felnőtteket fogom használni:

A Tableau munkafüzet és a Jupyter Notebook, valamint a projekthez használt további anyagok megtalálhatók a projekt GitHub-tárházában: https://github.com/PallabPaul/mimic-mortality-predictions.

Most, hogy sikerült megfelelően megvizsgálnom az adatbázist az összes beteg súlyossági pontszámának meghatározásával és egy kohorsz kiválasztásával a további vizsgálatokhoz, a következő lépésem az lesz, hogy összefüggést vonjak le e súlyossági tesztek és a halálozási arány előrejelzése között. Szintén emulálni fogom a Super Learner algoritmusokkal készült mélytanulási teszteket, amelyeket a „Journal of Biomedical Informatics” című folyóiratban közzétett kutatási tanulmány tárgyal, amely itt található: „https://arxiv.org/pdf/1710.08531.pdf”.