En ny algoritme kan forudsige type 2-diabetes længe før sygdommen normalt bliver opdaget ved at analysere patienters sundhedsdata – i nogle tilfælde allerede inden 40-årsalderen. Hvis værktøjet tages i brug, kan læger bruge allerede indsamlede sundhedsdata til at opdage sygdomsrisiko flere år tidligere – et eksempel på en voksende forskningsretning, hvor kunstig intelligens finder tidlige signaler i patientjournaler.
Kunstig intelligens forventes at få en central rolle i fremtidens sundhedsvæsen. Ved at analysere store mængder sundhedsdata kan den finde tidlige signaler i patientjournaler, som peger frem mod sygdom længe før læger normalt stiller diagnosen.
Tidligere studier har vist, at diagnosekoder fra hospitalernes journaler kan bruges til at forudsige risikoen for blandt andet visse former for kræft og hjertekarsygdom – nogle gange flere år før sygdommen opdages i klinikken. Den nye forskning bygger videre på denne idé, men udvider analysen til også at omfatte patienternes kontakter i almen praksis.
Den nye algoritme bruger data fra praktiserende læger og speciallæger til at pege på patienter, som bør undersøges for tidlig type 2-diabetes – længe før sygdommen normalt bliver opdaget.
“Når vi nu for eksempel tager fat i receptdata fra de praktiserende læger og speciallæger, åbner det op for muligheden for, at vi kan finde risiko for sygdom endnu tidligere, end når vi kun kigger på data fra hospitalsjournalerne. Vi inkluderer også en masse data, der ikke nødvendigvis består af diagnosekoder, men som fortæller noget om, hvordan patienterne bruger sundhedssystemet,” fortæller en af forskerne bag studiet, professor Søren Brunak fra Institut for Folkesundhedsvidenskab ved Københavns Universitet.
Forskningen er offentliggjort i The Lancet Digital Health.
Algoritme på baggrund af 20 års data
Studiet kombinerer data fra danske praktiserende læger, speciallæger og hospitaler for at træne en maskinlæringsmodel til at kunne forudsige type 2-diabetes hos personer under 40 år – en sygdom der ellers ofte først opdages langt senere. Modellen blev trænet på historiske sundhedsdata og derefter testet på separate datasæt for at undersøge, om den kunne genkende de samme mønstre hos nye patienter.
Datasættet dækker hele den danske befolkning fra 2004 og frem og indeholder koder for omkring 9.000 forskellige ydelser fra praktiserende læger og speciallæger. Disse registreringer blev brugt som et langt tidsforløb af kontakter med sundhedsvæsenet, som algoritmen kunne analysere for mønstre.
Det kan være alt fra udskrivning af recepter og blodprøver til e-mailkonsultationer og hesteridningsterapi.
Algoritmen fungerer ved at analysere lange tidsserier af patienternes kontakter med sundhedsvæsenet og identificere statistiske mønstre, der går igen hos personer, som senere får stillet en diagnose med type 2-diabetes i en ung alder.
“Formålet er at kunne identificere yngre personer med type 2-diabetes tidligere. Det er klart, at sidder lægen over for en person på 32 år, tænker lægen ikke automatisk type 2-diabetes, da det er en sygdom, som oftest rammer ældre personer,” forklarer Søren Brunak.
Finder personer med tidlig type 2-diabetes
Studiet viser, at algoritmen kan identificere en lille gruppe personer med markant højere risiko end resten af befolkningen for senere at få stillet diagnosen type 2-diabetes.
I studiet havde den 0,1 procent af befolkningen, som modellen vurderede til at have højest risiko, over 100 gange højere sandsynlighed for at udvikle sygdommen end gennemsnittet. Det betyder, at modellen kan genkende tidlige signaler i patienternes sundhedsdata længe før diagnosen normalt stilles i klinikken.
Algoritmen kan også kalibreres, så den enten prioriterer at finde flest muligt personer med risiko for type 2-diabetes eller at minimere antallet af falske alarmer.
Det vil sige, at den enten kan finde de fleste yngre personer med type 2-diabetes, men have en højere fejlrate, eller den kan have lavere fejlrate, men så til gengæld finde lidt færre personer med type 2-diabetes.
Hvad end algoritmen kalibreres til, kan læger i princippet prikke deres patienter på skulderen længe før sygdommen ellers ville blive opdaget og tilbyde dem en udredning og eventuel opfølgende behandling.
“Vi ser i disse år en stor global stigning i antallet af diagnoser med type 2-diabetes, og vi viser her, hvordan de allerede eksisterende danske sundhedsdata fra almen praksis, speciallæger og hospitalerne kan benyttes til at lave brede screeninger for forskellige sygdomme,” forklarer ph.d.-studerende Christian Holm Johansen, der er førsteforfatter på studiet.
Nogle sammenhænge er mere tydelige end andre
Hvis man vil forstå, hvordan algoritmen virker, skal man tænke i, hvad der typisk går forud for forskellige begivenheder i en persons kontakter med sundhedsvæsenet.
I data fra de praktiserende læger er der som eksempel et stærkt signal i forbindelse med børnevaccinationsprogrammet.
Har en person først fået en vaccine fra børnevaccinationsprogrammet, får de også typisk den næste, og sådan følger de en bestemt bane for, hvad der bliver skrevet ind i deres sundhedsjournal.
Andre sammenhænge er langt mere subtile, men personer der senere får tidlig type 2-diabetes, har ofte haft forskellige kontakter med deres læge i årene forinden – små signaler i data, som hver for sig kan være svage, men tilsammen danner et mønster. Det er netop den type mønstre, som maskinlæringsmodeller er særligt gode til at opdage i store datasæt.
Disse kontakter danner mønstre i datasættet – en slags statistiske baner gennem sundhedsvæsenet – som algoritmen kan genkende og bruge til at vurdere, om en person bevæger sig i retning af tidlig type 2-diabetes.
Det er en politisk beslutning
Betyder det så, at danske læger kan slå op i deres patienters patientjournaler i morgen og se, om de lige bør tjekke deres blodsukker en ekstra gang?
Nej, ikke nødvendigvis, for det er en politisk beslutning, om denne type digitale screeningsværktøjer skal tages i brug.
Selvom det er muligt at identificere tusindvis af danskere, der er på vej mod tidlig type 2-diabetes, er det ikke omkostningsfrit at undersøge dem alle nærmere i sundhedsvæsenet.
Det skal undersøges, og det koster både tid hos de praktiserende læger samt forskellige analyser af blandt andet blodprøver.
Alt sammen koster penge.
“Det er et spørgsmål om ressourcer, og om at man laver en cost-benefit-analyse for at finde ud af, om det kan betale sig at bruge tid og penge på at identificere personer med type 2-diabetes hurtigere end ellers,” forklarer Søren Brunak.
Han uddyber, at det for den enkelte patient i den positive gruppe kan være afgørende, fordi tidlig diagnosticering giver mulighed for behandling, før sygdommen når at gøre alvorlig skade på kroppen.
“Det er klart, at hvis der går yderligere 10 år med ikke-diagnosticeret og ubehandlet type 2-diabetes, når sygdommen at skade kroppen, og det koster tabte leveår i den anden ende og et større behov for sundhedsydelser,” siger Søren Brunak.
Kan forudsige 1.000 sygdomme på samme tid
Ifølge Søren Brunak er det muligt at lave algoritmer, der ved hjælp af sundhedsjournaler undersøger, om patienter følger baner i retning af en lang række forskellige sygdomme.
Det kan man enten gøre ved at designe algoritmer, der specifikt leder efter personer, som følger en bane i retning af for eksempel diabetes, hjertekarsygdom, demens osv.
Det er også muligt at lave algoritmer, som kan forudsige risikoen for udvikling af op mod 1.000 forskellige sygdomme på samme tid – længe før de første symptomer viser sig.
“Med disse algoritmer kan vi fremskrive hele befolkningens helbred 10-15 år ud i fremtiden og få et tidligt varsel om, hvilke sygdomme der er på vej. Det giver mulighed for at opdage sygdom tidligere og planlægge sundhedsvæsenet bedre. Fordelen er, at modellerne kan bygges på de sundhedsdata, der allerede findes. Derfor er Danmark et oplagt land at udvikle denne type algoritmer, fordi vi har indsamlet disse sundhedsoplysninger i mange år,” siger Søren Brunak.
