DNA-stumper fra mennesker, dyr, planter, bakterier eller virus, som levede for mange tusinde år siden, kan ikke bruges til ret meget, hvis ikke avancerede algoritmer sammensætter den genetiske information i noget, som arkæologer eller geologer kan forstå. Lektor Gabriel Renaud fra DTU udvikler netop disse algoritmer.
Inden for de seneste 10 år er verden blevet forkælet med den ene store opdagelse om vores forfædres liv og færden efter den anden.
Bare for nylig har forskere fundet ud af, hvornår de første mennesker kom til Amerika, at vikinger var et miskmask af gener fra hele Europa, og at kopper var meget udbredt i Europa for 1.000 år siden.
Selvom alle disse opdagelser lyder arkæologiske af natur, er der bag hver af dem et stærkt fundament af avancerede algoritmer og solid computerkraft, der er i stand til at jonglere med millioner af små stykker arvemasse og gøre det muligt at sætte lup på fortidens genetik.
En af de forskere, som har været med til at pionere nogle af de algoritmer, som arkæologerne læner sig opad i dag, er Gabriel Renaud, der er lektor ved Institut for Sundhedsteknologi på Danmark Tekniske Universitet (DTU).
Gabriel Renaud har for nylig modtaget et såkaldt Data Science Investigator Grant på næsten 8 mio. kr. fra Novo Nordisk Fonden til over de næste fem år at gøre algoritmerne bag de revolutionerende opdagelser endnu bedre.
"Arkæologer har en masse spørgsmål, som ikke kan besvares ved bare at se på knogler. De vil vide, hvem folk var, hvordan de levede, hvordan miljøet så ud dengang, og hvilke sygdomme de led af. Min forskning går ud på at udvikle de computerværktøjer, der gør arkæologerne i stand til at besvare disse spørgsmål," fortæller Gabriel Renaud.
Nye algoritmer besvarer ældgamle spørgsmål
For at eksemplificere Gabriel Renauds forskning og arbejde kan man som eksempel forestille sig, at man har fundet en meget gammel knogle i en hule et eller andet sted i det sydlige Europa.
For at finde ud af mere om, hvem knoglen tilhørte, kan forskere udføre såkaldt næste generations sekventering og ekstrahere det genetiske materiale fra knoglen.
Er knoglen 30.000 år gammel, er det genetiske materiale dog fragmenteret i millioner af bittesmå stumper af DNA af varierende længde. At afkode det genetiske budskab vil derfor være som at skulle læse en bog, der har været gennem en makulator et par gange - det kan man ikke uden at prøve at rekonstruere bogen først, og det er meget lettere sagt end gjort.
Måske vil de makulerede stumper indeholde hele sætninger eller blot ord, men det er ikke til at sige, hvor ordene eller sætningerne passer ind. Er det på side tre eller 256?
Her træder Gabriel Renaud og andre dataloger til og udvikler avancerede algoritmer, som er i stand til at sætte de mange millioner stumper af genetisk information sammen til noget meningsfuldt.
For at blive i boganalogien, så samler datalogerne de fragmenterede bogsider fra flere hundrede bøger til ét enkelt eller måske en håndfuld eksemplarer, som arkæologerne kan bladre i for at blive klogere på fortiden.
Det foregår alt sammen på computere, hvor forskerne enten rekonstruerer hele den genetiske arvemasse fra bunden af eller genskaber den ved at læne sig op ad et reference-genom, eksempelvis et menneskegenom, hvis knoglen kommer fra et menneske.
Når genomet har været en tur gennem Gabriel Renauds algoritme, kan forskerne for eksempel finde ud af, om knoglen tilhørte en mand eller en kvinde, eller hvilket folkeslag personen tilhørte.
Det var eksempelvis det, som forskerne gjorde, da de fandt ud af, at vikingernes arvemasse bestod af en pose genetisk bland selv-slik fra hele Europa. Det kunne de se i rekonstruerede genomer.
"Det er ikke mere end ti år siden, at forskere benyttede de her metoder ad hoc og ikke særligt effektivt. Men der er et stort potentiale i at udvikle algoritmerne og gøre dem stærkere og mere præcise, så de kan komme med endnu flere svar ud fra den DNA, som bliver ekstraheret fra en lang række forskellige kilder," forklarer Gabriel Renaud.
Algoritmer skal kunne håndtere en masse scenarier
Gabriel Renaud arbejder på at udvikle algoritmer, der tager højde for en lang række situationer, hvor de nuværende algoritmer kommer helt eller delvist til kort.
Det kan eksempelvis dreje sig om at udvikle bedre algoritmer til at filtrere forurening fra prøver.
Det er ikke svært at forestille sig, at en knogle, der har ligget i en hule i 30.000 år, kan være forurenet med DNA fra andre organismer. Det skal datalogisk sorteres fra. Gabriel Renaud har udviklet en algoritme, som er i stand til netop det.
Forskeren fra DTU har også udviklet en algoritme, der kan identificere, om eksempelvis personen for 30.000 år siden var et produkt af lidt for tætte relationer mellem familiemedlemmer.
"Hvis eksempelvis en fætter og kusine har fået et barn sammen, kan barnet risikere ikke at have variation mellem sine to kromosomer, da de begge kommer fra samme bedsteforældre. Det er evolutionært en blindgyde, fordi det dramatisk øger risikoen for genetiske sygdomme og defekter, og det kan en algoritme identificere. På den måde kan vi gøre arkæologer klogere på, hvordan folk måske levede for 30.000 år siden. Hvad var normalt og unormalt?" siger Gabriel Renaud.
Kigger på DNA-stumper i en prøve jord
Sideløbende med at Gabriel Renaud har udviklet sine algoritmer, har arkæologer, geologer og molekylærbiologer sat dem på prøve.
Førhen ekstraherede forskere kun gammelt DNA fra primært knogler og tænder, men de er i stigende grad begyndt at se andre veje for at få mere information. Eksempelvis er de begyndt at sekventere alt genetisk materiale fra jordprøver, der er taget fra gulvet i gamle huler.
Det betyder, at når de beder Gabriel Renaud om at identificere, hvad der har levet i hulen, får han data på DNA-fragmenter fra ikke bare én art, men fra mange forskellige arter, der har levet i hulen, herunder både mennesker, dyr, planter, bakterier og virus.
Det svarer til at proppe en blender med hvede, jordbær, mandler, en lillefinger fra en fjern onkel, et halvt vildsvin, to markmus, 12 forskellige bakterier, seks virus og et bøgetræ, derefter trykke på startknappen og lade den køre i 30.000 år.
"Så er det min opgave at finde ud af, hvad der har levet i hulen på et givent tidspunkt, og det er i sig selv ikke en let opgave at løse. Opgaven bliver heller ikke gjort lettere af, at DNA opsamler skader over tid, og det skal algoritmerne også tage højde for. Alle disse aspekter skal kodes ind i algoritmerne, for at de kan komme med de svar, som arkæologerne eller geologerne efterspørger," siger Gabriel Renaud.
Kan forudsige, hvad klimaforandringer kommer til at betyde for dyr
Med Gabriel Renauds algoritmer, der er under konstant udvikling, er det også muligt at svare på nogle meget specifikke spørgsmål, som ikke bare har interesse set i bakspejlet, men også er interessante, når man kigger ud af forruden.
Eksempelvis kan algoritmerne vise, hvordan sammensætningen af dyr og planter et givent sted i eksempelvis Europa har set ud for 100.000, 75.000, 50.000 og 25.000 år siden.
I den periode skiftede klimaet mellem at være varmt og koldt i perioder, og ved at sammenholde klimadata fra eksempelvis iskerneboringer fra den grønlandske indlandsis med de genetiske fund i hulerne kan forskerne stykke et billede sammen af, hvordan en lang rækker dyr og planter har reageret og vil reagere på klimaforandringer.
Nogle klarer sig måske fint og er til stede i form at DNA-fragmenter i alle de prøver, som kører gennem Gabriel Renauds algoritmer, mens andre kun findes i prøver, der korresponderer med kolde eller varme perioder.
"Vi kan monitorere udviklingen i sammensætningen af fauna og flora i realtid på et andet tidspunkt i historien. Sammenholdt med klimaudviklingen i nutiden kan det hjælpe os med at afgøre blandt andet, hvilke dyr som måske bliver mest påvirket af klimaforandringerne, og som vi måske skal holde mest øje med i et bevarelsesøjemed," forklarer Gabriel Renaud.
Leder efter årsagssammenhænge til de store pattedyrs uddøen
Et helt andet perspektiv er, at algoritmerne også kan hjælpe til med at besvare nogle af de store ubesvarede spørgsmål, når det gælder menneskets indflydelse på resten af planeten.
Eksempelvis er forskere ikke 100 pct. sikre på, om mennesker eller klima var den drivende faktor i, at mange af de store pattedyr uddøde fra Europa og Asien. Hvad skete der med mammutterne og de uldede næsehorn? Eller hvad med sabeltigerne?
Der er et sammenfald mellem menneskets ankomst til Europa fra Afrika, men er det også årsagen?
"For at kunne besvare det spørgsmål skal vi have mere data, og det kan vi få ved at analysere tilstedeværelsen af DNA fra nogle af disse dyr i blandt andet huler. Så kan vi finde ud af, hvornår de levede, hvornår de forsvandt igen, og om det falder sammen med, at der har været mennesker i et givent område," siger Gabriel Renaud.
Gabriel Renaud forklarer også, at netop huler er en fremragende kilde til genetisk materiale, fordi huler ofte holder relativt konstante temperaturer. Temperaturer er DNA's værste fjende, fordi varme får DNA til at blive nedbrudt hurtigere, end ti heste kan rende.
"Der har været eksempler på én mio. år gammelt DNA, men det blev fundet i is, som er rigtigt godt til at bevare DNA. Når det gælder DNA, som ikke har været frosset ned, er grænsen omkring 100.000 år," siger han.
Bakterier i permafrosten bliver vækket til live
Det andet perspektiv i Gabriel Renauds forskning - og i udviklingen af algoritmer - er i forhold til at identificere fortidens bakterier og virus.
Ifølge Gabriel Renaud er bakterier og virus ikke bare en del af vores historie og forhistorie. De har været med til decideret at forme den. Det gælder både i forhold til de bakterier og virus, som lever sammen med os, men også i forhold til de bakterier og virus, der kan gøre os syge.
Nogle af disse sygdomsfremkaldende bakterier og virus har vi ikke haft berøring med i tusinder af år, og det betyder, at vi intet forsvar har mod dem, hvis de en dag skulle finde på at komme tilbage. Kan de så det, er det naturlige spørgsmål. Ja, det kan de, er svaret, og så er vi tilbage til alt det med klimaforandringerne.
Tag som eksempel permafrosten i det nordlige Sibirien. Under permafrosten findes græs, bakterier og virus, som ikke har set dagens lys i 30.000 år. De har bare ligget der og ventet. Nu er isen begyndt at tø, og bakterier og virus er begyndt at komme til live som fortidszombier, der rejser sig fra en iskold grav. Det har blandt andet betydet, at russiske rensdyravlere har måtte slå hele deres besætning af rensdyr ihjel, fordi de er blevet smittet med den vanvittigt farlige bakterie miltbrand.
Forskere tror, at miltbrand er vågnet op fra sin søvn efter at have slumret i permanent frossen tilstand i praktisk talt alt den tid, der har levet mennesker uden for Afrika. Nu er de vågnet op til en verden, som slet ingen beskyttelse har mod dem.
"Når man tænker på COVID-19, og hvordan dette lille stykke DNA kan lægge verdensøkonomien i ruiner, burde vi være meget interesserede i at finde ud af, hvad der gemmer sig under isen forskellige steder i verden. De bakterier og virus vågner i disse år, og hverken planter, dyr eller mennesker er garanteret at have et forsvar mod dem. Det er en meget farlig cocktail," siger Gabriel Renaud.
Udvikler algoritmer til at identificere, hvad der findes under isen
En del af Gabriel Renauds forskning går med at udvikle algoritmer, der kan jonglere med de mange genetiske data, der kan trækkes ud af iskerneprøver fra eksempelvis den russiske permafrost.
Hvis bakterierne ligner nogle, som vi kender til i forvejen, kan han bruge dem som referencer og rekonstruere hele bakterie- og virusgenomer.
Hvis de ikke ligner noget, som vi kender til, må hans algoritmer indstilles til at bygge genomerne op helt fra bunden af.
Uanset om det drejer sig om den ene eller anden metode, handler det om at finde ud af, hvordan bakteriernes genomer ser ud, for kun på den måde kan vi finde ud af, hvad deres potentiale for smitte er, og hvor farlige de kan være.
"Det handler om at finde ud af, hvad de her bakterier og virus er i stand til, for det er ikke et spørgsmål om, hvorvidt de optør, men hvornår de gør det," forklarer Gabriel Renaud.