Forskere sætter genomet på formel

Miljø og bæredygtighed 26. okt 2020 4 min CEO Bernhard O. Palsson Skrevet af Kristian Sjøgren

Ved at sætte genomet på formel gør forskere det meget lettere at lede efter genetisk information i arvemassen eller måske endda designe organismer helt fra bunden af.

Forestil dig, at du fik den idé, at du ville designe en organisme helt fra bunden af.

Før du kan det, skal du vide, hvordan hver enkelt af genomets byggesten har indflydelse på organismens endelige funktion, og det kræver en meget større indsigt i funktionen af alle de genetiske byggesten, end vi har adgang til i dag.

Det kan dog ændre sig meget snart, efter forskere for første gang har sat genomet på matematisk formel, hvilket gør det muligt at afkode det, ligesom man ville afkode informationen på en computers harddisk.

Det nye matematiske værktøj, som forskerne kalder for bitomet, kan ifølge en af forskerne bag udviklingen af det være det første skridt på vejen til et helt nyt forskningsfelt: Genome engineering.

”Inden for 10 år kommer vi til at kunne designe genomer helt fra bunden af ved at bestemme, hvilken information alle byggestenene i genomet skal besidde. Men ligesom med kemi og fysik skal denne videnskabelige gren have sin egen form for matematik, og bitomet kan være en del af denne fundamentale matematik,” forklarer professor Bernhard Palsson, der er CEO på Novo Nordisk Foundation Center for Biosustainability ved Danmarks Tekniske Universitet.

Bitomet er offentliggjort i Nucleic Acid Research.

Hver af DNA’ets byggesten kan kode for flere forskellige funktioner

I forskningsarbejdet har forskerne gjort det meget simple, men alligevel uhyggeligt krævende, at de har lavet en oversigt over alle de egenskaber, som hver af en colibakteries 4,5 mio. DNA-byggesten kan have.

Hver af disse nukleotider, som de hedder, kan have forskellige funktionelle egenskaber.

De kan blandt andet indgå i dannelsen af DNA-strukturer, eksempelvis en alfa helix. De kan indgå i såkaldte codons, som koder for en aminosyre i et protein. De kan være involveret i dele af genomet, som hjælper til ved oversættelsen af genetisk information til proteiner. Eller de kan være involveret i at åbne genomet, når det duplikeres.

De fleste nukleotider har endda flere end én funktion tilknyttet.

I alt har forskerne identificeret 1.500 egenskaber, som hver af genomets byggesten potentielt set kan have.

Lavede stort excellark med al information i genomet

Efterfølgende lavede forskerne pendanten til et stort excellark, hvor hver række repræsenterede en af colibakteriens 4,5 mio. byggesten, mens kolonnerne repræsenterede hver af de 1.500 egenskaber.

Derefter var det blot et spørgsmål om at notere ud for hver egenskab, om det specifikke sted på genomet besad denne egenskab eller ej: 1 for ja og 0 for nej.

Koder dette nukleotid for en alfa helix? Ja eller nej? 1 eller 0?

”Det er som sammensmeltningen af informationsteknologi og genomics, hvor vi kan tilgå informationen i DNA’et på samme måde, som vi ville tilgå informationen på en harddisk, simpelthen ved at se, om et givent sted på genomet koder for en given egenskab. Bitomet indeholder alle de bidder af information, som findes hvert enkelt sted på genomet,” siger Bernhard Palsson.

Gør det let at søge efter information i genomet

Bernhard Palsson forklarer, at den matematiske repræsentation af genomet gør det meget lettere at søge efter information i det.

Man kan som eksempel stille spørgsmålet: Hvor meget information ligger der gemt i det enkelte nukleotid et givent sted på genomet?

Går man ind i ”excellarket”, er det blot et spørgsmål om at finde det givne sted på genomet og derefter tælle antallet af 1-taller, der repræsenterer forskellige funktioner.

Når forskerne laver denne øvelse, kan de blandt andet se, at det gennemsnitlige nukleotid indeholder mellem 15 og 20 forskellige funktioner, mens nogle sågar indeholder mere end 30 forskellige funktioner.

Andre steder på genomet findes der store regioner af nukleotider, som kun koder for i omegnen af fem funktioner.

”Det er som store ørkener af information, mens andre steder er meget informationstætte. Hele matricen repræsenterer den samlede information, som ligger i genomet, og man kan søge i informationen på forskellige måder ved at stille forskellige spørgsmål,” siger Bernhard Palsson.

Store dele af genomet koder for gener eller alfa helixer

En anden måde at søge i informationen er ved at kigge på, hvor mange steder på genomet en given funktionalitet er kodet i arvemassen.

Det kan som eksempel være ved at stille spørgsmålet: Hvor mange steder på genomet koder for en funktion, der er relevant for dannelsen af en alfa helix?

For at besvare det spørgsmål kan man gennemgå matricen og se, i hvor mange rækker der er et 1-tal ud for alfa helix.

”Man kan lægge summen af alle 1-tallerne i en given række sammen og blandt andet se, at 25 pct. af genomet koder for en alfa helix. Man kan også se, at 87 til 88 pct. af genomet koder for et gen. Omvendt kan vi også se, at kun ét sted på genomet koder for startpunktet for DNA-replikation. Det er det eneste sted på genomet, hvor vi finder denne egenskab, og det eneste sted, hvor der er et 1-tal,” siger Bernhard Palsson.

Kan identificere funktionelle forskelle mellem bakterier i bioteknologien

Det nye matematiske værktøj til at ekstrahere information fra genomet kan benyttes i forskellige sammenhænge, hvor forskere gerne vil blive klogere på organismer eller forskelle mellem organismer.

Tag som eksempel bakterier, der bliver brugt bioteknologisk til eksempelvis at lave medicin eller studere infektioner.

Disse bakterier findes i mange forskellige varianter, som har forskellige egenskaber, og disse forskelle ligger gemt i genomet.

Ved at sammenligne bitomet mellem de forskellige bakterier kan forskere blive klogere på, hvordan de er forskellige, og hvad det gør ved eksempelvis deres metabolisme eller patologi.

”Man kan relatere forskelle i bitomet mellem organismer til forskelle i organismernes egenskaber. Når vi taler om bioteknologi, er forskelle i metabolisme mellem bakterier ofte den definerende egenskab, og vi kan, når vi sammenligner bitomer mellem bakterierne, se, at på tværs af 1.000 forskellige gener for metabolisme er langt de fleste af dem identiske i den information, som ligger i genomet, mens der er store forskelle i enkelte metabolisme-gener. Det er der, hvor designvariationen findes,” forklarer Bernhard Palsson.

Computere kan designe bakterier fra bunden

Ved at få indsigt i forskelle mellem varianter af samme bakterie kan forskerne også udregne, hvordan de vil designe de egenskaber, som de gerne vil have den enkelte variant af en bakterie til at have.

Bernhard Palsson forestiller sig, at man i fremtiden kan fortælle en computer, at man gerne vil udvikle eksempelvis en colibakterie, der kan lave insulin på den mest effektive måde, og at computeren så spytter hele den 4,5 mio. nukleotider lange DNA-sekvens ud, som colibakterien skal opbygges af.

Så er det blot et spørgsmål om at begynde at klistre de forskellige nukleotider sammen til den endelige bakterie.

”Det er et helt nyt forskningsfelt, og den matematik, som bitomet åbner op for, gør forskningsfeltet muligt,” siger Bernhard Palsson.

Forskeren tror, at inden for ti år vil alle større universiteter have en afdeling, som beskæftiger sig med genome engineering.

The Bitome: digitized genomic features reveal fundamental genome organization” er udgivet i Nucleic Acids Research. Medforfatter Bernhard Palsson er CEO på Novo Nordisk Foundation Center for Biosustainability, Danmarks Tekniske Universitet, Kongens Lyngby.

Bernhard Palsson is a Distinguished and the Galletti Professor of Bioengineering, Professor of Pediatrics, and the Principal Investigator of the Syste...

Dansk
© All rights reserved, Sciencenews 2020