A Humán Genom Projekt a DNS-ünk 92%-át állította össze. Íme, mi kellett ahhoz, hogy a maradék is elkészüljön.
Amikor a Humán Genom Projekt 2003-ban bejelentette, hogy elkészült az első emberi genom, az nagy jelentőségű eredmény volt - először sikerült feltárni az emberi élet DNS-tervét. De volt egy bökkenő: nem sikerült a genomban lévő összes genetikai információt összerakni. Voltak hézagok: kitöltetlen, gyakran ismétlődő régiók, amelyeket túl zavaros volt összerakni. Az ezeket az ismétlődő szekvenciákat kezelni képes technológia fejlődésével a tudósok 2021 májusában végül kitöltötték ezeket a réseket, és 2022. március 31-én hivatalosan is közzétették az első teljes emberi genomot.
Hans Winkler német botanikus 1920-ban alkotta meg a genom szót, a gén szót a -ome utótaggal kombinálva, ami teljes készletet jelent, hogy leírja az egyes sejtekben található teljes DNS-szekvenciát. A kutatók még egy évszázaddal később is ezt a szót használják a szervezetet alkotó genetikai anyagra. A genom kinézetének leírására egy szakkönyvhöz hasonlíthatjuk. Ebben az analógiában a genom egy olyan antológia, amely az élet DNS-utasításokat tartalmazza. Nukleotidok (betűk) hatalmas halmazából áll, amelyek kromoszómákba (fejezetekbe) vannak csomagolva.
Minden kromoszóma gének (bekezdések), azaz olyan DNS-régiók, amelyek a szervezet működését lehetővé tevő specifikus fehérjéket kódolják. Bár minden élő szervezetnek van genomja, a genom mérete fajonként eltérő. Egy elefánt ugyanolyan formában használja a genetikai információt, mint a fű, amit megeszik, és a bélrendszerében lévő baktériumok. De nincs két teljesen egyforma genom. Némelyik rövid, mint például a rovarlakó Nasuia deltocephalinicola baktérium genomja, amely mindössze 137 gént tartalmaz 112 ezer nukleotidon keresztül. Néhány, mint például a Paris japonica virágos növény 149 milliárd nukleotidja, olyan hosszú, hogy nehéz megítélni, hány gént tartalmaz.
A gének azonban a hagyományos értelemben vett gének - mint fehérjéket kódoló DNS-szakaszok - csak egy kis részét képezik egy szervezet genomjának. Valójában az emberi DNS kevesebb mint 2%-át teszik ki. Az emberi genom nagyjából 3 milliárd nukleotidot és alig 20 000 fehérjéket kódoló gént tartalmaz - ez a genom teljes hosszának becslések szerint 1%-át teszi ki. A fennmaradó 99% nem kódoló DNS-szekvenciákból áll, amelyek nem termelnek fehérjéket. Néhányuk szabályozó komponens, amelyek kapcsolótáblaként működnek, hogy szabályozzák más gének működését. Mások pszeudogének, vagyis olyan genomiális maradványok, amelyek elvesztették működőképességüket. Az emberi genom több mint fele ismétlődő, közel azonos szekvenciák többszörös másolatával.
Amikor a Humán Genom Projekt 1990-ben elindult, a technológiai korlátok miatt nem volt lehetséges a genom ismétlődő régióinak teljes feltárása. A rendelkezésre álló szekvenálási technológia egyszerre csak körülbelül 500 nukleotidot tudott leolvasni, és ezeknek a rövid töredékeknek át kellett fedniük egymást ahhoz, hogy a teljes szekvencia újra létrejöjjön. A kutatók ezeket az átfedő szegmenseket használták fel a szekvencia következő nukleotidjainak azonosítására, így a genom összeállítása lépésről lépésre, töredékenként bővült. Ezek az ismétlődő hézagos régiók olyanok voltak, mintha egy felhős égbolt 1000 darabos kirakósát raknánk össze: ha minden darab ugyanúgy néz ki, honnan tudod, hol kezdődik az egyik felhő, és hol ér véget a másik? A sok helyen közel azonos, egymást átfedő szakaszok miatt a genom darabonkénti teljes szekvenálása megvalósíthatatlanná vált. Az emberi genom első iterációjában több millió nukleotid maradt rejtve.
Azóta a szekvenciafoltok fokozatosan, apránként töltötték ki az emberi genom hézagait. És 2021-ben a Telomere-to-Telomere (T2T) konzorcium, a tudósok nemzetközi konzorciuma, amely az emberi genom végponttól végpontig történő összeállításán dolgozik, bejelentette, hogy a fennmaradó hiányosságokat végre sikerült kitölteni. Ezt a továbbfejlesztett szekvenálási technológia tette lehetővé, amely hosszabb, több ezer nukleotid hosszúságú szekvenciák leolvasására képes. Mivel több információ állt rendelkezésre az ismétlődő szekvenciák elhelyezéséhez a nagyobb képen belül, könnyebbé vált a genomban elfoglalt megfelelő helyük azonosítása. Mintha egy 1000 darabos kirakójátékot 100 darabosra egyszerűsítenénk, a hosszú leolvasott szekvenciák először tették lehetővé a nagy ismétlődő régiók összeállítását.
(Forrás: BigThink)