magyar

SMPGD 2013

A Statistical Methods for Post Genomic Data elnevezésű, 2014 január 23-25 között Párizsban tartott konferencián tartotam ezt az előadást: SMPGD_2014_diak

Advertisements
Standard
magyar

Ősi élőlények genetikai tervrajzának rekonstrukciója

A genom az élőlények genetikai tervrajza

Minden élőlény fejlődési tervét és működési programját egy hosszú, DNS molekulában íródott genetikai szöveg,
az élőlény ún. genomja tartalmazza.

A genom DNS molekulákban íródott genetikai szöveg

A genom genetikai szövegét alkotó egyes szavak a gének, amik fehérjéket kódolnak.

Az öröklődés során a genom szövege lemásolódik

A szaporodás részleteitől függetlenül két rokon DNS szekvencia lokálisan mindig egy múltbeli DNS másolási eseményre (replikációra) vezethető vissza.

A másolás során bekövetkező hibák öröklődnek

A DNS replikáció során a génekbe kerülő hibák (mutációk) sorsa semleges változások esetén a véletlenen, egyébként pedig azon múlik, hogy az élőlény számára hasznosak vagy sem.

A rokon gének története rekonstruálható

Rokon gének alapján rekonstruálható a gének családfája, a génfa. A fa elágazásai ősi génreplikációk, gyökere a gének legutoljára létezett közös őse.

De ami igazán érdekes, az a fajfa..

Az evolúció során egyedek és nem egyedi gének versenyeznek. Az evolúciós történelem fordulópontjai nem egyedi génreplikációk, hanem új fajok keletkezésének és régieknek kihalása.

A fajfa makroszkopikus tulajdonságok alapján rekonstruálható

Hagyományosan a fajfát makroszkopikus tulajdonságok,
pl. morfológiai jegyek és fosszíliák alapján rekonstruálták.

A molekuláris szekvenciák értékes információt hordoznak

A rendelkezésre álló fosszíliák limitáltak. A makroszkopikus tulajdonságok evolúciójának megértéséhez a molekuláris részletek, a DNS-ben kódolt genetikai tervrajz szükséges.

A molekuláris evolúciókutatás aranykora?

Egy organizmus teljes genetikai szövegének a meghatározásának ára
az exponenciálisnál gyorsabban csökkent. Mára 7403 faj teljes genomszekveneciája készült el.

A molekuláris evolúciókutatás aranykora?

Egyedi gének óvatos kiválasztásával információt kaphatunk a fajfáról,
így derült fény az élet három nagy doménjére.

A gének 99% története komplikált

Minden gén története egyedi evolúciós események sorozata, rokon gének családjában gyakran változik a gének példányszáma és módusul funkciója.

A fajfa génfák alapján rekonstruálható

Az egyedi gén történetek komplikáltak, de közös fajfa mentén zajlanak, ezért az egyedi történeteket összesítve a fajfa rekonstruálható.

Az egyes géntörténetek elmosódottak

A rokon gének szekvenciája alapján önállóan jósolható génfák elmosódottak, gyakran hibásak, a génfákban lévő hibák erősen befolyásolhatják a rekonstruált evolúciós történetet.

Az emlősök fajfája

6966 gén családot használva 36 emlős genomból, rekonstruáltuk közösen 160 milló év evolúcióját lefedő fajfát és az a mentén futó génfákat.

Horizontális géntranszfer

A génfák nem mindig követik a fajfát. Egysejtű organizmusoknál gyakori jelenség, hogy kívülről a sejtbe került gének a genomba beépülnek és tovább öröklődnek.

Horizontális géntranszfer állatokban

Egysejtűek között gyakori a géntranszfer, de többsejtű élőlényeknél, köztük az állatok közt is ismertek példák.

Horizontális géntranszfer mint zaj

A géntranszfer ellentmondásos géntörténeteket produkál, a karotingének családjában a levéltetű-gén közeli rokona a gombáénak. A transzfer gyakoriságának fényében felmerült, hogy túl sok a zaj a fajfa rekonstrukciójához.

Horizontális géntranszfer mint információ

A génfák a topológiájában kódolt transzferek “molekuláris fosszíliák”, amelyek a fajfa időrendjét rögzítik.

A fotoszintetizáló bakteriumok fajfája

8332 gén családot használva 36 cianobaktérium genomból, rekonstruáltuk 3 milliárd év evolúcióját lefedő fajfát és a faj elágazások időbeli sorrendjét.

A fajfa és génfák közösen rekonstruálhatóak

A fajfa és a génfa közös rekonstrukciója transzfer jelenlétében is lehetséges, a kihívás jelenleg a számítási igény (a következő egy évben 36 milló óra számítási időt tervezünk használni).

Ősi molekuláris gépek feltámasztása a laborban

Rokon gének szekvenciája alapján rekonstruálható a génfa és annak mentén a gének felmenőinek szekvenciája. Az ősi génszekvenciák alapján legyártot “feltámasztot” fehérjék a laborban vizsgáhatóak.

Ősi élőlények genetikai tervrajzának rekonstrukciója

A közös rekonstrukciója az eddiginél pontosabb képet ad az ősi gén tartalmáról, de minket igazából az ősi előlények és környezetük tulajdonságai érdekelnek..

Standard
english

Hungarian Biophysical Society 2013

I had the pleasure of presenting my research at the XXIV. congress of the Hungarian Biophysical Society in Veszprém. The slides of the presentation (in Hungarian) are here: MBFT13

Zsófia Kéri, who will be continuing working with our group as an M.Sc. student this fall  presented her most recent simulation studies related to our Lateral Gene Transfer from the Dead model. She received the prize for the best presentation by a young researcher. Congratulations!

Standard
magyar

MBFT 2013

Kutatási eredményeimet a Magyar Biofizikai Társaság ez évben Veszprémben tartott XXIV. kongresszusán nyílt lehetőségem bemutatni. Az előadásom diái itt találhatóak: MBFT13

A legújabb kihalt fajok nyomait fürkésző szimulációs vizsgálatainkat Kéri Zsófia tavalyi B.Sc., ősztől M.Sc. hallgatónk mutatta be poszterén, amivel a legjobb fiatal kutatónak járó díjat nyerte. Gratulálok!

Standard
magyar

Célkitűzés

Genomok mint a fajfejlődés fosszíliái: Ősi metabolikus hálózatok filogenetikai rekonstrukciója

Bevezetés

A biológia történeti tudomány. A biológiai rendszerek szerkezete, a fehérjéktől egészen az ökoszisztémákig hosszú evolúciós folyamat eredménye, ami több, mint 3 milliárd évvel ezelőtt kezdődött. Bár az evolúció folyamatainak és múltbeli lefolyásának tanulmányozása hagyományosan a többi biológiai diszciplínától különállóként volt kezelve, az a gondolat, hogy az élet története kulcsfontosságú az élő rendszerek megértésében, mára kezd széles körben elfogadottá válni. Az evolúciós modellek döntő szerepet játszottak a biológiai rendszerek belső működésének feltárásában, az emberi genomtól a mikrobiális közösségekig.

Mint ahogy a biológia is egymástól függetlenül kezel különböző szerveződési szinteket (fehérjék, sejtek, szervezetek, populációk stb.), általában az evolúciós folyamatok leírása is elmulasztja figyelembe venni az ökológiai, populációdinamikai, törzsfejlődési, molekuláris filogenetikai, genomszerkezeti, stb. leírási szintek közötti kapcsolatokat és összefüggéseket. A szerveződés ezen különböző szintjei közötti összefonódások modellezése pedig kulcsfontosságú az élő rendszerek működésének leírásához és megértéséhez. Mint ahogy az alábbi ábra is mutatja, minden egyes géncsalád története saját egyedi topológiával és (a szekvenciaváltozás rátáját jellemző) ághosszakkal rendelkező génfával jellemezhető. Az egyedi génfák erdejének összehasonlítása és a bennük rejlő evolúciós történet megértése csak az ezeket a géneket hordozó fajok “történelmének” segítségével lehetséges, ez viszont gyakran ismeretlen. Ahhoz tehát, hogy rekonstruáljuk a fajok történelmét és feltárjuk a gének történetét, szükséges a kettő kapcsolatának explicit modellezése. Erről többet olvashatunk Vincent Daubin és Bastien Boussau összefoglaló cikkében. Mára az az izgalmas helyzet áll fent, hogy a DNS-szekvenálási technológiák, a számítógépes módszerek és erőforrások, ill. az algoritmikai és matematikai technikák olyan szintre értek, hogy lehetővé teszik a szerveződésszintek közötti összefüggések modellezését.

Emil Zukerkandl és Linus Pauling 1965-ben publikálta az első molekuláris szekvenciákon alapuló filogenetikai fát. A rekonstruált hemoglobin génfa értelmezése során figyelembe kell vennünk a génduplikációk és génvesztések sorozatát ahhoz, hogy azt a fajfával összeegyeztessük, abba képzeletben be tudjuk rajzolni. Azonban amint Zukerkandl és Pauling is figyelmeztet, "[the hemoglobin phylogeny] suggests that man and horse are slightly more closely related than man and oxen, but this piece of molecular evidence cannot be taken seriously as long as it remains single." A tudomány mai állása szerint, mint azt az általunk a közelmúltban több ezer géncsalád segítségével rekonstruált emlőscsaládfa is mutatja, a ló (Equus caballus) és a tehén (Bos taurus) egymásnak közelebbi rokonai, mint bármelyik az embernek.

Emil Zukerkandl és Linus Pauling 1965-ben publikálta az első molekuláris szekvenciákon alapuló filogenetikai fát. A rekonstruált hemoglobin génfa értelmezése során figyelembe kell vennünk a génduplikációk és génvesztések sorozatát ahhoz, hogy azt a fajfával összeegyeztessük, abba képzeletben be tudjuk rajzolni. Azonban amint Zukerkandl és Pauling is figyelmeztet, “[the hemoglobin phylogeny] suggests that man and horse are slightly more closely related than man and oxen, but this piece of molecular evidence cannot be taken seriously as long as it remains single.” A tudomány mai állása szerint, mint azt az általunk a közelmúltban több ezer géncsalád segítségével rekonstruált emlőscsaládfa is mutatja, a ló (Equus caballus) és a tehén (Bos taurus) egymásnak közelebbi rokonai, mint bármelyik az embernek.

Már az Emil Zukerkandl és Linus Pauling által 1965-ben publikált első molekuláris családfa megmutatta: ahhoz, hogy különböző ma élő fajok genomjában található rokon gének evolúciós történetét értelmezni tudjuk, ismernünk kell maguknak a fajoknak a családfáját is.  A Zukerkandl és Pauling által rekonstruált génfát és a rárajzolt feltételezett evolúciós történetet alaposabban szemügyre véve azonban egy további fontos tanulságot vonhatunk le. A fenti ábrán ugyanis láthatjuk, hogy a génfa megmagyarázható három duplikációs és két, az ábrán nem illusztrált génvesztési eseménnyel. Ezek az események azonban azt feltételezik, hogy a ma élő szarvasmarhák őse hamarabb alapított saját fajt, minthogy az ember és a ló ősei szétváltak volna. Az egyes gének történetének különbözőségéről és annak okairól Maddison úttörő tanulmányában olvashatunk bővebben.

Azoknak az eseményeknek száma és fajtája, melyek szükségesek egy génfa történetének a fajfa mentén való leírásához, vagyis ahhoz, hogy a génfát a fajfába “berajzoljuk”, függ mind a génfa, mind a fajfa alakjától. Amennyiben a génfa rekonstruálásához használt DNS-szekvenciák közötti különbségek mintázata nem mutat erős preferenciát egy olyan génfa iránt, ami kevesebb eseménnyel is megmagyarázható, akkor a fajfa tükrében megváltoztathatjuk a génfát. Azonban ennek a fordítottja is igaz, amennyiben génfák sokaságát tekintve az azok valamely fajfába való berajzolásához kevesebb esemény szükséges, mint egy másik fajfába való berajzoláshoz, az előbbit gondolhatjuk helyesebbnek. Ezt a gondolatmenetet matematikailag formalizálva, azaz mind a génkópiák (génduplikáció, -transzfer és -vesztés által végbemenő) evolúcióját, mind a génszekvenciák (nukleotidok mutációja és egy populációban való elterjedése által végbemenő) evolúcióját megfelelő modellekkel leírva lehetővé válik a ma létező genomokban található sok ezergénszekvencia alapján a legvalószínűbb fajfa és génfák közös rekonstrukciója.

Eddigi eredmények

A fenti  ábrán látható példában, ha a 36 emlős genomjában található több ezer géncsalád esetén közösen rekonstruáljuk a legvalószínűbb fajfát és génfákat, mint ahogy ezt Vincent Daubin-nel és Bastien Boussau-val tettük, arra a más forrásból is ismert eredményre jutunk, hogy a ló Equus caballus és a tehén Bos taurus egymásnak közelebbi rokonai, mint bármelyik az embernek.

Egysejtű élőlények esetében a génkópiák nem csak duplikációk és génvesztések elszenvedői, hanem a géntranszfer-események is gyakoriak. A fajfa rekonstrukciója szempontjából a transzferesemények különösen érdekesek, mert információt hordoznak a fajszétválási események sorrendjéről. Amint az alábbi ábrán látható, mivel géntranszferek csak a fajfa olyan ágai között lehetségesek, amelyek egyidőben léteznek, egy génfának a fajfába való berajzolásához szükséges események száma függ a fajfa alakjától és a fajszétválási események sorrendjétől.  Vincent Daubin-nel és Eric Tannier-rel együttműködve egy olyan matematikai modellt és hozzá tartozó algoritmusokat fejlesztettem ki és implementáltam, amely a transzfereseményeket is figyelembe véve képes a ma létező genomokban található génszekvencia alapján a legvalószínűbb fajfa és génfák közös rekonstrukciójára. A PNAS-ben 2012-ben megjelent publikációnkban megmutattuk, hogy ez a módszer képes rekonstruálni a közel 3 milliárd éves cianobaktériumok törzsének nagypontosságú datált fajfáját.

a) Egy géncsalád történetének rekonstrukciójához a fajfába be kell rajzolnunk a szekvenciaváltozások alapján rekonstruált génfát, ehhez a fajfa alakjától és a fajszétválási események sorrendjétől függően különbő számú eseményre van szükség. A génfán az aláhúzott szekvenciaváltozások helyét színes csillagok jelölik. Az ábrán szereplő példában, amennyiben az \emph{A} és \emph{B} faj szétválása megelőzte a \emph{C} és \emph{D} faj szétválását, egyetlen transzfereseményre van szükség (I.fajfa), ha ez fordítva volt, akkor kettőre (II.fajfa), viszont ha a fajfa gyökere megváltozik, már három transzferre is szükség lehet (III.fajfa). b) A közös rekonstrukcióhoz szükséges számítások hatékonyan végezhetőek el egy olyan párhuzamos számítási eljárással, ahol egyetlen szerver felelős a legvalószínűbb fajfa kereséséért, a kliensek pedig az egyes génfákat kezelik. A szerver a fajfa optimalizációjához szükséges lépéseket a sok (pár tucattól több százig terjedő) kliens által számított és a szerver által összegyűjtött egyes génfa-valószínűségek alapján teszi meg. A kliensek a fajfa felhasználásával optimalizálják "saját'' génfáikat a közös rekonstrukció során.

a) Egy géncsalád történetének rekonstrukciójához a fajfába be kell rajzolnunk a szekvenciaváltozások alapján rekonstruált génfát, ehhez a fajfa alakjától és a fajszétválási események sorrendjétől függően különbő számú eseményre van szükség. A génfán az aláhúzott szekvenciaváltozások helyét színes csillagok jelölik. Az ábrán szereplő példában, amennyiben az A és B faj szétválása megelőzte a C és D faj szétválását, egyetlen transzfereseményre van szükség (I.fajfa), ha ez fordítva volt, akkor kettőre (II.fajfa), viszont ha a fajfa gyökere megváltozik, már három transzferre is szükség lehet (III.fajfa). b) A közös rekonstrukcióhoz szükséges számítások hatékonyan végezhetőek el egy olyan párhuzamos számítási eljárással, ahol egyetlen szerver felelős a legvalószínűbb fajfa kereséséért, a kliensek pedig az egyes génfákat kezelik. A szerver a fajfa optimalizációjához szükséges lépéseket a sok (pár tucattól több százig terjedő) kliens által számított és a szerver által összegyűjtött egyes génfa-valószínűségek alapján teszi meg. A kliensek a fajfa felhasználásával optimalizálják “saját” génfáikat a közös rekonstrukció során.

Tervezett kutatás

A fenti második ábrán vázolt közös rekonstrukciós eljárásokat tervezem ősi genomok géntartalmának meghatározására alkalmazni három, az eddigieknél nagyobb méretű és átfogóbb adathalmazon. Az így kapott eredményeket felhasználva ősi metabolikus hálózatokat fogok rekonstruálni .  A rekonstruált metabolikus hálózatok kontextusában vizsgálódva megkísérlem értelmezni a hálózatok ma tapasztalható tulajdonságainak (pl. robosztusság, evolvabilitás) kialakulását. Végül a géntörténetek közötti korrelációkat vizsgálva, az ANCESTROME projekttel szorosan együttműködve igyekszem a géninterakciókat tükröző koevolúciós eseményeket detektálni , és azokat az eredmények kísérleti validációjára felhasználni.

Itt a GENESTROY blogon a következő pár hónapban a fent vázolt problémakör alapjait fogom bemutatni, a kérdésfelvetés lényegesebb motívumait régi és új publikációk eredményeinek a bemutatásán keresztül körbejárni.

Standard