 |
   |
|
 |
Mackiewicz-Zakrzewska, Studia i edukacja, farmacja
|
aaaaCzęsto usiłujemy ukryć nasze uczucia przed tymi, którzy powinni je poznać.aaaa
[ Pobierz całość w formacie PDF ] PRACE PRZEGL¥DOWE Genomika – dziedzina wiedzy XXI wieku Pawe³ Mackiewicz 1 , Jolanta Zakrzewska-Czerwiñska 2 , Stanis³aw Cebrat 1 1 Zak³ad Genomiki, Instytut Genetyki i Mikrobiologii, Uniwersytet Wroc³awski, Wroc³aw 2 Zak³ad Mikrobiologii, Instytut Immunologii i Terapii Doœwiadczalnej im. L. Hirszfelda, Polska Akademia Nauk, Wroc³aw Genomics – science of the 21 st century Summary Genomics is a new field of biology. Its fast development is caused mainly by quick progress in large-scale genome sequencing and in computer technology. In spite of a huge number of sequenced microbial genomes available in data- bases, their taxonomical diversity is biased and reflects the interests of re- searches and facility of microorganisms’ isolation and culture in laboratory con- ditions. More than 80% of genome sequencing projects are focused on the mem- bers of Proteobacteria, Firmicutes and Actinobacteria. Environmental genome shotgun sequencing reveals that microbial diversity is much greater than we ex- pected. Particular levels of genomic analysis, the problems and subjects of genomics are specified and described here. Key words: genomics, bioinformatics, microbial genomes, microbial diversity. Adres do korespondencji Pawe³ Mackiewicz, Zak³ad Genomiki, Instytut Genetyki i Mikrobiologii, Uniwersytet Wroc³awski, ul. Przybyszewskiego 63/77, 51-148 Wroc³aw; e-mail: pamac@microb.uni.wroc.pl 1. Postêpy w sekwencjonowaniu genomów Genomika, czyli nauka o genomach jest stosunkowo now¹, ale dynamicznie rozwijaj¹c¹ siê dziedzin¹ biologii. Do powstania genomiki przyczyni³ siê intensywny rozwój technik biologii mo- lekularnej, który umo¿liwi³ podjêcie i zrealizowanie projektów sekwencjonowania ca³ych genomów. Pierwszym zsekwencjono- wanym genomem by³ genom bakteriofaga MS2, zbudowany z RNA o d³ugoœci 3569 nukleotydów (1). Prze³omem sta³o siê 3 (70) 7–21 2005 Pawe³ Mackiewicz, Jolanta Zakrzewska-Czerwiñska, Stanis³aw Cebrat wprowadzenie w 1977 r. technik sekwencjonowania DNA przez Sangera i wsp. (2) oraz Maxama i Gilberta (3). Szczególnie popularna sta³a siê metoda z u¿yciem dide- oksynukleotydów Sangera zwana metod¹ terminacji ³añcucha. Pozwoli³a ona na po- znanie sekwencji ca³ego genomu faga X174 o d³ugoœci 5,4 tys. nukleotydów, opu- blikowanej w 1977 r. (4). Kolejnymi zsekwencjonowanymi genomami by³ genom mi- tochondrialny cz³owieka o d³ugoœci 16,6 tys. pz (5) oraz faga o d³ugoœci 48,5 tys. pz (6) – bardzo popularnego modelowego obiektu wielu badañ molekularnych i genetycznych. W latach osiemdziesi¹tych XX w. sekwencjonowanie ma³ych genomów sta³o siê ju¿ stosunkowo proste i ma³o kosztowne, co doprowadzi³o do opublikowania se- kwencji genomów wielu wirusów i organelli komórkowych. Jednak analiza sekwen- cji du¿ych genomów wci¹¿ by³a poza zasiêgiem ówczesnych mo¿liwoœci. Dlatego za wa¿ne wydarzenie uznano poznanie pe³nej sekwencji (315 tys. pz) – chromoso- mu III dro¿d¿y Saccharomyces cerevisiae (7). Sekwencja ca³ego genomu dro¿d¿y o d³ugoœci ponad 12 milionów pz zosta³a opublikowana na pocz¹tku 1996 r. (8). Krokiem milowym w genomice sta³o siê wprowadzenie nowych technik sekwencjo- nowania du¿ych genomów, tak zwan¹ metod¹ shotgun („strza³u na œlepo”) pole- gaj¹cej na sekwencjonowaniu du¿ej liczby sekwencji generowanych przez losowe fragmentowanie genomu, które nastêpnie s¹ sk³adane komputerowo (9). To w³aœnie wprowadzenie metod obliczeniowych sk³adaj¹cych setki tysiêcy losowo uzyskanych sekwencji DNA (pocz¹tkowo o d³ugoœci 300-500 pz, a obecnie do 1500 pz) w d³u¿- sze fragmenty zmniejszy³o znacznie koszty i skróci³o czas sekwencjonowania, elimi- nuj¹c tradycyjne metody polegaj¹ce na ¿mudnym i czasoch³onnym mapowaniu oraz sk³adaniu kolejno u³o¿onych kosmidów lub subklonów (10). Dziêki metodzie shot- gun , jeszcze przed og³oszeniem kompletnej sekwencji genomu dro¿d¿y, opubliko- wano sekwencjê genomu bakterii Haemophilus influenzae – 1,8 mln pz (11), a tu¿ po nim genomu Mycoplasma genitalium – 0,6 mln pz (12). Od tego czasu mo¿na obserwowaæ w przybli¿eniu wyk³adniczy wzrost liczby kompletnie zsekwencjonowanych genomów i intensywny rozwój genomiki (rys. 1). Na pocz¹tku 2005 r. liczba zsekwencjonowanych genomów wynosi³a 244 (wg bazy danych GOLD, www.genomesonline.org; 13, 14), w tym z królestwa Archaea – 20, Bacteria – 193, Eukaryota – 31. Znaczny udzia³, jak widaæ, stanowi¹ genomy Prokaryota . Licz¹c od 1999 r. liczba poznawanych genomów podwaja siê œrednio co 15 miesiêcy, a od 2000 r. co miesi¹c publikowane s¹ œrednio sekwencje czterech ge- nomów. Wed³ug bazy danych GOLD na pocz¹tku 2005 r. rozpoczêtych by³o 1000 projektów sekwencjonowania ró¿nych genomów (w tym: Archaea – 27, Bacteria – 509, Eukaryota – 464). Zak³adaj¹c, ¿e dotychczasowe tempo przyrostu liczby zsekwencjonowanych genomów prokariotycznych bêdzie siê utrzymywaæ, to do 2030 r. poznamy ponad 5400 genomów. Dla porównania liczba znanych gatunków Prokaryota wynosi obecnie 5536 (wed³ug DSMZ Bacterial Nomenclature Up-to-date, www.dsmz.de/bactnom/bactname.htm). 8 PRACE PRZEGL¥DOWE Genomika – dziedzina wiedzy XXI wieku Rys. 1. Skumulowana liczba kompletnie zsekwencjonowanych genomów z podzia³em na trzy króle- stwa (wed³ug danych z bazy GOLD). Pionowymi liniami zaznaczono czas opublikowania sekwencji nie- których organizmów istotnych z punktu widzenia: poznawczego, biotechnologicznego lub medycznego Hi – Haemophilus influenzae KW20 (pierwszy zsekwencjonowany organizm komórkowy, patogen), S – Synechocystis sp. PCC6803 (sinica), Mj – Methanococcus jannaschii DSM 2661 (archeon), Sc – Saccharomyces cerevisiae S288C ( Eukaryota , dro¿dze, organizm modelowy, znaczenie biotechnologiczne), Ec – Escherichia coli K12 (organizm modelowy, fakultatywny patogen), Bs – Bacillus subtilis 168 (organizm modelowy), Mt – Mycobacterium tuberculosis H37Rv (patogen), Ce – Caenorhabditis elegans ( Eukaryota , nicieñ, orga- nizm modelowy), Hp – Helicobacter pylori J99 (patogen), Cp – Chlamydophila pneumoniae CWL029 (pato- gen), Dm – Drosophila melanogaster (muszka owocowa, organizm modelowy), Vc – Vibrio cholerae N16961 (patogen), At – Arabidopsis thaliana (roœlina, rzodkiewnik pospolity organizm modelowy), Hs – Homo sapiens ,Sa – Staphylococcus aureus N315 (MRSA) (patogen), St – Salmonella typhi CT18 (patogen), Os – Oryza sativa japonica (ry¿, znaczenie gospodarcze), So – Streptomyces coelicolor A3(2) (wytwarzanie antybiotyków), Pf – Plasmodium falciparum 3D7 (pierwotniak, zarodziec sierpowaty, patogen), Mm – Mus musculus (ssak, mysz, organizm modelowy), Sf – Shigella flexneri 2a 2457T (patogen), Pm – Prochlorococcus marinus CCMP1375 (SS120) (sinica, znaczenie ekologiczne), Ne – Nanoarchaeum equitans Kin4-M (przedsta- wiciel nowej grupy Archaea ), Bm – Bombyx mori p50T (jedwabnik morwowy, znaczenie przemys³owe). W wyk³adniczy sposób roœnie równie¿ wielkoœæ sekwencjonowanych chromoso- mów i genomów (rys. 2). Zsekwencjonowane dotychczas chromosomy organizmów prokariotycznych charakteryzuj¹ siê du¿ym zró¿nicowaniem wielkoœci: Archaea od 0,5 mln pz ( Nanoarchaeum equitans ) do 5,8 mln pz ( Methanosarcina acetivorans) , Bacteria od 0,58 mln pz ( Mycoplasma genitalium ) do 9,1 mln pz ( Bradyrhizobium japonicum ). BIOTECHNOLOGIA 3 (70) 7-21 2005 9 Pawe³ Mackiewicz, Jolanta Zakrzewska-Czerwiñska, Stanis³aw Cebrat Rys. 2. Wzrost wielkoœci kolejno sekwencjonowanych chromosomów lub genomów. Oœ Y przedsta- wiono w skali logarytmicznej. Wœród Eukaryota najmniejszym kompletnie zsekwencjonowanym genomem jest ge- nom paso¿ytniczego grzyba Encephalitozoon cuniculi o wielkoœci 2,5 mln pz, a najwiê- kszym – genom cz³owieka o wielkoœci 3,1 mld pz. Najwiêkszym znanym genomem eukariotycznym czekaj¹cym na zsekwencjonowanie jest genom ameby Amoeba dubia o wielkoœci a¿ 670 mld pz. Ogromnym przyœpieszeniem sekwencjonowania, obni¿enia kosztów i zwiêksze- nia dok³adnoœci odczytów by³o wprowadzenie elektroforezy kapilarnej i znakowa- nie nukleotydów fluorochromami, co pozwoli³o na zautomatyzowanie ca³ego proce- su. Koszty sekwencjonowania w przeliczeniu na zasadê zmniejszaj¹ siê dwukrotnie co 18 miesiêcy, co daje 10-krotny spadek kosztów co 5 lat (15). W 1995 r. sekwen- cjonowanie kosztowa³o 100-300 centów amerykañskich za zasadê, a w 2000 r. ju¿ tylko 10-30 centów amerykañskich. Zak³adaj¹c, ¿e w roku 2020 koszty te bêd¹ wy- nosiæ 0,001-0,003 centów amerykañskich za zasadê, a na sekwencjonowanie bêdzie siê przeznaczaæ rocznie 1 miliard USD, to za 15 lat bêdzie siê uzyskiwaæ sekwencje odpowiadaj¹ce prawie 17 tysi¹com genomów cz³owieka (5 × 10 13 par zasad na rok). Sugeruje to, ¿e tempo przyrostu danych sekwencyjnych bêdzie jeszcze bar- dziej rosn¹æ. Jest to wariant optymistyczny, poniewa¿ w koñcu i tak dojdzie siê do granic mo¿liwoœci stosowanych technologii, wynikaj¹cych po prostu z ograniczeñ praw przyrody. 10 PRACE PRZEGL¥DOWE Genomika – dziedzina wiedzy XXI wieku Rys. 3. Zale¿noœæ miêdzy kosztem sekwencjonowania a liczb¹ zasad w sekwencjach deponowanych w bazie GenBank (www.ncbi.nlm.nih.gov/Entrez). Lini¹ przerywan¹ zaznaczono przewidywany wzrost liczby zasad w przysz³oœci wed³ug (15). Obie osie Y przedstawiono w skali logarytmicznej. Rola komputerów sprowadza siê nie tylko do sk³adania zsekwencjonowanych fragmentów oraz gromadzenia danych w postaci skomputeryzowanej, ale równie¿ do analiz sekwencji, np. rozpoznawania sekwencji koduj¹cych, poszukiwania se- kwencji podobnych, porównywania genomów, czy przewidywania struktur bia³ek. Nieocenion¹ rolê odgrywa tak¿e internet, który umo¿liwia szybki dostêp do groma- dzonych danych oraz ich przesy³anie miêdzy badaczami, centrami sekwencjo- nuj¹cymi genomy oraz bazami danych. Widaæ wyraŸny zwi¹zek miêdzy liczb¹ gro- madzonych sekwencji a rozwojem technologii komputerowych – mierzonych szyb- koœci¹ procesorów lub pojemnoœci¹ twardych dysków, opisywanego najczêœciej pra- wem Moore’a mówi¹cego, ¿e wydajnoœæ komputerów ulega podwojeniu co oko³o 18 miesiêcy (rys. 4). W podobnym tempie podwaja siê liczba danych w GenBank-u (co 14 miesiêcy). Znaczna czêœæ analiz genomicznych jest przeprowadzana za po- moc¹ ró¿norodnych metod obliczeniowych, zaawansowanych algorytmów i skom- puteryzowanego sprzêtu, dlatego genomika jest œciœle powi¹zana z bioinformatyk¹ – równie¿ intensywnie rozwijaj¹c¹ siê dziedzin¹ interdyscyplinarn¹ ³¹cz¹c¹ biolo- giê z naukami i technikami informatycznymi oraz obliczeniowymi. BIOTECHNOLOGIA 3 (70) 7-21 2005 11 [ Pobierz całość w formacie PDF ]
zanotowane.pldoc.pisz.plpdf.pisz.plpies-bambi.htw.pl
|
|
 |
Odnośniki
Często usiłujemy ukryć nasze uczucia przed tymi, którzy powinni je poznać.Metody Numeryczne Anna Barcz 2008 Zawodowe, WI ZUT studia, Metody numeryczne, egz, MN Egzamin Zawodowe 2008Marek Ludwicki 2 automatyka i robotyka, Studia, Automatyka i robotykaMetodologia badan Brzezinska, studia, Metodologia badań społecznychMeteorologia i Klimatologia 6 Kondensacja rosa, MOJE STUDIA Toksykologia i Mikrobiologia środowiska (Ochrona Środowiska - dzienne), Meteorologia i klimatologiaMetody Numeryczne Anna Barcz 2008 Zawodowe, STUDIA, WIL PK, Metody numeryczneMarcin spr 2, Studia budownictwo pierwszy rok, Chemia budowlana, Chemia budowlana, Nowy folder (3), Moje sprawozdanieMarshall 2, studia, ekonomia uek, marshallMaria Grzegorzewska, studia, oligo, oligoMc Kenzie, pielęgniarstwo, studia pielęgniarstwoMarcin - Program Nauczania z Dydaktyki, STUDIA, Dydaktyka
zanotowane.pldoc.pisz.plpdf.pisz.plimikimi.opx.pl
|
|
|
 |
Często usiłujemy ukryć nasze uczucia przed tymi, którzy powinni je poznać.
|
|
|
|