Vijenac 166

Informatika

Povratak u budućnost

Dešifriranje ljudskoga genoma i bioinformatika

Tehnološki je aspekt cijelog otkrića možda odveć ishitreno zanemaren, ili ocijenjen kao nedovoljno zanimljiv i atraktivan za široku javnost

Dešifriranje ljudskoga genoma i bioinformatika

Tehnološki je aspekt cijelog otkrića možda odveć ishitreno zanemaren, ili ocijenjen kao nedovoljno zanimljiv i atraktivan za široku javnost

Objava rezultata uspješnoga završetka prve faze projekta dešifriranja ljudskoga genoma svakako predstavlja jednu od prekretnica u razvoju čovječanstva u brojnim aspektima. Razmjerno važnosti tog upravo epohalnog otkrića objava je popraćena na odgovarajući način u medijima, koji su se usredotočili na medicinske, sociološke i pravne aspekte otkrića. Kao da se samo po sebi podrazumijeva da je za to otkriće korištena vrlo moćna tehnologija, tako da je taj aspekt cijelog otkrića možda odveć ishitreno zanemaren, ili ocijenjen kao nedovoljno zanimljiv i atraktivan za široku javnost.

Zajednička objava

Sama objava rezultata organizirana je u Bijeloj kući u Washingtonu pod pokroviteljstvom predsjednika SAD Billa Clintona, koji je uspio nagovoriti vodstvo dvaju konkurentskih istraživačkih timova da zajednički objave rezultate. Zanimljivo je da je prvi tim skupina akademskih istraživača iz osamnaest zemalja organiziranih u sklopu Projekta ljudskog genoma (Human Genome Project) imao za konkurente tim znanstvenika okupljenih u sklopu privatne tvrtke Celera Genomics. Istodobno je britanski premijer Tony Blair objavio otkriće u Londonu. No, od prigodnih govora u stručnom smislu bitno je zanimljiviji razgovor s dr. Craigom Venterom, vlasnikom tvrtke Celera Genomics, koji je emitirao CNN još trećeg lipnja ove godine.

Tom prigodom dr. Venter vrlo je nedvosmisleno istaknuo da je za uspjeh ne samo ovog nego i svi budućih projekata na području genetskih istraživanja od iznimne važnosti uspješna primjena raznih tehnoloških rješenja koja on u biti dijeli na dva osnovna segmenta. Prvi segment čine instrumenti koji fizički analiziraju neki genetski materijal — DNA sekvenceri. Za njihove potrebe tu vrstu instrumenata razvila je skupina stručnjaka pod vodstvom dr. Mike Hamplera iz PE Corp. Posebno valja istaknuti kako je riječ o praktično potpuno automatiziranim instrumentima ili, bolje rečeno, strojevima za analizu genetskoga materijala, koji su usavršeni do te mjere da je u tijeku izgradnja čitave tvornice u kojoj će biti postavljeno na stotine takvih strojeva, čime će se istraživanja dramatično ubrzati. Prema dr. Venteru tvornica će u roku od 24 sata producirati oko stotinu milijuna slova genetskoga koda, u usporedbi s trenutačnim mogućnostima u svijetu, koje se kreću oko šesto milijuna slova genetskoga koda godišnje, čime se isti posao koji je do sada trajao godinu dana može obaviti za tjedan dana.

Nužnost dodatne obuke

Drugi su segment tehnoloških rješenja svakako računalne tehnologije. Dr. Venter smatra kako je za dalji napredak od iznimne važnosti provedba dodatne obuke znanstvenika kako bi što vještije rabili računalne tehnologije u istraživanjima, čime se prema njegovu mišljenju mogu uštedjeti godine bezuspješnih pokušaja u laboratorijima. Konkretno, prema iskustvima stečenim tijekom rada u Celera Genomics, pokazalo se da su predviđanja do kojih se došlo pomoću računala bila iznimno točna, čime se u metodološkom smislu cijeli posao organizira tako da se u laboratoriju eksperimentalno potvrđuju samo one hipoteze za koje analiza na računalu pokaže veliku vjerojatnost da će biti točne. O uspješnosti pristupa možda najbolje govori činjenica da je istraživački tim organiziran ipak u sklopu privatne tvrtke uspio mapirati 99 posto ljudskoga genoma u usporedbi s međunarodnim timom u sklopu Projekta ljudskog genoma koji je uspio mapirati 97 posto.

Produkcija genetskoga koda je prema dr. Venteru bez obzira na kompleksnost njezine tehnologije u biti postala trivijalan posao. Ono što je pravi izazov interpretacija je upravo enormnih količina podataka koje nastaju kao rezultat tog posla, koja je dakako nužna kako bi se svi ti podaci praktično iskoristili u cilju iznalaženja načina liječenja za razne bolesti. U sklopu pitanja interpretacije podataka dr. Venter posebno naglašava kako se u ovom trenutku čini praktično nepremostivim problem modeliranja interakcije među pojedinim stanicama u ljudskom organizmu, koji proizlazi iz činjenica da se ljudski organizam sastoji od stotinjak trilijuna različitih stanica, pri čemu svaka ima oko tri i pol milijarde slova pripadajućega genetskog koda, odnosno koristi različit skup od oko osamdeset tisuća gena. Zbog svega toga dr. Venter upozorava na oprez pri prognoziranju relativno brza pronalaženja načina liječenja brojnih smrtonosnih bolesti.

Informacija kao proizvod

Pokuša li se sagledati u cjelini sve što je iznio dr. Venter, nemoguće je oteti se dojmu kao se Celera Genomics doima poput neke vrste specijalizirane informatičke tvrtke, jer je njezin konačni proizvod zapravo informacija.

Sve spomenute metode i postupci koji se odnose na primjenu računalnih tehnologija u sklopu genetskih istraživanja u Celera Genomics pripadaju u posebno područje računalnih znanosti koje se naziva bioinformatika. Bioinformatika se bavi iznalaženjem tehnoloških rješenja koja su potrebna u sklopu istraživanja bioloških sustava općenito, što je daleko šire područje od spomenute potpore genetskim istraživanjima. U biti se bez obzira na konkretno istraživanje rješava nekoliko temeljnih problema.

Prvi od tih problema svakako je problem pohrane golemih količina podataka koji stižu s raznih instrumenata za obradu biološkoga materijala, čiji je razvoj nerijetko dosegnuo visok stupanj automatizacije, kao što je to primjer sa spomenutim DNA sekvencerima, koji kao rezultat analize koju su u stanju permanentno provoditi produciraju velike količine podataka. U uskoj vezi s problemom pohrane podataka svakako je realizacija indeksnih struktura podataka prijeko potrebnih ne samo za dohvat određenih podataka po zadanom kriteriju, nego ponajprije za vrlo kompleksne analize kakve se primjerice provode u sklopu genetskih istraživanja. Problemi analize podataka odnose se često na problem iznalaženja ponavljajućih nizova vrijednosti koje su dobivene kao rezultat analize biološkog materijala.

Drugi vid analize poznat je pod nazivom data mining u sklopu kojeg se primjenom posebnih algoritama pokušavaju ustanoviti relativni odnosi između spomenutih vrijednosti. Riječ je o vrlo kompleksnim analizama jer se istodobno mora analizirati velika količina podataka, tako da se primjenjuju posebna brza računala i razne vrste algoritama u koje se pokušava ne neki način ugraditi što više praktičnih spoznaja ako bi se cijeli postupak analize sveo u prihvatljive okvire što se tiče vremena potrebna za analizu.

Veliki pomak

Za ilustraciju veličine problema s obzirom na potrebne računalne resurse može se navesti rješenje korišteno tijekom projekta ljudskoga genoma, kada je nekoliko brzih računala, koja su među najbržima na svijetu, lociranih u vjerojatno najopremljenijim istraživačkim centrima u SAD (ORNL Center for Computational Sciences, LBNL National Energy Research Scientific Computing Center i ANL Center for Computational Sciences), povezano u mrežu tvoreći tako sustav za distribuiranu obradu, pri čemu svako od tih vrlo moćnih računala obavlja tek jedan dio postupka analize podataka. Na kraju ostaje problem vizualizacije podataka preko određenoga grafičkog sučelja, u sklopu kojeg se pokušava naći kompromis između fizičkih ograničenja uređaja i medija za vizualizaciju podataka i činjenice da takav prikaz istodobno bude koristan u praktičnom smislu.

Objavljeni rezultati iz područja genetskih istraživanja koji se odnose na analizu ljudskoga genoma veliki su pomak i za računalne znanosti. Posebno je povoljno da uspješna primjena računala postaje neizbježna za uspješno napredovanje u istraživanjima uz minimalan utrošak ne samo vremena nego i laboratorijskih resursa. O važnosti rezultata istraživanja gotovo da je suvišno posebno i govoriti, tako da se može očekivati znatno izdašnija potpora — koja je svršetkom hladnoga rata zapravo izostala — istraživanjima i na području informatike i računalnih znanosti općenito. Sigurno je da će se brojni rezultati do kojih će se doći u sklopu tih istraživanja vrlo uspješno moći iskoristiti i za brojna druga područja primjene računalnih tehnologija.

Na Internetu je raspoloživa velika količina informacija o projektu ljudskoga genoma i bioinformatici. Kao polazna osnova za dalje istraživanje toga područja na Internetu mogu poslužiti sljedeće hiperveze:

http://www.cnn.com/SPECIALS/2000/ genome/story/interviews/venter.html

http://www.celera.com

http://www.ornl.gov/TechResources/ Human_Genome/home.html

Pored navedenih hiperveza kao posebnu zanimljivost svakako valja spomenuti da su US Department of Energy — Office of Energy Research i Office of Health end Environment Research izdali vrlo kvalitetan kratak uvodni materijal u područje molekularne genetike, Primer on Molecular Genetics, u elektronskom obliku, koji je raspoloživ preko sljedeće hiperveze:

http://www.ornl.gov/hgmis/publicat/ primer/intro.html

Slaven Batnožić

Vijenac 166

166 - 13. srpnja 2000. | Arhiva

Klikni za povratak