Rokkarin asenteella syöpää vastaan

Tämä on kertomus tietojenkäsittelijänä aloittaneesta ja sittemmin bioinformatiikan maisteriohjelmaan jämähtäneestä ikuisuusopiskelijasta, Riku Kataisesta, joka tarttui sattumalta itseään suurempaan haasteeseen. Alkujaan Veli Mäkisen SuDS-ryhmässä Kumpulassa tutkijanuransa aloittanut hevi-klišee loikkasi Meilahteen Lauri Aaltosen syöpägenetiikan tutkimusryhmään. Pääasiallisena toimenkuvana oli laatia visualisointi- ja analyysiohjelma geneettiselle sekvenssidatalle, jolla olisi mahdollista löytää geenivirheitä syöpäpotilaista. Vaikka ohjelman luominen ylitti alkuvaiheissa haastavuudessaan kaikki sietokyvyn rajat, ei vaivannäkö mennyt hukkaan. Antaa Rikun kertoa, mitä oikein tapahtui.

Sattuman ohjaamana

Noin kaksi vuotta sitten ryhdyin SuDS-ryhmässä ohjelmoimaan Javalla kevyttä käyttöliittymää, jolla oli tarkoitus visualisoida ryhmämme algoritmin toimintaa koskien geneettistä dataa. Tuotos sattumalta muistutti järjestelmää, jollaista Aaltosen ryhmässä oltiin kaivattu ja jatkoin täten kehitystä biologisempaan suuntaan. Huomasin kuitenkin pian, että tarvitsen tutkijoita kertomaan minulle, mitä ominaisuuksia he tarvitsevat ja millä tavalla niiden tulisi toimia. Siirryin Biomedicumiin nykyisen ryhmäni pariin työstämään ohjelmaa, joka mahdollisti jatkuvan vuorovaikutuksen ohjelman loppukäyttäjien kanssa.

Aluksi ajattelin, että tämähän on täydellinen tilanne ohjelman kehittäjälle, mutta kävi hyvin nopeasti ilmi, että olin tunkenut lusikkani supermassiiviseen soppakattilaan. Ei riittänyt, että biologisen datan käsittely vilisi poikkeustapauksia, eikä se, että käyttöliittymän suunnittelu, toteutus ja testaus vaatisi vähintään keskikokoisen työryhmän, vaan näiden lisäksi datamäärät kymmenenkertaistuivat heti siirtymiseni jälkeen useisiin gigatavuihin per näyte. Olin päättänyt, että ohjelmalla olisi mahdollista visualisoida useita näytteitä samanaikaisesti ja sen tulisi vielä toimia nopeasti tavallisella pöytäkoneella ja yhdellä gigalla muistia, joten nerokkaille koodi-inspiraatioille oli suuri tarve. Onneksi uusi ryhmä oli täynnä inspiroivaa, älykästä ja iloista väkeä, joiden parissa luomistyön vaikeudet jaksoi kantaa vaikka vasemmalla kädellä, eikä inspiraatioitakaan tarvinnut kauaa odottaa.

Mihin oikein ryhdyinkään...

Ohjelmointikokemusta olin kartuttanut Velin ryhmässä noin kaksi vuotta Java-kurssien lisäksi, joten aivan tyhjän päältä ei tarvinnut ponnistaa. Bioinformatiikan maisteriohjelmassa opitut asiat olivat myös erittäin tärkeässä asemassa, jotta ymmärtäisin tutkijoiden tarpeet ja taustalla piilevät biologiset ongelmat.

Halusin ensisijaisesti luoda käyttäjälle intuitiivisen, selkeän ja ennen kaikkea nopeasti reagoivan käyttöliittymän, jotta tutkijan flow ei karkaisi liiallisen odottelun vuoksi. Päätökseni tehdä ohjelma läppärilläkin toimivaksi asetti rajoitukset muistinkäytön ja laskentatehon suhteen. Näiden datamäärien kanssa oli selvää, että muistiin ei voinut ladata kuin murto-osa koko datasta, joten tiedostohaut tuli toteuttaa erittäin nopeaksi reaaliaikaisuuden illuusion ylläpitämiseksi. Käytännössä käyttäjän zoomatessa kromosomi- tasolta lähemmäksi sekvenssiä, ohjelma hakee ainoastaan tarpeellisen (ruudulla näkyvän) osan tiedostoista muistiin. Esimerkiksi kaikista lähin zoomaus näyttää ruudun alalaidassa DNA-sekvenssin, jonka haen 3GB:n genomitiedostosta käyttäjän liikkeiden mukaan. Parhaimmillaan ohjelma hakee samanaikaisesti tietoa geeni-annotaatio-, DNA-sekvenssi-, variaatio- ja readitiedostoista ja piirtää kaiken tiedon ruudulle. Tiedostomäärä kasvaa tietenkin käyttäjän avatessa useampia näytteitä. Esimerkiksi sadalla näytteellä ohjelman tulee käsitellä yli 500GB datamäärää.

Mitä ohjelmalla tehdään?

Ohjelman pääasiallinen tarkoitus on geenivirheiden etsiminen sairastuneiden ihmisten genomista. Tätä varten ohjelma tarjoaa välineet usean (Suurimmassa datasetissämme on 86 näytettä) potilaan yhtäaikaiseen vertailuun. Ohjelma laskee variaatioiden aiheuttamat aminohappomuutokset ja mahdollistaa erilaisten filtterien, sekä kontrollien käytön. Ohjelmaan voi lisätä myös BED-tiedostoja, joihin voi sisällyttää omia kiinnostavia alueita tai vaikka ekspressiodataa.

Mistä näytteet ohjelmaan?

Ohjelmalla avataan potilaiden DNA-sekvenssidataa, joka on eristetty verestä tai kudosnäytteestä. DNA-sekvenssi luetaan analyysilaitteella pienissä pätkissä ja tuloksena saadaa tiedosto, jossa on miljoonia sekvenssipätkiä/readeja pituudeltaan noin 50-150 emästä. Tämän jälkeen readit linjataan ihmisen referenssigenomiin, joka kertoo eroavaisuudet (mahd. mutaatiot) potilaan ja referenssin välillä. Ohjelmalla avataan tiedosto, joka sisältää tarvittavat tiedot variaatioista ja readeista.

Intensiivisen kynsienpurennan, hiustenrevinnän ja kiroilun lomassa onnistuin viemään projektia hiljalleen eteenpäin ja suurimmat inspiraatiot syntyivät, omituista kyllä, luovassa maanantaikohmelossa. Saatoin saada villin idean, jota seurasi viiden tunnin taukoamaton naputtelu. Ympärillä oleva hälinä ei rekisteröitynyt aivoihin, kunnes koodin toimivuuden huomattuani nostin käteni pystyyn ja huusin voimasanoin ilon parahduksia ja tarpeetonta itseylistystä. Tällaisia lähes uskonnollisia hetkiä olen kokenut noin kolme ja ne ovat mahdollistaneet koko ohjelman olemassaolon tänä päivänä.

Mitä nyt?

Nyt ohjelmani, työnimeltään RikuRator, on tutkimuskäytössä ja se on näyttänyt voimansa geenivirheiden löytämisessä. Seuraava etappi onkin ohjelman virallinen julkaisu, joka tapahtuu toivottavasti vielä tänä syksynä. Olen matkan varrella oppinut Aaltosen ryhmässä paljon syöpägenetiikan tutkimuksesta ja saankin piakkoin oman kohteeni kilpirauhaskasvaimiin liittyen, josta toivottavasti riittää materiaalia aina väitöskirjaan asti. Olen ollut onnekas saadessani toteuttaa omaa kunnianhimoani ja luovuuttani Velin ja Laurin ryhmissä, vaikka olen itse välillä ollut skeptinen oman visioni toteutusmahdollisuuksista. Usko ja kärsivällisyys on nyt hetkellisesti palkittu, mutta saapahan nähdä, mihin sfääreihin seuraava teknologinen askel Riku-paran vie.

RikuRator

RikuRatorin esittelyvideo Youtubessa (suosittelemme 720p tarkkuutta ja uuden ikkunan avaamista)

English

Luotu

07.09.2011 - 12:42

Tietojenkäsittelytieteen opiskelija Petteri Timonen palkittiin tiedekilpailussa Yhdysvalloissa

Petteri Timonen, 19, on sijoittunut toiseksi omassa sarjassaan Intel International Science and Engineering Fair (ISEF) -tapahtumassa Phoenixissa, Arizonassa.

Tietojenkäsittelytiedettä Helsingin yliopistossa opiskeleva Petteri Timonen palkittiin perjantaina 13.5. Arizonassa 1500 Yhdysvaltain dollarin eli noin 1330 euron arvoisella stipendillä Systems Software -kategoriassa Intel ISEF -tiedekilpailussa.

Timosen kilpailutyö on SPR:n Veripalvelulle kehitetty ohjelmistotyökalu, jolla liikkuvat verenkeräystilaisuudet eri puolilla maata saadaan suoritettua mahdollisimman kustannustehokkaasti. Timonen toteutti työnsä yhteistyössä Veripalvelun kanssa.

Työ on saanut laajemminkin kansainvälistä huomiota, sillä vastaava työkalua ei tiettävästi ole kehitetty muualla. Timonen on käynyt sähköpostikeskusteluja myös Yhdysvaltain Punaisen Ristin kanssa.

Renewed Carat App Gives a Smart Boost to Battery

The Carat Project Team at the University of Helsinki, Department of Computer Science, has published a new version of the popular mobile energy-awareness application.

After launch in June 2012, Carat has helped over 850,000 users, of which 41 per cent have been Android and 59 per cent iOS users, respectively. The new user interface follows modern application design guidelines and presents battery information in a more intuitive and easy to use manner.

- In addition to the new user interface, we have increased the accuracy of the energy saving recommendations of Carat, says Professor Sasu Tarkoma, the leader of this research done at the university.

The user interface features the number of energy intensive applications (Hogs), energy anomalies (Bugs) and user recommendations (Actions) at a glance on the main screen as well as global energy statistics for the device community.

Lainaa vain? - väitös musiikkiesitysten lainakappaleiden tunnistamisesta

Miksi musiikkiesitysten lainakappaleiden automaattinen tunnistaminen on niin vaikeaa kuin se on, kysyy Helsingin yliopistossa aiheesta väittelevä Teppo E.Ahonen.

Lainakappeleiksi kutsutaan musiikkiesityksiä, jotka ovat eri esittäjän tekemiä uusia tulkintoja kappaleen alkuperäisen esittäjän tekemästä versiosta. Lainakappaleet voivat olla hyvinkin samanlaisia alkuperäisversioiden kanssa, ja joskus versioilla on vain nimellisesti yhtäläisyyksiä.

Ihmisille lainakappaleiden tunnistaminen on yleensä helppoa, jos alkuperäisesitys on tuttu.

- Lainakappaleiden automaattinen, algoritmeihin perustuva tunnistaminen, on kuitenkin huomattavan haastava ongelma, eikä täysin tyydyttäviä ratkaisuja ole vielä esitetty, sanoo Teppo E. Ahonen, joka katsoo, että ongelman ratkaisulla olisi tutkimuksellisesti ja kaupallisesti potentiaalisia sovelluskohteita; sellainen olisi esimerkiksi plagioinnin automaattinen tunnistaminen.

Hae opiskelijaksi tietojenkäsittelytieteen laitokselle! Yhteishaku 16.3.-6.4.2016

Hae opiskelijaksi mm. huippulaatuisista kandiohjelmista palkitulle tietojenkäsittelytieteen laitokselle!

Tietojenkäsittelytieteen LuK-tutkinnossa opitaan niitä taitoja, joilla vaikutetaan tulevaisuudessa sekä työelämässä että tieteen tekemisessä. Tutkinnon pääpaino on ohjelmoinnissa ja ohjelmistojen kehittämisessä nykyaikaisilla menetelmillä, mutta tutkintoon sisältyy myös muita tulevaisuuden kannalta tärkeitä alueita, kuten tietoliikennettä, tekoälyä ja tietoturvaa sekä ihmisen ja koneen vuorovaikutusta.

Osoite: Tietojenkäsittelytieteen laitos, PL 68 (Gustaf Hällströmin katu 2b), 00014 Helsingin yliopisto
Aukioloajat: Normaalisti syys- ja kevätlukukausien aikana ma - pe klo 7.45-19.45.
Puhelin: 0294 1911 (yliopiston vaihde)
Sähköposti: Palveluosoitteet
Faksi: 09 876 4314

Kirjaudu sivulle | Webmaster

Department of Computer Science [pre 2018 site]

Helsingin Yliopisto

Matemaattis-luonnontieteellinen tiedekunta