Laskentaklusteri Ukko
Tietojenkäsittelytieteen laitoksen laskentaklusteri, Ukko, on kaikkien laitoksen käyttäjien käytettävissä. Lista laskentasolmuista, niiden tilasta ja kuormasta on nähtävissä osoitteessa http://www.cs.helsinki.fi/u/ukko/hpc-report.txt. Yhteisessä käytössä olevat solmut ovat käytettävissä laitoksen käyttäjätunnuksilla, kuten laitoksen yleiskäyttöiset palvelimetkin.
Solmut on nimetty alkaen nimestä ukko001.hpc.cs.helsinki.fi päättyen nimeen ukko240.hpc.cs.helsinki.fi. Solmuja pääsee käyttämään yliopiston verkosta ja yliopiston OpenVPN tunnelointipalvelusta ssh-asiakkaalla.
Joskus uudet ohjelmistopäivitykset edellyttävät klusterisolmujen uudelleenkäynnistystä. Uudelleenkäynnistykset tehdään arkipäivisin klo 12-16 solmu kerrallaan viiden minuutin välein siten, että ainoastaan muutama solmu on poissa käytöstä yhtä aikaa. Solmun uudelleenkäynnistys voi joissain tilanteissa kestää kauemmin kuin 5 minuuttia. Solmujen uudelleenkäynnistyksessä käytetään seuraavaa aikataulua:
- solmut alkaen solmusta ukko001 ja päättyen solmuun ukko048 käynnistetään uudelleen maanantaisin
- solmut alkaen solmusta ukko048 ja päättyen solmuun ukko096 käynnistetään uudelleen tiistaisin
- solmut alkaen solmusta ukko097 ja päättyen solmuun ukko144 käynnistetään uudelleen keskiviikkoisin
- solmut alkaen solmusta ukko145 ja päättyen solmuun ukko192 käynnistetään uudelleen torstaisin
- solmut alkaen solmusta ukko193 ja päättyen solmuun ukko240 käynnistetään uudelleen perjantaisin
Solmujen uudelleenkäynnistysaikataulu on nähtävissä myös hpc-report sivulta. Jos sinulla on käynnissä töitä, jotka solmujen uudelleenkäynnistys katkaisisi, ota yhteyttä osoitteeseen itsupport@cs.helsinki.fi, jotta uudelleenkäynnistykset voidaan peruuttaa ja suorittaa myöhemmin.
Solmuja voidaan myös varata erityistarkoituksiin, jolloin vain erikseen sallitut käyttäjät pääsevät niille. Mikäli haluat varata yhden tai useampia solmuja, ota yhteyttä laitoksen tietotekniikkaryhmään.
Matlab on käytettävissä kaikissa klusterisolmuissa.
Klusterissa on 240 Dell PowerEdge M610 -korttipalvelinta. Jokaisessa on 32 gigatavua keskusmuistia ja kaksi neliytimistä Intel Xeon E5540 -suoritinta. Koska ytimet tukevat HyperThreading-tekniikkaa, jokaisessa laskentasolmussa voidaan ajaa yhteensä 16 säiettä samanaikaisesti. Solmut on kytketty toisiinsa ja Internettiin kahdella yhteenliitetyllä (bonded) 10Gbit/s verkkoliitännällä.
Klusterisolmuissa on käytettävissä tiedostojako /cs/ukko, johon voidaan pyynnöstä tehdä ryhmille ja käyttäjille alihakemistoja ja josta otetaan säännölliset varmistuskopiot. Kaikkien käyttäjien käytettävissä on hakemisto /cs/ukko/scratch, jota ylläpito ajoittain siivoaa! Älä siis unohda /scratch hakemistoon tiedostoja, joiden haluat säilyvän. Tilaa on käytettävissä 239G käyttäjää kohden (soft quota) ja tilapäisesti 477G (hard quota). Käyttäkää vain sen verran tilaa kuin tarvitsette ja muistakaa siivota tiedostonne pois kun ette niitä enää tarvitse! Tällä hetkellä tilaa on yhteensä käytössä vain 2 teratavua (tarvittaessa levytilaa voidaan myös lisätä).
Klusterisolmuissa on 1. joulukuuta 2011 lähtien oletusarvoisesti käytössä rajoitukset prosessien muistinkäytölle (30 GiB eli 30*1024*1024*1024 tavua) ja prosessien lukumäärälle (256). Linuxin komentoriviltä näitä rajoituksia voi säätää komennoilla ulimit -v ja ulimit -u ja rajoitukset voi myös ottaa kokonaan pois käytöstä. Rajoitusten tarkoituksena on vaikeuttaa klusterisolmujen kaatamista vahingossa; tahallaan sen voi tehdä edelleen mainiosti, joten harkitse solmun varaamista kokonaan omaan käyttöösi ennen rajoitusten poistamista.
Ehdotuksia klusteriympäristön edelleen kehittämiseksi voi esittää TKTL:n ylläpitoryhmälle. Valitettavasti klusterilla ei ole nimettyä ylläpitäjää, joten resurssimme eivät välttämättä riitä kaikkien hyvienkään ehdotusten toteuttamiseen.
Klusteriympäristöön tullaan jossain vaiheessa lisäämään mahdollisuus KVM-virtuaalikoneiden asennukseen ja käyttöön.