Kognitiivinen mallintaminen II: Tilastollinen luonnollisen kielen käsittely

242
5
Ei erikoistumislinjaa
Muut opinnot
Tilastollisista menetelmistä on tullut 1990-luvun alkupuolelta lähtien ensisijainen lähestymistapa luonnollisen kielen aineistojen käsittelyyn. Tyypillisesti tilastolliset kielimallit pohjautuvat kompleksisuudeltaan eri tasoisiin symbolisiin kuvauksiin, ja niiden tarkoituksena on selvittää symbolisten analyysien monitulkintaisuutta sekä lisätä järjestelmien robustiutta. Kurssilla esitellään tilastollisen kielen käsittelyn tärkeimpiä menetelmiä ja sovelluksia (mm. n-gram -mallit, kätketyt Markov-mallit (HMM), probabilistiset kontekstittomat kieliopit (PCFG) ja tilastopohjaiset luokittelijat). Kurssi pohjautuu pääosin Manning & Schützen kirjaan Foundations of Statistical NLP. Kurssi suoritetaan osallistumalla aktiivisesti luennoille, palauttamalla viikoittaisten harjoitustehtävien ratkaisut ja läpäisemällä lopputentti.
Vuosi Lukukausi Päivämäärä Periodi Kieli Vastuuhenkilö
2012 syksy 06.09-11.10. 1-1 Suomi Jukka Toivanen