Python for Data Science: Datan käsittely ja koneoppimisen perusteet

Kesto: 2.0 pv
Kurssin hinnoittelu

Tuotekuvaus

Tekniikka kehittyy, ja uusia työkaluja ja ratkaisuja on jatkuvasti saatavilla. Visuaalisten käyttöliittymien taakse kätkeytyy yleensä rajallinen määrä logiikkaa, mutta ohjelmoinnin osaaminen antaa sinulle vapaat kädet toteuttaa toiveesi!

Koulutuksen jälkeen osallistujat ymmärtävät ohjelmointitaitojen hyödyllisyyden ja ohjelmoinnin logiikkaa. Lisäksi osallistujat oppivat toteuttamaan mm. datan käsittelyä ja ennustavaa analytiikkaa ohjelmoiden ja tietenkin hyödyntämään Pythonia moninaisissa tilanteissa.

Ennakkoluulottomille tekijöille skriptipohjaiset työkalut tarjoavat käytännössä rajattomat mahdollisuudet kehittää omaa osaamistaan ja tehostaa myös muiden työtä.

 

Ensimmäisen päivän sisältö

Mikä Python on ja mitä sillä voi tehdä?

  • Keskeiset Python-ohjelmointiin liittyvät käsitteet
  • Miten dataa muokataan ja visualisoidaan?
  • Kirjastot (Pandas, Scikit Learn, Numpy)
  • Koneoppimisen perusteita
  • Datan valmistelu ja visualisointi
  • Hold-out menetelmä
  • Python harjoitukset:
    • Datarakenteet
    • Funktiot ja metodit
    • Indeksointi
    • Data operaatiot ja manipulaatiot
    • Datan visualisointi
    • Tilastollinen testaus
    • Ennustemallien toteutus (perusteet)

Toisen päivän sisältö

Mallintaminen & koneoppimisen perusteita

  • Ennustemallien yli- ja alisovittaminen
  • Ristiinvalidointi
  • Tulosten testaus ja validointi
  • Python harjoitukset:
    • Kertaus: Datan rakenteet ja datan manipulointi
    • Asiakaspoistuman ennustaminen
    • Auton hinnan ennustaminen
    • Tulosten yleistettävyyden ja hyvyyden arviointi
    • Indeksointi
  • DEMO: State-of-the-art menetelmät (Deep Learning, LSTM, Tensorflow)


Oma koulutus tai tapahtuma Oppia.fi:hin?

Ota yhteyttä!