Strojové učení - úvod, regrese  27. října 2020

Materiály

Nejste účastníkem kurzu
Pro zápis do kurzu se nejprve přihlašte a následně použijte tlačítko v přehledu kurzu.

Domácí projekty

0.

Prohlédni si obrázek níže a rozmysli si odpovědi na následující otázky. Nic neprogramuj, ale zkus své myšlenky sepsat - na začátku další hodiny se o tom pobavíme a poté vše společně naprogramujeme.

ryby

Data obsahují údaje o rybách. Druh, váhu, rozměry (délek je více, jsou měřeny různě napříč rybou). Cílem je predikovat váhu ryby. (Váha se rozbila, ale metr a počítač máme.)

Rozmysli si:

  • Které sloupečky využijeme?
  • Co budou příznaky (vstupní proměnné) a co výstup modelu?
  • Jsou tam nějaké hodnoty, které budeme chtít použít a nejsou to čísla? Co s nimi uděláme?
  • Jakou použijeme metriku?
  • Jak zjistíme, zda nám model rozumně funguje?
  • Popiš celý proces, který budeš muset udělat (od načtení dat po zhodnocení výsledku).
1.

Podívej se na notebook excercise.ipynb a datový soubor population.csv (Možná už máš obojí stažené spolu s ostatními materiály z hodiny. Pokud ne, notebook a data ulož do stejného adresáře). V notebooku je vypracovaná úloha predikce počtu obyvatel v závislosti na velikosti oblasti/města. Naučený model (krabička) ale počet obyvatel často podhodnocuje.

Prohlédni si řešení v notebooku a zkus přijít na to, co je v na něm špatně. Nehledej chyby v kódu, spíše si prohlédni obrázky, případně data, a podívej se, co se mohlo stát. Své nápady sepiš.