Course syllabus

Kurs-PM

TIF385 Bayesiansk inferens och maskininlärning lp2 HT22 (6 hp)

Kursen ges av institutionen för Fysik

 

Kontaktuppgifter

Föreläsare och examinator

Räkneövningsledare

Kursutvärderare

Kursens syfte

Kursen bygger på fundament från en första grundkurs i matematisk statistik och syftar till att ge kunskaper om Bayesiansk inferens, både generellt och i sammanhang som involverar modellering av fysikaliska system, samt en djupare förståelse för modern maskininlärning. Dessa kunskaper skall ge en stabil grund för praktisk tillämpning av statistiska modeller.

Kursen är delvis projektbaserad och ett delsyfte är att utveckla och strukturera datorprogram för att utföra statistisk inferens och maskininlärning med vetenskapliga tillämpningar. Mer specifikt kommer fysikrelevanta projektuppgifter att utföras med programmeringsspråket Python i kombination med användbara, och fritt tillgängliga, programbibliotek.

 

Schema och veckoplanering

Aktuellt schema i TimeEdit

Se även Veckoplanering.

 

Kurslitteratur

Kompendium: "Bayesian inference and machine learning" av Christian Forssén och Andreas Ekström. Detta kompendium publiceras som en Jupyter book under en Creative Commons BY-NC licens.

Kurskompendiet är bland annat baserad på följande böcker som utgör referenslitteratur:

  • Christopher M. Bishop, "Pattern recognition and machine learning", Springer (2006).
  • Phil Gregory, “Bayesian Logical Data Analysis for the Physical Sciences”, Cambridge University Press (2005).
  • Geoffrey R. Grimmett and David R. Stirzaker, "Probability and random processes", Oxford University Press (2020). 
  • T. Jaynes, “Probability Theory: The Logic of Science”, Cambridge University Press (2003).
  • David J.C. MacKay, “Information Theory, Inference, and Learning Algorithms”, Cambridge University Press (2005).
  • Kevin P. Murphy, "Probabilistic Machine Learning", MIT Press (2012).
  • D.S. Sivia, “Data Analysis : A Bayesian Tutorial”, Oxford University Press (2006).

varav böckerna av Gregory, Jaynes, Murphy och Sivia finns som e-böcker på Chalmers bibliotek.

 

Kursens upplägg

Lärarledda aktiviteter

  • Föreläsningar med demonstrationsövning: teorigenomgång med exempel, diskussionsuppgifter, demonstration av problemlösning i helklass.
  • Övningar: demonstrationsövning samt självverksamhet med handledning. 
  • Datorhandledning: Självverksamhet med handledning. Demonstration i storgrupp vid behov.

Egna läraktiviteter

  • numeriska projekt
  • rekommenderade uppgifter (lärplattformen Yata)
  • rekommenderade koduppgifter (lärplattformen Yata)

Vi kommer att jobba med Python främst via Jupyter Notebooks. För att förse varje student med en enhetlig programmeringsmiljö ber vi alla kursdeltagare att installera JupyterLab enligt givna instruktioner.

 

Lärandemål

Efter fullgjord kurs ska studenten kunna:

  • utföra vetenskaplig modellering av fysikaliska system genom att tillämpa det Bayesianska paradigmet för inferens från data.
  • redogöra för grundläggande koncept inom Bayesiansk statistik.
  • förklara centrala aspekter hos Monte Carlo-metoder och Markovkedjor, samt tillämpa dessa för att numeriskt sampla multivariata sannolikhetsfördelningar.
  • förstå och numeriskt implementera flera grundläggande algoritmer som används inom dataanalys och maskininlärning, som linjära regressions- och klassificeringsmetoder samt enkla neurala nätverk.
  • använda python för praktisk tillämpning av statistiska inferensmetoder och maskininlärning för vetenskapling dataanalys, samt för att visualisera resultat.
  • skriva välstrukturerade tekniska rapporter där resultat och slutsatser från en vetenskaplig dataanalys presenteras klart och tydligt samt med ett kritiskt förhållningssätt. 
  • tillämpa ett vetenskapligt och etiskt arbetssätt i processen att samla in, utvärdera och analysera data samt skriva datorprogram, med ett särskilt beaktande av jämställdhet, likabehandling och mångfald.

 

Examination

  • Skriftlig salstentamen (betygsskala TH). Tillåtna hjälpmedel: Mathematics Handbook (BETA). Tentamen består av uppgifter av problemlösnings- och teorikaraktär, och ger maximalt 60 poäng.
  • Numeriska projekt (betygsskala UG). Examineras i datorsal.
  • Obligatorisk föreläsning om "Data bias" och "Fairness" i läsvecka 7.

Betygsgränser

Slutbetyget bestäms av den totala poängen enligt följande:

  • För att bli godkänd på kursen krävs godkända numeriska projekt samt minst 24 poäng på tentamen.
  • Betygsgränser:
    24-35 poäng ger betyg 3,
    36-47 poäng ger betyg 4,
    48+ poäng ger betyg 5.

Uppsamlingstillfällen för redovisning av numeriska projekt äger rum i samband med omtentamensperioderna i april och augusti.

Länk till kursplanen i Studieportalen (med tentamensdatum): Studieplan

Course summary:

Date Details Due