Kursplan för Biostatistik

Biostatistics

Basdata

Kurskod: 4BI085
Kursens namn: Biostatistik
Högskolepoäng: 6
Utbildningsform: Högskoleutbildning, 2007 års studieordning
Huvudområde: Biomedicin
Nivå: AV - Avancerad nivå
Betygsskala: Underkänd (U), godkänd (G) eller väl godkänd (VG)
Kursansvarig institution: Institutionen för medicinsk epidemiologi och biostatistik
Beslutande organ: Programnämnd 7
Datum för fastställande: 2011-11-25
Reviderad av: Programnämnd 7
Senast reviderad: 2015-11-09
Kursplanen gäller från: Vårtermin 2016

Särskild behörighet

Kandidat- eller yrkesexamen om minst 180 hp inom biomedicin, bioteknik, cell- och molekylärbiologi, medicin eller motsvarande examen. Dessutom krävs Engelska B/Engelska 6 med lägst betyget godkänd/E.

Mål

Kursens syfte är att ge studenterna kännedom om statistiska begrepp samt verktyg för att relatera biologiska utfall med möjliga förklarande variabler. Metoder för två olika tillämpningsområden behandlas: 1) klassisk statistisk modellering, där man har relativt få förklarande variabler samt förhållandevis många objekt vilket leder till olika typer av multivariat regression och konventionella experimentella och observationsstudier; 2) övervakat och oövervakat statistiskt lärande när det finns många fler förklarande variabler än objekt, vilket leder till passande prediktions- och klassificeringsalgoritmer för högdimensionella data, vilket är vanligt inom bioinformatik, och lämpliga för modern high-throughput data. I slutet av kursen förväntas studenterna självständigt kunna analysera ett verkligt datamaterial utifrån ovanstående sammanhang.

Efter genomgången kurs ska studenten kunna:

Avseende kunskap och förståelse

  • förklara konceptet slumpmässig variation i biologiska företeelser samt beskriva hur den är relaterad till vetenskapliga observationsstudier och experimentella studier,
  • beskriva vilka statistiska metoder som är lämpliga för att kvantifiera slumpmässiga och systematiska effekter i biologiska data,
  • diskutera relevansen av multipla tester inom modern biologisk forskning,
  • diskutera skillnaden mellan förklarande och prediktiva modeller.

Avseende färdighet och förmåga

  • välja och anpassa multivariata regressionsmodeller av medelhög komplexitet genom att använda ett allmänt erkänt dataprogram,
  • välja och tillämpa elementära algoritmer från maskininlärning genom att använda ett allmänt erkänt skriptspråk,
  • förmedla statistiska resultat på ett sätt som lämpar sig för muntlig presentation, teknisk rapportering och vetenskaplig publicering,
  • förstå, diskutera och kritiskt utvärdera statistiska fynd av medelhög komplexitet i relevant vetenskaplig litteratur.

Avseende värderingsförmåga och förhållningssätt

  • uppvisa förmåga att väga ihop motstridiga empiriska bevis från litteraturen.

Innehåll

Kursens innehåll är uppdelat i tre separata block. Del 1 är en rekapitulering av elementärt statistiskt material. Del 2 behandlar klassiska multivariata regressionsmetoder och del 3 handlar om algoritmmetoder som är relevanta för high-throughput biologi och bioinformatik.

Del 1: Grundläggande begrepp och metoder
Slumpmässighet i biologiska observationer. Data från experiment och observationsstudier. Datatyper: nominala, ordinala och kontinuerliga variabler. Deskriptiva mått. Grafisk presentation. Sannolikhetsbegrepp. Sannolikhetsfördelningar. Parameterskattning: medelvärde, andel, kvot, standardavvikelse, standardfel. Begrepp inom statistisk inferens: konfidensintervall och hypotesprövning. Elementära parametriska hypotestest. Enkel linjär regression.

Del 2: Statistisk modellering och multivariata regressionsmetoder
Multipel linjär regression. Linjära modeller. Kontinuerliga och kategoriska prediktorer. Samspel (interaktioner). Modellanpassning och diagnostik. Generaliserade linjära modeller och logistisk regression. Överlevnadsanalys och Cox regressionsmodell.

Del 3: Modellering och klassifikation av högdimensionella data Massignifikansproblematik och feltyper. Kontroll av fel, inklusive upptäckt av falsk data. Feature selection. Avståndsmått och klustring av data. Klassifikations- och prediktionsalgoritmer. Validering och korsvalidering.

Arbetsformer

Undervisningen innefattar salsundervisning (föreläsningar, diskussioner) och praktiska övningar i mindre grupper (handledda räknestugor datorlaborationer och projektarbeten).

Examination

Examinationen består av skritflig tentamen samt skriftliga redovisningar av projektarbeten.

För att delta i tentamen krävs att alla skriftliga redovisningar är inlämnade.

Betyg på hel kurs är en sammanvägning av betyget på tentamen och redovisningarna.

Obligatoriskt deltagande
Närvaro krävs vid kursintroduktion, handledningstillfällen och grupparbeten. Kursledaren bedömer om och i så fall hur frånvaro kan kompenseras. Innan student deltagit i obligatoriska delar eller kompenserat frånvaro i enlighet med kursledarens anvisningar registreras inte studentens kursresultat i LADOK. För att få delta i den skriftliga sluttentamen krävs godkänt på samtliga obligatoriska moment.

Begränsning av antal prov- eller praktiktillfällen
De studenter som ej är godkända efter ordinarie provtillfälle har rätt att delta vid ytterligare fem provtillfällen. Om studenten genomfört sex underkända tentamina/prov ges inte något ytterligare tentamenstillfälle eller någon ny kursplats.

Som provtillfälle räknas de gånger studenten deltagit i ett och samma prov. Inlämning av blank skrivning räknas som provtillfälle. Provtillfälle till vilket studenten anmält sig med inte deltagit räknas inte som provtillfälle.

Övergångsbestämmelser

Efter varje kurstillfälle kommer det att erbjudas minst sex tillfällen för examination inom en 2-årsperiod efter kursens slut.

Övriga föreskrifter

Kursen ges på engelska.

Kursutvärdering kommer att genomföras enligt de riktlinjer som är fastställda av Styrelsen för utbildning.

Muntlig utvärdering, kursråd, kommer att genomföras under kursen.

Litteraturlista och övriga läromedel

Literature list

Extra litteratur utöver föreläsningsmaterial delas ut under kursen. Som förberedelse för kursen (speciellt del 1) rekommenderas följande (inte obligatoriska) böcker:

Suggested reading for recapitulating the basic material covered briefly in Part 1 - recommended for participants with little formal statistical training. Alternatives:

  • Bland, Martin, An introduction to medical statistics, 3. ed. : Oxford : Oxford University Press, 2000 - xvi, 405 s. ISBN: 0-19-263269-8 (hft.), LIBRIS-ID: 4603394, Chapters 1-11, 13-14,
  • Holm, Sture, Biostatistisk analys, 1. uppl. : Lund : Studentlitteratur, 2008 - 327 s. ISBN: 978-91-44-05378-3, LIBRIS-ID: 11173905, Omslagsbild, Chapers 1-6, 8,