Kursplan för Biostatistik, uppdragsutbildning
Biostatistics, Contract Education
Basdata
Särskild behörighet
Kandidat- eller yrkesexamen om minst 180 högskolepoäng inom biomedicin, bioteknik, cell- och molekylärbiologi eller medicin.
Mål
Kursens syfte är att ge studenterna kännedom om statistiska begrepp samt verktyg för att relatera biologiska utfall med möjliga förklarande variabler. Metoder för två olika tillämpningsområden behandlas: a) klassisk statistisk modellering, där man har relativt få förklarande variabler samt förhållandevis många objekt vilket leder till olika typer av multivariat regression och konventionella experimentella och observationsstudier; b) övervakat och oövervakat statistiskt lärande när det finns många fler förklarande variabler än objekt, vilket leder till passande prediktions- och klassificeringsalgoritmer för högdimensionella data, vilket är vanligt inom bioinformatik, och lämpliga för modern high-throughput data. I slutet av kursen förväntas studenterna självständigt kunna analysera ett verkligt datamaterial utifrån ovanstående sammanhang. Efter genomgången kurs ska studenten kunna: Kunskaper och förståelse - förklara konceptet slumpmässig variation i biologiska företeelser samt beskriva hur den är relaterad till vetenskapliga observationsstudier och experimentella studier, - beskriva vilka statistiska metoder som är lämpliga för att kvantifiera slumpmässiga och systematiska effekter i biologiska data, - diskutera relevansen av multipla tester inom modern biologisk forskning, - diskutera skillnaden mellan förklarande och prediktiva modeller. Tillämpad kunskap och förståelse - välja och anpassa multivariata regressionsmodeller av medelhög komplexitet genom att använda ett allmänt erkänt dataprogram, - välja och tillämpa elementära algoritmer från maskininlärning genom att använda ett allmänt erkänt skriptspråk, - förmedla statistiska resultat på ett sätt som lämpar sig för muntlig presentation, teknisk rapportering och vetenskaplig publicering, - förstå, diskutera och kritiskt utvärdera statistiska fynd av medelhög komplexitet i relevant vetenskaplig litteratur. Göra bedömningar - uppvisa förmåga att väga ihop motstridiga empiriska bevis från litteraturen.
Innehåll
Kursens innehåll är uppdelat i tre separata block. Del 1 är en rekapitulering av elementärt statistiskt material. Del 2 behandlar klassiska multivariata regressionsmetoder och del 3 handlar om algoritmmetoder som är relevanta för high-throughput biologi och bioinformatik. Del 1: Grundläggande begrepp och metoder Slumpmässighet i biologiska observationer. Data från experiment och observationsstudier. Datatyper: nominala, ordinala och kontinuerliga variabler. Deskriptiva mått. Grafisk presentation. Sannolikhetsbegrepp. Sannolikhetsfördelningar. Parameterskattning: medelvärde, andel, kvot, standardavvikelse, standardfel. Begrepp inom statistisk inferens: konfidensintervall och hypotesprövning. Elementära parametriska hypotestest. Enkel linjär regression. Del 2: Statistisk modellering och multivariata regressionsmetoder Multipel linjär regression. Linjära modeller. Kontinuerliga och kategoriska prediktorer. Samspel (interaktioner). Modellanpassning och diagnostik. Generaliserade linjära modeller och logistisk regression. Överlevnadsanalys och Cox regressionsmodell. Del 3: Modellering och klassifikation av högdimensionella data Massignifikansproblematik och feltyper. Kontroll av fel, inklusive upptäckt av falsk data. Feature selection. Avståndsmått och klustring av data. Klassifikations- och prediktionsalgoritmer. Validering och korsvalidering.
Arbetsformer
Undervisningen består av salsundervisning (föreläsningar, diskussioner) och praktiska övningar i mindre grupper (handledda räknestugor datorlaborationer och projektarbeten). Kursen avslutas med en skriftlig tentamen.
Examination
Skriftlig examination. Studenterna kommer att tilldelas ett miniprojekt efter varje kursavsnitt. Inlämnade av de tre projektarbetena med godkänt resultat krävs för att delta i den skriftliga sluttentamen. Betyget avgörs både från projektarbetena (40%) och sluttentamen (60%). Obligatoriskt deltagande Närvaro krävs vid kursintroduktion, handledningstillfällen och grupparbeten. Kursledaren bedömer om och i så fall hur frånvaro kan kompenseras. Innan student deltagit i obligatoriska delar eller kompenserat frånvaro i enlighet med kursledarens anvisningar registreras inte studentens kursresultat i LADOK. För att få delta i den skriftliga sluttentamen krävs godkänt på samtliga obligatoriska moment. Begränsning av antal prov- eller praktiktillfällen De studenter som ej är godkända efter ordinarie provtillfälle har rätt att delta vid ytterligare fem provtillfällen. Om den studerande ej är godkänd efter fyra provtillfällen rekommenderas denna att gå om kursen vid nästa ordinarie kurstillfälle, och får därefter delta vid ytterligare två provtillfällen. Om studenten genomfört sex underkända tentamina/prov ges inte något ytterligare tentamenstillfälle eller någon ny kursplats. Som provtillfälle räknas de gånger studenten deltagit i ett och samma prov. Inlämning av blank skrivning räknas som provtillfälle. Provtillfälle till vilket studenten anmält sig med inte deltagit räknas inte som provtillfälle.
Övergångsbestämmelser
Efter varje kurstillfälle kommer det att erbjudas minst sex tillfällen för examination inom en 2-årsperiod efter kursens slut.
Övriga föreskrifter
Kursutvärdering kommer att genomföras enligt riktlinjer från Styrelsen för Utbildning. Undervisningsspråket är engelska.
Litteraturlista och övriga läromedel
Literature list
Extra litteratur utöver föreläsningsmaterial delas ut under kursen. Som förberedelse för kursen (speciellt del 1) rekommenderas följande (inte obligatoriska) böcker:
Suggested reading for recapitulating the basic material covered briefly in Part 1 - recommended for participants with little formal statistical training. Alternatives:
- Bland, Martin, An introduction to medical statistics, 3. ed. : Oxford : Oxford University Press, 2000 - xvi, 405 s. ISBN: 0-19-263269-8 (hft.), LIBRIS-ID: 4603394, Chapters 1-11, 13-14,
- Holm, Sture, Biostatistisk analys, 1. uppl. : Lund : Studentlitteratur, 2008 - 327 s. ISBN: 978-91-44-05378-3, LIBRIS-ID: 11173905, Omslagsbild, Chapers 1-6, 8,