Faglærer og fagkoordinator: Tue Tjur.
Eksamensform: Rapportaflevering.
Fagets formål: At sætte de studerende i stand til, på baggrund af bacheloruddannelsens statistikkurser, at gennemføre en større statistisk analyse og sammenfatte konklusionerne heraf i en rapport.
Fagets indhold: Kurset vil omfatte to større projekter, så vidt muligt hentet fra erhvervsøkonomiske problemstillinger.
Undervisningsform: Der afholdes to fællestimer om ugen, hvor projekterne og de statistiske metoder vil blive gennemgået. Teoretiske emner vil også blive taget op i det omfang der er brug for det. Der vil også være en vis vejledning i brug af statistiske programpakker og fortolkning af det der kommer ud af dem. I de senere faser af et projekt reduceres fællestimernes omfang, medens omfanget af den individuelle vejledning tilsvarende forøges.
Orienterende litteratur: Her kan kun henvises til de lærebøger der benyttes på bacheloruddannelsen. Der vil sædvanligvis ikke være brug for ydeligere litteratur, bortset fra uddelte notater. Til gengæld kræves det af deltagerne, at de på egen hånd sætter sig ind i (mindst) en statistisk programpakke (f.eks. SAS, GENSTAT, SPSS, S, R eller ISUW). Der vil kun i meget begrænset omfang blive undervist i hvordan disse programpakker fungerer. Dog vil ISUW og R blive benyttet til demonstration af udregninger og datamanipulationer i undervisningen.
Faglige forudsætninger og anbefalede kombinationer: Kurset bygger på kurserne i statistik under HA(mat). Hvis man ikke har rimeligt godt styr på disse fag kan MPAS ikke anbefales. For studerende fra andre HA linier vil det således kræve en særlig indsats at følge kurset.
Eksamensfordringer: I forbindelse med hvert af de to projekter afleveres en rapport på maksimalt 10 sider (eksklusive eventuelle bilag). Den første af de to rapporter skal godkendes af læreren. For den anden rapport gives, med en ekstern censors medvirken, en karakter. Der lægges vægt på klarhed i fremstillingsform og evne til at forklare statistiske modeller og metoder uden unødvendige krav til læserens matematiske forudsætninger. Desuden naturligvis på at projektets problemstilling analyseres korrekt og udtømmende.
Et par generelle links:
Vejledning i rapportskrivning (obligatorisk læsning, der vil ikke blive sagt så meget om det ...)
The R project for statistical computing
2010
Data som tekstfil
Data som ISU datasæt
Notat 1: Vægtet regression
ISUW-programmer (gennemgået ved forelæsningerne, her gengivet i stærkt simplificeret version):
V-REG.ISU til illustration af nogle eksempler i notat 1.
RENS.ISU danner nyt datasæt, så vidt muligt uden inkonsistenser.
CHECK.ISU kontrollerer diverse sammenhænge.
MODUL.ISU checker for forskel på vejning mellem moduler.
PRG1.ISU Regression af vægte på antal, opdelt efter togets længde.
Kontroltællinger. Resumé af resultater vedrørende kontrol af perrontællinger hos DSB S-tog 2006. Carsten Jensen, DTU Trafik, og Tue Tjur.
READ.R R-program til indlæsning og datarensning.
LM.R R-program til analyse af forskellige lineære modeller.
Notat 3: Usikkerhedsberegningen i forbindelse med projekt 1.
Data:
OPG2-DK1.TXT
OPG2-DK2.TXT
OPG2-UL1.TXT
OPG2-UL2.TXT
Oversigt: Alle 20 kursforløb, normeret til startkurs 100
Kort og lang rente uge for uge (fra uge 36 1997):
KORT.TXT
Notat 2: Kort om klassisk porteføljeteori
NOTAT2.R: R-program fra Notat 2.
En mere elementær introduktion på dansk, skrevet til undervisningsformål af Søren Feodor, Institut for Matematisk Fag, KU, har vi fået lov at lægge her: R for Statistik 1.
En endnu mere kortfattet og sikkert endnu mere elementær introduktion er skrevet af Jens Dick, Institut for Finansiering: R syntaks.
Gæsteforelæsning på MPAS. Onsdag d. 7. april vil Peter Dalgaard, nyudnævnt professor i statistik på CBS og medlem af The R Development Core Team, give en introduktion til sproget R. Klik her for at hente undervisningsmateriale (pdf format).
R programmer til opgave 2: dataindlæsning PC-analyse Optimeringseksempel Vægtet estimation Mere om vægtet estimation
Notat 4: Tilføjelse til notat 2.
2007
Data som tekstfil
ISUW dataindlæsningsprogram, forklares ved forelæsningerne 5. september
Notat: Den subtraktive model
Projekt 1 afleveres til kombisekretariatet mandag d. 22. oktober senest kl. 12 i 2 eksemplarer.
Notat om data af Carmine Gioia 2004. Bemærk afsnittet "Term of use" nederst på siden.
ISU programmer til dokumentation af dataindlæsning og transformation:
Forklaringsgraden for en logistisk regressionsmodel
Notat 2 fra 2004: Hosmer-Lemeshow's test for goodness-of-fit i en logistisk regressionsmodel
Projekt 2 afleveres til kombisekretariatet mandag d. 17. december senest kl. 12 i 3 eksemplarer.
Syge/omprøve: Projekt 2 afleveres i 3 eksemplarer (det ene uhæftet) torsdag d. 28. februar senest kl.12 i kombinationssekretariatet.
E 2006
Data som tekstfil
Data som Excel regneark
Principale komponenter i variabelgrupperne (klip fra SF-notat)
ISUW dataindlæsningsprogram, forklaret ved forelæsningerne 6. september
To pædagogiske ISU programmer, forevist og forklaret 13. september: TEXTUR1.ISU ALDER.ISU
Et ISU program, forevist og forklaret 20. september: PRG16.ISU
Rettelse af fejl i opgavetekst: Projekt 1 afleveres til kombisekretariatet mandag d. 23. oktober senest kl. 12 i 2 eksemplarer
Angående aflevering i grupper: Nuværende fagbeskrivelse gælder også i 2006. Nye regler træder tidligst i kraft fra 2007.
Data for 2004 som tekstfil og som Excel regneark
Data for oktober 2005 som tekstfil og som Excel regneark
Jostein Lillestøls projektbeskrivelse
Norsk kalender for 2004
Notat: Multipel regression med laggede responser som forklarende variable
Projekt 2 afleveres til kombisekretariatet mandag d. 18. december senest kl. 12 i 3 eksemplarer.
F 2006 (undtagelsesvis er MPAS i det akademiske år 2005-06 placeret i forårssemestret, derfor springet fra 2004 til 2006)
Regressionsmodeller for Markedsandele af Kristina Birch, Jørgen Kai Olsen og Tue Tjur, Symposium i Anvendt Statistik 2006
Notat 1: Lineære modeller for log(markedsandele)
ISU programmer gennemgået ved forelæsningerne
Databeskrivelse (Word dokument)
Notat 2: Fortolkning af logistiske regressionsmodeller i forbindelse med projekt 2
Notat 2 fra 04: Hosmer-Lemeshow's test for goodness-of-fit i en logistisk regressionsmodel
ISU program fra 12/4: Hosmer-Lemeshow's test
ISU program fra 19/4: Diverse forslag til definition af forklaringsgraden for en logistisk regressionsmodel
2004
Notat 1: Poissonmodellen med overspredning
Notat om data (af Carmine)
ISU programmer til dokumentation af dataindlæsning og transformation:
Notat 2: Hosmer-Lemeshow's test for goodness-of-fit i en logistisk regressionsmodel
2003
Indlæsning og datatransformation v.h.a. SAS og ISU
Notat 1: Statistiske metoder i forbindelse med projekt 1
2002
Notat 1: Modeller i forbindelse med projekt 1
Notat 2: To ISUW programmer i relation til notat 1
Notat 3: Modeller i forbindelse med projekt 2
2001
Data: 6801 6803 6805 6807 6811 6813 6816
Notat 1: Logistisk regression med overspredning
Notat 2: Betinget logistisk regression
2000
Notat 2: Approksimation af en logistisk regressionsmodel med en lineær normalfordelingsmodel
Notat 4: Overspredningsmodellen i praksis
Notat 5: Fortolkning af logistiske regressionsmodeller i forbindelse med opgave 2
1999
1998
Bilag: Beskrivelse af data format
1997