MPAS
MØK Projekter i Anvendt Statistik


MPAS var et fag på Cand. Merc.(mat), MØK studiets overbygning, som jeg stod for fra 1997 til 2010. Kursets hjemmeside er medtaget her hovedsageligt på grund af de udmærkede datasæt fra diverse kontakter, som jeg fik lov til at bruge i undervisningen - i mange tilfælde til gengæld for lidt statistisk konsulentarbejde.

Faglærer og fagkoordinator: Tue Tjur.

Eksamensform: Rapportaflevering.

Fagets formål: At sætte de studerende i stand til, på baggrund af bacheloruddannelsens statistikkurser, at gennemføre en større statistisk analyse og sammenfatte konklusionerne heraf i en rapport.

Fagets indhold: Kurset vil omfatte to større projekter, så vidt muligt hentet fra erhvervsøkonomiske problemstillinger.

Undervisningsform: Der afholdes to fællestimer om ugen, hvor projekterne og de statistiske metoder vil blive gennemgået. Teoretiske emner vil også blive taget op i det omfang der er brug for det. Der vil også være en vis vejledning i brug af statistiske programpakker og fortolkning af det der kommer ud af dem. I de senere faser af et projekt reduceres fællestimernes omfang, medens omfanget af den individuelle vejledning tilsvarende forøges.

Orienterende litteratur: Her kan kun henvises til de lærebøger der benyttes på bacheloruddannelsen. Der vil sædvanligvis ikke være brug for ydeligere litteratur, bortset fra uddelte notater. Til gengæld kræves det af deltagerne, at de på egen hånd sætter sig ind i (mindst) en statistisk programpakke (f.eks. SAS, GENSTAT, SPSS, S, R eller ISUW). Der vil kun i meget begrænset omfang blive undervist i hvordan disse programpakker fungerer. Dog vil ISUW og R blive benyttet til demonstration af udregninger og datamanipulationer i undervisningen.

Faglige forudsætninger og anbefalede kombinationer: Kurset bygger på kurserne i statistik under HA(mat). Hvis man ikke har rimeligt godt styr på disse fag kan MPAS ikke anbefales. For studerende fra andre HA linier vil det således kræve en særlig indsats at følge kurset.

Eksamensfordringer: I forbindelse med hvert af de to projekter afleveres en rapport på maksimalt 10 sider (eksklusive eventuelle bilag). Den første af de to rapporter skal godkendes af læreren. For den anden rapport gives, med en ekstern censors medvirken, en karakter. Der lægges vægt på klarhed i fremstillingsform og evne til at forklare statistiske modeller og metoder uden unødvendige krav til læserens matematiske forudsætninger. Desuden naturligvis på at projektets problemstilling analyseres korrekt og udtømmende.

Et par generelle links:

Vejledning i rapportskrivning (obligatorisk læsning, der vil ikke blive sagt så meget om det ...)

The R project for statistical computing



2010

Projekt 1: Passagertælling i S-togene.
- afleveres 23. marts.

Opgaveteksten

Data som tekstfil

Data som ISU datasæt

Notat 1: Vægtet regression

ISUW-programmer (gennemgået ved forelæsningerne, her gengivet i stærkt simplificeret version):
V-REG.ISU til illustration af nogle eksempler i notat 1.
RENS.ISU danner nyt datasæt, så vidt muligt uden inkonsistenser.
CHECK.ISU kontrollerer diverse sammenhænge.
MODUL.ISU checker for forskel på vejning mellem moduler.
PRG1.ISU Regression af vægte på antal, opdelt efter togets længde.

Kontroltællinger. Resumé af resultater vedrørende kontrol af perrontællinger hos DSB S-tog 2006. Carsten Jensen, DTU Trafik, og Tue Tjur.

READ.R  R-program til indlæsning og datarensning.
LM.R  R-program til analyse af forskellige lineære modeller.

Notat 3: Usikkerhedsberegningen i forbindelse med projekt 1.

Projekt 2: Investeringsstrategier baseret på klassisk porteføljeteori.
- afleveres i 3 eksemplarer senest 19. maj kl. 12 i kombisekretariatet.

Opgaveteksten

Data:   OPG2-DK1.TXTOPG2-DK2.TXTOPG2-UL1.TXTOPG2-UL2.TXT
Oversigt: Alle 20 kursforløb, normeret til startkurs 100
Kort og lang rente uge for uge (fra uge 36 1997):   KORT.TXT

Notat 2:  Kort om klassisk porteføljeteori
NOTAT2.R:  R-program fra Notat 2.

R logo Til udregninger i forbindelse med dette projekt vil vi bruge programmet R, som er et åbent og gratis statistik- og dataanalyseprogram, der kan hentes over nettet både i en Windows og en MacOS version. Se The R project for statistical computing. Herfra kan man komme til servere hvorfra man kan downloade R, og under "Manuals" finder man blandt andet "An Introduction to R" (pdf, 100 sider) som er en rimeligt pædagogisk introduktion.

En mere elementær introduktion på dansk, skrevet til undervisningsformål af Søren Feodor, Institut for Matematisk Fag, KU, har vi fået lov at lægge her: R for Statistik 1.

En endnu mere kortfattet og sikkert endnu mere elementær introduktion er skrevet af Jens Dick, Institut for Finansiering: R syntaks.

Gæsteforelæsning på MPAS. Onsdag d. 7. april vil Peter Dalgaard, nyudnævnt professor i statistik på CBS og medlem af The R Development Core Team, give en introduktion til sproget R. Klik her for at hente undervisningsmateriale (pdf format).

R programmer til opgave 2:  dataindlæsningPC-analyseOptimeringseksempelVægtet estimationMere om vægtet estimation

Notat 4:  Tilføjelse til notat 2.


2007

Projekt 1: Resultater fra Premier League 2000-2006.

Opgaveteksten.

Data som tekstfil

datadok.txt

ISUW dataindlæsningsprogram, forklares ved forelæsningerne 5. september

Notat: Den subtraktive model

Projekt 1 afleveres til kombisekretariatet mandag d. 22. oktober senest kl. 12 i 2 eksemplarer.

Projekt 2: Forudsigelse ud fra regnskabsdata af konkurs og overtagelse af danske virksomheder.

Opgaveteksten.

Notat om data af Carmine Gioia 2004. Bemærk afsnittet "Term of use" nederst på siden.

Data

ISU programmer til dokumentation af dataindlæsning og transformation:

READ.ISU   KORT.ISU

Forklaringsgraden for en logistisk regressionsmodel

Notat 2 fra 2004: Hosmer-Lemeshow's test for goodness-of-fit i en logistisk regressionsmodel

Projekt 2 afleveres til kombisekretariatet mandag d. 17. december senest kl. 12 i 3 eksemplarer.

Syge/omprøve: Projekt 2 afleveres i 3 eksemplarer (det ene uhæftet) torsdag d. 28. februar senest kl.12 i kombinationssekretariatet.


E 2006

Projekt 1: Smagsbedømmelse af svinekød.

Opgaveteksten

Data som tekstfil

Data som Excel regneark

Principale komponenter i variabelgrupperne (klip fra SF-notat)

ISUW dataindlæsningsprogram, forklaret ved forelæsningerne 6. september

To pædagogiske ISU programmer, forevist og forklaret 13. september:    TEXTUR1.ISU    ALDER.ISU

Et ISU program, forevist og forklaret 20. september:    PRG16.ISU

Rettelse af fejl i opgavetekst: Projekt 1 afleveres til kombisekretariatet mandag d. 23. oktober senest kl. 12 i 2 eksemplarer

Angående aflevering i grupper: Nuværende fagbeskrivelse gælder også i 2006. Nye regler træder tidligst i kraft fra 2007.

Projekt 2: Forudsigelse af det norske elforbrug.

Opgaveteksten

Data for 2004 som tekstfil og som Excel regneark

Data for oktober 2005 som tekstfil og som Excel regneark

Jostein Lillestøls projektbeskrivelse

Norsk kalender for 2004

Notat: Multipel regression med laggede responser som forklarende variable

Projekt 2 afleveres til kombisekretariatet mandag d. 18. december senest kl. 12 i 3 eksemplarer.


F 2006   (undtagelsesvis er MPAS i det akademiske år 2005-06 placeret i forårssemestret, derfor springet fra 2004 til 2006)

Projekt 1: Kaffesalg. Danske kaffemærkers salg som funktion af priserne.

Opgaveteksten

Datafil 1     Datafil 2

Kalender    1994     1995     1996

Regressionsmodeller for Markedsandele af Kristina Birch, Jørgen Kai Olsen og Tue Tjur, Symposium i Anvendt Statistik 2006

Notat 1: Lineære modeller for log(markedsandele)

ISU programmer gennemgået ved forelæsningerne

Projekt 2: Bogklubmedlemmers loyalitet.

Opgaveteksten

Databeskrivelse (Word dokument)

Data

Notat 2: Fortolkning af logistiske regressionsmodeller i forbindelse med projekt 2

Notat 2 fra 04: Hosmer-Lemeshow's test for goodness-of-fit i en logistisk regressionsmodel

ISU program fra 12/4: Hosmer-Lemeshow's test

ISU program fra 19/4: Diverse forslag til definition af forklaringsgraden for en logistisk regressionsmodel


2004

Projekt 1: Analyse af data vedrørende trafikuheld.

Opgaveteksten

Data

Indledende ISUW eksempler

Notat 1: Poissonmodellen med overspredning

Projekt 2: Forudsigelse ud fra regnskabsdata af konkurs og overtagelse af danske virksomheder.

Opgaveteksten

Notat om data (af Carmine)

Data

ISU programmer til dokumentation af dataindlæsning og transformation:

READ.ISU   KORT.ISU

Notat 2: Hosmer-Lemeshow's test for goodness-of-fit i en logistisk regressionsmodel


2003

Projekt 1: Analyse af en kundedatabase.

Opgaveteksten

Data

Indlæsning og datatransformation v.h.a. SAS og ISU

Notat 1: Statistiske metoder i forbindelse med projekt 1

Projekt 2: Norske busselskabers effektivitet.

Opgaveteksten

Data

Variabelbeskrivelser

De tre efficiente selskaber

Norske fylker


2002

Projekt 1: Afsætningsdata.

Opgaveteksten

Data

Notat 1: Modeller i forbindelse med projekt 1

Notat 2: To ISUW programmer i relation til notat 1

Projekt 2: Konvertering af kreditforeningslån.

Opgaveteksten

Den lange rente

Notat 3: Modeller i forbindelse med projekt 2


2001

Projekt 1: Et forsøg vedrørende læseligheden af en tekst.

Opgaveteksten

Data

ISU eksempler

Projekt 2: Reklamers effekt på køb af chokoladestænger.

Opgaveteksten

Data:  6801680368056807681168136816

ISU eksempler

Notat 1: Logistisk regression med overspredning

Notat 2: Betinget logistisk regression


2000

Projekt 1: Effekten af bandereklamer ved fodbold- og håndboldkampe.

Opgaveteksten

Data

Notat 2: Approksimation af en logistisk regressionsmodel med en lineær normalfordelingsmodel

Notat 4: Overspredningsmodellen i praksis

SAS eksempler

Projekt 2: Nykredit data (credit scoring).

Opgaveteksten

Data

Notat 5: Fortolkning af logistiske regressionsmodeller i forbindelse med opgave 2

ISU eksempler


1999

Projekt 1: Data vedrørende danske og amerikanske aktieselskaber.

Opgaveteksten

Data

Brancher

Projekt 2: Avislæseres opmærksomhed på annoncer.

Opgaveteksten

Data


1998

Projekt 1: BRF data vedrørende tvangsauktioner.

Opgaveteksten

Bilag: Beskrivelse af data format

Datafiler:  891290039006900990129103

Projekt 2: Falck undersøgelsen.

Opgaveteksten

Data


1997

Projekt 1: Produktionsstyring på en minkfarm.

Opgaveteksten

Data

Projekt 2: Ekstrabladets salgstal.

Opgaveteksten

Data


Sidst opdateret December 2014.