Statistikgruppen MPAS Handelshøjskolen i København September 00 Tue Tjur Projekt 2 Data til denne opgave er stillet til rådighed af Nykredit via Martin Ankjær Pedersen. Data repræsenterer et udsnit af de private ejendomslån, som var løbende ved årsskiftet 1996/97. Det drejer sig om alle de lån, som gav anledning til et tab i 1997, samt (for at begrænse datamaterialets størrelse) et tilfældigt udtræk bestående af 0.8 procent af de øvrige lån. Datafilen 00-2.DAT består af ca. 5882 blokke a 3 linier, adskilt af tomme linier. Hvert sådan blok svarer til et lån. Linierne svarende til de tre første og det sidste af de 5882 lån er gengivet her: 222 9 * 1132 90 3 0 0 0 2 0 * 70 0 * 2 020000511 1092 5270 020000570 0 * 5 4 13 1 60 780 7.00 3.5000 28000.00 24140.65 2 222 9 * 1132 90 3 0 0 0 2 0 * 70 0 * 2 020000511 1092 5270 020000570 0 * 5 4 13 2 60 804 7.00 3.5000 5000.00 4410.46 2 222 9 * 1132 90 3 0 0 0 2 0 * 70 0 * 2 020000511 1092 5270 020000570 0 * 4 3 15 3 30 1090 9.00 2.2500 275000.00 243193.11 4 ... 1269 14 533430 1090 997452 1 2 0 0 1 -50063 * 61 3 * 2 043011812 1122 8544 * 0 * 4 3 15 1 29 1092 10.00 2.5000 465000.00 415158.99 4 For hvert lån foreligger 33 oplysninger, adskilt med mellemrum eller linieskift. Tegnet * markerer uoplyste værdier. I øvrigt er de 33 oplysninger i naturlig rækkefølge beskrevet som følger (idet der samtidig foreslås passende variabelbetegnelser): OPLYSNINGER VEDR. EJENDOMMEN: 1 AREAL: Ejendommens grundareal i m2. 2 AMT: 1..16 1 KøbhKom 2 FrbKom 3 Københ 4 Frborg 5 Rosk 6 Vestsj 7 Storstr 8 Bornh 9 Fyn 10 Sønderjyll 11 Ribe 12 Vejle 13 Ringkøbing 14 Århus 15 Viborg 16 Nordjyll 3 VURD: Ejendommens belåningsværdi. 4 VURDDATO: Dato for vurdering af belåningsværdi. 5 ??? ( ukendt eller irrelevant). 6 TYPE: 1..4 1 parcelhus 2 2-fam. hus 3 rækkehus m.v. 4 ejerlejlighed 7 EJDRISK: En vurdering af ejendommens risiko 1..3 (1 ok, 3 høj risiko) vurderet af en sagsbehandler. 8 RESTAN: antal restancer. 9 RESTBEL: beløb i restance. 10 TAB: 1 hvis tab, 2 hvis ikke tab. 11 TABBELØB: størrelsen af tabet. 12 YDELSE: størrelsen af sidst kendte ydelse (kun ved restance). OPLYSNINGER VEDR. KUNDEN: 13 ALDER: Primær købers alder. 14 KUNDRISK: Risiko vurderet for kunden, 1..3 (1 lav, 3 høj). 15 RISKDATO: Dato for vurdering af kundens risiko. 16 KØN: Primær låntagers køn (M=2, K=1, formodentlig...). 17 ??? ( ukendt eller irrelevant). 18 OVTDATO: Overtagelsesdato. 19 ??? ( ukendt eller irrelevant). 20 ??? ( ukendt eller irrelevant). OPLYSNINGER VEDR. LÅNET: 21 BELNEDRE: Belåningsinterval, nedre grænse. 22 BELØVRE: Belåningsinterval, øvre grænse. 23 FORMÅL: 1..9. 24 ??? ( ukendt eller irrelevant). 25 LÅNTYPE: Lånets type (26 kategorier, som kontantlån, obligationslån osv.). 26 ??? ( ukendt eller irrelevant). 27 LØBETID: Lånets løbetid. 28 OPRDATO: Lånets oprettelsesdato. 29 OBLRENTE: Obligationsrente. 30 LÅNRENTE: Rente til beregning af ydelse. 31 HOVSTOL: Lånets hovedstol. 32 RESTGÆLD: Lånets restgæld. 33 TERMANT: Antal terminer/år for lånet (2 eller 4). Bemærk: Alle datoer er givet i hele måneder med januar 1900 som nr. 1. Værdien 1 skal dog fortolkes som manglende værdi. Alle oplysninger, med undtagelse af TAB og TABBELØB, er oplysninger der forelå ved årsskiftet 1996/97. TAB og TABBELØB vedrører tab (typisk p.g.a. tvangsauktion) indtruffet i løbet af 1997. Formålet med opgaven er, i videst muligt omfang, at afdække mulighederne for at forudsige hændelsen "TAB" samt størrelsen "TABBELØB" ud fra de øvrige oplysninger, med henblik på at kunne udpege og behandle de mest risikofyldte sager i tide. Opgave 2 afleveres fredag d. 15. december 2000.