PurhusNet > Debatter > Flere haller? > Rapport: Hal undersøgelsen > Analyse af tal

 

    Der er tre slags løgn:

    • Løgn
    • Forbandet løgn
    • Statistik   

      Mark Twain (1835-1910). Amerikansk forfatter.

Nu kan statistik jo være mange ting lige fra beregning af simple gennemsnit til sofistikerede, uigennemskuelige modeller. Begge disse yderpunkter bidrager til myten om statistik som værende en slags løgn. I forbindelse med rapporten "Undersøgelse af brugen af hallerne i Purhus kommune" er det førstnævnte, der er skurken.

Rapporten bygger på stikprøver af aktiviteter og udøvere i kommunens tre haller, idet hver hal er besøgt ca. 70 gange i løbet af sæsonen 2000/2001. Ud fra disse stikprøver er beregnet simple gennemsnit, der så lægges til grund for rapportens forklaringsdel - uden overhovedet at gøre læseren opmærksom på den usikkerhed, der altid vil knytte sig til en sådan stikprøve . Og helt galt er det naturligvis også, at man korrigerer for brugen af haller til ikke-sportslige arrangementer, mens man ikke korrigerer for, at Purhushallen p.g.a. særlige omstændigehder var lukket i en uge. Det har så som konsekvens, at dagspressen og den godtroende offentlig hopper på et udsagn som "Størst pres i Spentrup" (Amtsavisen, 12. maj 2001).

For at nuancere opfattelsen af rapporten en smule er her udarbejdet såkaldte konfidensintervaller for de totale stikprøver samt disse opsplittet på aktiviteter. I nedenfor viste figur angiver røde søjler Spentruphallen, gule søjler Purhushallen og grønne søjler Bjerregravhallen. Udenfor aktiviteter falder henh. 6, 7 og 13 tilfælder af tomme/låste haller.

Konfidensintervaller for observerede middelværdier.
Konfidensintervaller for stikprøver. Søjlerne angiver det interval, hvor der er 95% sandsynlighed for, at det virkelige gennemsnit befinder sig. (For de spidsfindige: Ved beregning er stikprøvens standardafvigelse anvendt som udtryk for den faktiske standardafvigelse - dette er nødvendigvis ikke korrekt)

Som det fremgår af figuren, er der en statistisk sikker forskel på benyttelsen af Bjerregravhallen i.f.t. Spentrup- og Purhushallen, mens der ud fra stikprøven slet ikke er grund til at skelne mellem de to haller. Ser man derimod på de enkelte idrætsgrene (hvor tomme haller ikke influererer), er der ikke statistisk belæg for at hævde en forskel, idet overlappende søjler markerer, at det faktiske gennemsnit (=hvis man havde registreret samtlige aktiviteter) kan være ens for såvel badminton, håndbold og fodbold. M.h.t. volleyball blev denne aktivitet kun observeret flere gange i Spentruphallen (6 gang).

Som alternativ til konfidensintervallerne kunne en t-test have være anvendt til at afgøre, hvorvidt de er reel forskelle mellem hallerne. F.eks. giver t-testen værdien 0,982 ved sammenligning mellem Spentrup og Purhus, mens værdien ved Purhus kontra Bjerregrav er 0,004. Værdierne udtrykker sandsynligheden for, at de virkelige gennemsnit er ens for de to sammenlignede stikprøver.

I figuren er endvidere givet et bud på det hensigtsmæssige antal deltagere - ud fra en sprotslig/motionsmæssig vurdering - indenfor de forskellige idrætsgrene.

Af konfindensintervallerne fremgår også vigtigheden af, at stikprøveundersøgelsen er repræsentativ , hvis resultatet ønskes anvendt som samlet total for pågældende hal. Nedenstående figur viser den procentvise fordeling mellem aktiviteter i den enkelte hal ifølge stikprøveundersøgelsen - denne fordeling skulle helst modsvares af den faktiske fordeling.

Relativ fordeling af akttiviteter i Purhus haller
Relativ fordeling af haltimer mellem aktiviteter ifølge stikprøveundersøgelse.

 

Hvad så med overskriften "Idrætshaller står ofte tomme (Amtsavisen 13 maj 2001)? Denne overskrift har baggrund i rapportens konstantering af, at hallerne er tomme eller kun lidt benyttet (0-10 personer) i op til 1/3 af tiden.

Det er der ikke noget overraskende i. Selvom f.eks. nyfødte babyer i gns. vejer 3600 gram bliver der født såvel tungere som lettere babyer. Tilsvarende med antal aktive i idrætshaller - med ca. 15 deltagere i gns. vil der være dage med såvel flere som færre deltagere. Såfremt denne fordeling af deltagere følger en såkaldt normalfordeling vil der f.eks. for Purhushallens vedkommende være knap 29 % af tiden, hvor der maks. er 10 deltagere - ifølge stikprøven er tallet 29,2 %. princippet er vist i nedenstående figur, hvor det røde areal under kurven repræsenterer ca. 29% af det samlede areal under kurven.

Normalfordeling af aktive i Purhushallen

            ovenstående forfattet af Jens Peter Hansen

chart.dk 

Siden er sidst ændret 13. maj 2001