Hoe extreme waarden uit te sluiten van uw statistieken

Inhoudsopgave

De berekening van het gemiddelde zegt meestal veel over een set gegevens. Gegevensvolumes met extreme uitbijters zijn echter problematisch, omdat deze het resultaat aanzienlijk kunnen beïnvloeden en vervalsen.

Dergelijke uitschieters kunt u buiten uw berekeningen houden. Dan winnen uw kerngegevens aan belang bij de evaluatie. Illustratie [1] toont een tabel waarin voor elke kolom de gemiddelde waarde wordt berekend.

Door de negatieve waarden op dag 2 en 4 zijn deze gemiddelde waarden erg laag. Op dag 1 en 5 leiden zeer hoge waarden echter tot bijzonder hoge gemiddelde waarden.

Gebruik de functie TRIMMING MEANS om gemiddelde waarden zonder uitbijters te berekenen. Om dit te doen, voert u de volgende formule in cel B16 in en kopieert u de formule na het invoeren naar de cellen C16: F16:
= TRIMMEDIUM (B4: B13; 0,2)

De gemiddelde waarden liggen nu veel dichter bij elkaar omdat er geen rekening wordt gehouden met de extreme waarden. [2]

U geeft twee argumenten door aan de tabelfunctie ROUTED AVERAGE: Het eerste argument specificeert het bereik waarin u het gemiddelde wilt berekenen. Geef als tweede argument een waarde tussen 0 en 1 of tussen 0% en 100% door. Hiermee kunt u bepalen welk deel van het datavolume niet in de berekening mag worden meegenomen. Er wordt geen rekening gehouden met de hoogste en laagste waarden.

In de voorbeeldtabel heb je de waarde 0.2 als tweede argument. Dit betekent dat 20% van de tien overgedragen waarden niet worden meegenomen in de berekening. Bij tien waarden betekent dit: Twee waarden vallen buiten de berekening: de grootste en de kleinste waarde. Bij het berekenen van het aantal ontbrekende waarden rondt Excel altijd af naar het dichtstbijzijnde even getal, zodat hetzelfde aantal waarden altijd boven en onder wordt bijgesneden.

U zal helpen de ontwikkeling van de site, het delen van de pagina met je vrienden

wave wave wave wave wave