Tilastojen varianssin laskeminen

Sisällysluettelo:

Anonim

Yksi tilastojen perusajatuksista on keskiarvo, tai aritmeettinen keskiarvo joukon numeroita. Keskiarvo merkitsee tietokokonaisuuden keskiarvoa. vaihtelu tietojen joukko mittaa, kuinka pitkälle kyseisen tietosarjan elementit jaetaan keskiarvosta. Tietosarjoilla, joissa numerot ovat lähellä keskiarvoa, on pieni varianssi. Niillä ryhmillä, joissa numerot ovat paljon korkeampia tai pienempiä kuin keskiarvolla, on suuri vaihtelu.

Laske tietosarjan keskiarvo

Laske neliöerot

Seuraavassa vaiheessa lasketaan erotus kunkin tietokokonaisuuden elementin ja keskiarvon välillä. Koska jotkin elementit ovat keskiarvoa korkeampia ja jotkut ovat pienemmät, varianssilaskenta käyttää erojen neliötä.

Päivä 1 Myynti - keskimääräinen myynti: 62 000 dollaria - 65414,29 dollaria = (- $ 3,414.29); (-3,414.29)2 = 11,657,346.94

Päivä 2 Myynti - keskimääräinen myynti: $ 64,800 - $ 65414.29 = (- $ 614.29); (-614,29)2 = 377,346.94

Päivä 3 Myynti - keskimääräinen myynti: $ 62,600 - $ 65414.29 = (- $ 2,814.29); (-2,814.29)2 = 7,920,204.08

Päivä 4 Myynti - keskimääräinen myynti: 69 200 dollaria - 65414,29 dollaria = (+ $ 3,785.71); (+3,785.71)2 = 14,331,632.65

Päivä 5 Myynti - keskimääräinen myynti: 66 000 dollaria - 65414,29 dollaria = (+ $ 585.71); (585,71)2 = 343,061.22

Päivä 6 Myynti - keskimääräinen myynti: 63,900 dollaria - 65414,29 dollaria = (- $ 1514.29); (-1,514.29)2 = 2,293,061.22

Päivä 7 Myynti - keskimääräinen myynti: 69 400 dollaria - 65414,29 dollaria = (+ $ 3,985,71); (+3,985.71)2 = 15,885,918.37

HUOMAUTUS: Neliöeroja ei mitata dollareissa. Näitä numeroita käytetään seuraavassa vaiheessa varianssin laskemiseksi.

Varianssi ja standardipoikkeama

Varianssi määritellään neliömäisten erojen keskiarvona.

11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43

52,808,571.43/7 = 7,544,081.63

Koska varianssi käyttää erotuksen neliötä, varianssin neliöjuuri antaa selkeämmän merkin todellisesta leviämisestä. Tilastoissa varianssin neliöjuurta kutsutaan nimellä keskihajonta.

SQRT (7,544,081,63) = 2,746,65 dollaria

Käyttötarkoitukset varianssin ja standardin poikkeaman suhteen

Sekä varianssi että standardipoikkeama ovat erittäin hyödyllisiä tilastollisessa analyysissä. Varianssi mittaa keskiarvosta peräisin olevan dataryhmän yleisen leviämisen. Standardipoikkeama auttaa havaitsemaan harhatai tietosarjan elementit, jotka ovat liian kaukana keskiarvosta.

Yllä olevissa tiedoissa varianssi on melko korkea, ja vain kaksi päivittäistä myyntitulosta on 1,000 dollaria keskiarvosta. Tietokokonaisuus osoittaa myös, että kaksi seitsemästä päivittäisestä kokonaismäärästä on enemmän kuin yksi keskihajonta, kun taas kaksi muuta on enemmän kuin yksi keskihajonta.