Miten jäljellä olevat varianssit löydetään Excelissä

Sisällysluettelo:

Anonim

Tilastollisessa analyysissä vaihtelu tietosarjan jäsenten keskuudessa näkyy, kuinka kaukana toisistaan ​​datapisteet ovat trendilinjasta, joka tunnetaan myös nimellä a regressiolinja. Mitä suurempi varianssi, sitä leveämpi datapisteet ovat. Varianssianalyysin tutkimus osoittaa, mitä varianssin osia voidaan selittää datan ominaisuuksilla ja jotka voidaan katsoa satunnaisiksi tekijöiksi. Varianssin osaa, jota ei voida selittää, kutsutaan jäännösvarianssiksi.

Excel-laskentataulukoiden käyttäminen jäännösvarianssin laskemiseen

Kaavan laskenta jäännösvarianssin laskemiseen liittyy lukuisia monimutkaisia ​​laskelmia. Pienissä tietosarjoissa jäännösvarianssin laskentaprosessi käsin voi olla ikävä. Suurten tietosarjojen osalta tehtävä voi olla uuvuttavaa. Excel-laskentataulukon avulla sinun tarvitsee syöttää vain tietopisteet ja valita oikea kaava. Ohjelma käsittelee monimutkaisia ​​laskelmia ja toimittaa tuloksen nopeasti.

Datapisteet

Avaa uusi Excel-laskentataulukko ja anna datapisteet kahteen sarakkeeseen. Regressiolinjat edellyttävät, että jokaisella datapisteellä on kaksi elementtiä. Tilastotieteilijät merkitsevät tyypillisesti nämä elementit "X" ja "Y". Esimerkiksi Generic Insurance Co. haluaa löytää työntekijöiden korkeuden ja painon jäännösvarianssin. X-muuttuja edustaa korkeutta ja Y-muuttuja edustaa painoa. Anna korkeudet sarakkeeseen A ja painot sarakkeeseen B.

Keskiarvon etsiminen

tarkoittaa edustaa kunkin elementin keskiarvoa tietosarjassa. Tässä esimerkissä Generic Insurance haluaa löytää 10 työntekijän korkeuden ja painon keskiarvon, keskihajonnan ja kovarianssin. Sarakkeessa A lueteltujen korkeuksien keskiarvo voidaan löytää syöttämällä funktio "= AVERAGE (A1: A10)" soluun F1. Sarakkeessa B lueteltujen painojen keskiarvo voidaan löytää syöttämällä funktio "= AVERAGE (B1: B10)" soluun F3.

Standardipoikkeaman ja kovarianssin etsiminen

keskihajonta mittaa, kuinka kaukana toisistaan ​​datapisteet ovat keskiarvosta. kovarianssi mittaa, kuinka paljon tietopisteen kaksi osaa muuttuvat yhdessä. Korkeuksien keskihajonta löytyy syöttämällä funktio "= STDEV (A1: A10)" soluun F2. Painojen keskihajonta löytyy syöttämällä funktio "= STDEV (B1: B10)" soluun F4. Korkeuksien ja painojen välinen kovarianssi löytyy syöttämällä funktio "= COVAR (A1: A10; B1: B10)" soluun F5.

Regressiolinjan löytäminen

regressiolinja on lineaarinen funktio, joka seuraa datapisteiden suuntausta. Regressiolinjan kaava näyttää tältä: Y = aX + b.

Käyttäjä voi löytää arvot "a": lle ja "b": lle käyttämällä laskelmia välineille, standardipoikkeamille ja kovarianssille. "B" -arvo edustaa pistettä, jossa regressiolinja sieppaa Y-akselin. Arvo on löydettävissä ottamalla kovarianssia ja jakamalla se X-arvojen keskihajonnan neliöllä. Excel-kaava menee soluun F6 ja näyttää tältä: = F5 / F2 ^ 2.

"A" -arvo edustaa regressiolinjan kaltevuutta. Excel-kaava menee soluun F7 ja näyttää näin: = F3-F6 * F1.

Jos haluat nähdä regressiolinjan kaavan, kirjoita tämä merkkikonsentraatio soluun F8:

= CONCATENATE ("Y ="; ROUND (F6; 2); "X"; IF (SIGN (F7) = 1; "+"; "-"); ABS (ROUND (F7; 2)))

Laske Y-arvot

Seuraavassa vaiheessa lasketaan Y-arvot tietosarjassa annettujen X-arvojen regressiolinjalla. Y-arvojen löytämisessä käytettävä kaava menee sarakkeeseen C ja näyttää näin:

= $ F $ 6 * A (i) + $ F $ 7

Jos A (i) on sarakkeen A sarakkeen (i) arvo. Kaavat näyttävät tältä taulukosta:

= $ F $ 6 * A1 + $ F $ 7

= $ F $ 6 * A2 + $ F $ 7

= $ F $ 6 * A3 + $ F $ 7 ja niin edelleen

Sarakkeen D merkinnät näyttävät Y: n odotettujen ja todellisten arvojen väliset erot. Kaavat näyttävät tältä:

= B (i) -C (i), Kun B (i) ja C (i) ovat sarakkeiden B ja C rivin (i) arvot.

Jäljellä olevan varianssin etsiminen

kaava jäännösvarianssille menee soluun F9 ja näyttää tältä:

= SUMSQ (D1: D10) / (COUNT (D1: D10) -2)

Jos SUMSQ (D1: D10) on todellisten ja odotettujen Y-arvojen välisten erojen neliöiden summa, ja (COUNT (D1: D10) -2) on datapisteiden lukumäärä, miinus 2 vapauden asteille tiedot.