Kuinka laskea jäännösvarianssi

Sisällysluettelo:

Anonim

Sijoittajat käyttävät varallisuushintojen liikkeen malleja ennustamaan, missä sijoituksen hinta on milloin tahansa. Näiden ennusteiden tekemiseen käytetyt menetelmät ovat osa kenttää tilastossa, joka tunnetaan nimellä taantumisanalyysi. Laskeminen jäännösvarianssi arvojen joukosta on regressioanalyysityökalu, joka mittaa, kuinka tarkasti mallin ennusteet vastaavat todellisia arvoja.

Regressiolinja

regressiolinja osoittaa, miten omaisuuden arvo on muuttunut eri muuttujien muutosten vuoksi. Tunnetaan myös nimellä a trendilinja, regressiolinja näyttää omaisuuden hinnan "trendin". Regressioriviä edustaa lineaarinen yhtälö:

Y = a + bX

jossa "Y" on omaisuusarvo, "a" on vakio, "b" on kerroin ja "X" on muuttuja, joka liittyy omaisuuden arvoon.

Esimerkiksi jos malli ennustaa, että yhden makuuhuoneen talo myy 300 000 dollaria, kahden makuuhuoneen talo myy 400 000 dollaria, ja kolmen makuuhuoneen talo myy 500 000 dollaria, regressiolinja näyttää:

Y = 200 000 + 100 000 X

jossa "Y" on kodin myyntihinta ja "X" on makuuhuoneiden lukumäärä.

Y = 200 000 + 100 000 (1) = 300 000

Y = 200 000 + 100 000 (2) = 400 000

Y = 200 000 + 100 000 (3) = 500 000

scatterplot

scatterplot osoittaa pisteet, jotka edustavat todellista korrelaatiota omaisuuden arvon ja muuttujan välillä. Termi "scatterplot" tulee siitä, että kun nämä pisteet on piirretty kaavioon, ne näyttävät olevan "hajallaan" ympärillä eikä makaa täydellisesti regressiolinjalla. Käyttämällä yllä olevaa esimerkkiä voisimme saada sirontakohdan näihin tietopisteisiin:

Kohta 1: 1BR myytiin 288 000 dollaria

Kohta 2: 1BR myytiin 315 000 dollaria

Kohta 3: 2BR myytiin 395 000 dollaria

Kohta 4: 2BR myytiin 410 000 dollaria

Kohta 5: 3BR myytiin 492 000 dollaria

Kohta 6: 3BR myytiin 507 000 dollaria

Jäännösvarianssin laskeminen

Jäännösvarianssin laskenta alkaa neliöiden summa eroja regressiolinjalla olevan omaisuuden arvon ja kunkin vastaavan omaisuuden arvon välillä.

Erojen neliöt näkyvät tässä:

Kohta 1: 288 000 dollaria - 300 000 dollaria = (- 12 000 dollaria); (-12000)2 = 144,000,000

Kohta 2: 315 000 dollaria - 300 000 dollaria = (+ 15 000 dollaria); (15000)2 = 225,000,000

Kohta 3: 395 000 dollaria - 400 000 dollaria = (- 5 000 dollaria); (-5000)2 = 25,000,000

Kohta 4: 410 000 dollaria - 400 000 dollaria = (+ $ 10 000); (10000)2 = 100,000,000

Kohta 5: 492 000 dollaria - 500 000 dollaria = (- 8 000 dollaria); (-8000)2 = 64,000,000

Kohta 6: 507 000 dollaria - 500 000 dollaria = (+ 7 000 dollaria); (7000)2 = 49,000,000

Neliöiden summa = 607 000 000

Jäljelle jäävä varianssi löytyy ottamalla neliöiden summa ja jakamalla se (n-2): lla, jossa "n" on sirontalohkon datapisteiden lukumäärä.

RV = 607 000 000 / (6-2) = 607 000 000/4 = 151 750 000.

Käyttötarkoitukset jäännösvarianssille

Vaikka jokainen scatterplot-piste ei riviä täydellisesti regressiolinjan kanssa, vakaan mallin scatterplot-pisteet ovat säännöllisesti jakautumassa regressiolinjan ympärille. Jäännösvarianssia kutsutaan myös "virheen varianssiksi". Suuri jäännösvarianssi osoittaa, että alkuperäisen mallin regressiolinja voi olla virheellinen. Jotkin laskentataulukon toiminnot voivat näyttää prosessin, jossa luodaan regressiolinja, joka on lähempänä scatterplot-dataa.