Miten määritetään tietojen todennäköisyysjakautumistyyppi

Sisällysluettelo:

Anonim

Kun olet kerännyt tietoja järjestelmästäsi tai prosessista, seuraava vaihe on määrittää, minkä tyyppinen todennäköisyysjakauma on. Todennäköisyysjakautumatyypit ovat: diskreetti yhtenäinen, Bernoulli, binominen, negatiivinen binomi, Poisson, geometrinen, jatkuva yhtenäinen, normaali (kellokäyrä), eksponentiaalinen, gamma- ja beetajakauma. Muutaman vaihtoehdon kaventaminen mahdollisuuksien luettelosta määrittää, mikä on lähimmän R-neliön arvo paljon nopeammin.

Tarvittavat kohteet

  • Graafinen ohjelmisto

  • R-neliön arvon laskentatavat (paras sovitusanalyysi)

Piirrä tiedot tietotyypin visuaaliseen esitykseen.

Yksi ensimmäisistä vaiheista sen määrittämiseksi, mikä tiedon jakelu on - ja siten datan mallinnuksessa käytettävä yhtälötyyppi - on sulkea pois se, mitä se ei voi olla. • Jos tietokokonaisuudessa on huippuja, se ei voi olla erillinen yhtenäinen jakauma. • Jos tiedoissa on useampi kuin yksi huippu, se ei ole Poisson tai binomi. • Jos siinä on yksi käyrä, ei toissijaisia ​​piikkejä, ja kummallakin puolella on hidas kaltevuus, se voi olla Poisson tai gammajakauma. Mutta se ei voi olla erillinen yhtenäinen jakauma. • Jos tiedot jakautuvat tasaisesti ja se ei ole vinossa toiselle puolelle, on turvallista sulkea pois gamma- tai Weibull-jakauma. • Jos funktiolla on tasainen jakauma tai piikki graafisten tulosten keskellä, se ei ole geometrinen jakauma tai eksponentiaalinen jakauma. • Jos tekijän esiintyminen vaihtelee ympäristömuuttujan mukaan, se ei todennäköisesti ole Poisson-jakauma.

Kun todennäköisyysjakauman tyyppi on supistunut, tee jokaisen mahdollisen todennäköisyysjakauman tyypin R analyysi. Se, jolla on korkein R-neliöarvo, on todennäköisesti oikea.

Poista yksi outlier-datapiste. Laske sitten uudelleen R-neliö. Jos sama todennäköisyysjakautumistyyppi tulee lähimpänä otteluna, on suuri luottamus siihen, että tämä on oikea todennäköisyysjakauma käytettäväksi tietosarjassa.

vinkkejä

  • Jos tiedot osoittavat useita piikkejä, leveä hajonta, on mahdollista, että kaksi erillistä prosessia on meneillään tai tuote, josta näyte otetaan, on sekoitettu. Palauta tiedot ja analysoi ne uudelleen.

Varoitus

Vahvista yhtälöt, jotka on luotu myöhempiin tietokokonaisuuksiin, jotta varmistetaan, että se on edelleen tarkka tietosarjalle. On mahdollista, että ympäristötekijät ja prosessin kulkeutuminen ovat tehneet nykyiset yhtälöt ja mallit virheellisiksi.