Com es determina el tipus de distribució de la probabilitat per a dades

Taula de continguts:

Anonim

Quan hagueu recollit dades al vostre sistema o procés, el següent pas és determinar quin tipus de distribució de probabilitat té. Els tipus de distribucions de probabilitat són: uniforme discret, Bernoulli, binomi, binomi negatiu, Poisson, uniforme geomètric, uniforme, normal (corba de campana), exponencial, gamma i beta. En restringir fins i tot alguns de la llista de possibilitats, es determina quin és el valor del quadrat R més proper molt més ràpid.

Articles que necessiteu

  • Programari gràfic

  • Mitjans de càlcul del valor del quadrat R (millor anàlisi d'ajust)

Trace les dades per a una representació visual del tipus de dades.

Un dels primers passos per determinar quina distribució de dades té i, per tant, el tipus d'equació que s'utilitza per modelar les dades és descartar què no pot ser. • Si hi ha pics al conjunt de dades, no pot ser una distribució uniforme discreta. • Si les dades tenen més d'un pic, no és Poisson o binomi. • Si té una única corba, sense pics secundaris, i té un pendent lent a cada costat, pot ser Poisson o una distribució gamma. Però no pot ser una distribució uniforme discreta. • Si les dades es distribueixen de manera uniforme, i no té un esquinçament cap a un costat, és segur descartar una distribució gamma o Weibull. • Si la funció té una distribució uniforme o un pic al centre dels resultats gràfics, no és una distribució geomètrica o una distribució exponencial. • Si l'aparició d'un factor varia amb una variable ambiental, probablement no sigui una distribució de Poisson.

Una vegada que s'ha reduït el tipus de distribució de probabilitat, feu una anàlisi del quadrat R de cada possible tipus de distribució de probabilitat. El més indicat és el correcte.

Elimineu un punt de dades més allunyat. Torneu a calcular R quadrat. Si apareix el mateix tipus de distribució de probabilitat com a coincidència més propera, hi ha una gran confiança que aquesta és la distribució de probabilitat correcta per utilitzar-la.

Consells

  • Si les dades mostren diversos cims d'una dispersió àmplia, és possible que es vagin processant dos processos separats o que el producte que es mostra sigui barrejat. Recol·lecta les dades i torneu a analitzar.

Avís

Valideu les equacions generades amb els conjunts de dades posteriors per confirmar que segueix sent precís per al conjunt de dades. És possible que els factors ambientals i la deriva del procés hagin equivocat les equacions i els models actuals.