jueves, 27 de octubre de 2016

MODELO PROBABILISTICO



MODELO PROBABILÍSTICO
Modelo probabilístico o estadístico es la forma que pueden tomar un conjunto de datos obtenidos de muestreos de datos con comportamiento que se supone aleatorio.
Un modelo estadístico es un tipo de modelo matemático que usa la probabilidad, y que incluye un conjunto de asunciones sobre la generación de algunos datos muéstrales, de tal manera que asemejen a los datos de una población mayor.
Las asunciones o hipótesis de un modelo estadístico describen un conjunto de distribuciones de probabilidad, que son capaces de aproximar de manera adecuada un conjunto de datos. Las distribuciones de probabilidad inherentes de los modelos estadísticos son lo que distinguen a los modelos de otros modelos matemáticos deterministas.
Un modelo estadístico queda especificada por un conjunto de ecuaciones que relacionan diversas variables aleatorias, y en las que pueden aparecer otras variables no aleatorias. Como tal "un modelo es una representación formal de una teoría"1
Todos los test de hipótesis estadísticas y todos los estimadores estadísticos proceden de modelos estadísticos. De hecho, los modelos estadísticos son una parte fundamentalmente de la inferencia estadística.
MODELOS BASADOS EN DISTRIBUCIONES
Pueden ser modelos probabilísticos discretos o continuos. Los primeros, en su mayoría se basan en repeticiones de pruebas de Bernoulli. Los más utilizados son:
•        Modelo de Bernoulli
•        Modelo Binomial.
•        Modelo Geométrico.
•        Modelo Binomial negativo.
•        Modelo Hipergeométrico.
•        Modelo de Poisson.
Por otro lado, tal como se ha mencionado antes, existen modelos probabilísticos continuos, entre ellos destacamos:
•        Distribución Normal: usada ampliamente en muestras mayores a 30 datos.
•        Distribución Chi Cuadrado: usada en muestras pequeñas.
•        Distribución Exponencial: usada en duración o donde interviene el paso del tiempo.
•        Distribución F o distribución F de Snedecor: usada para controlar la varianza de 2 distribuciones.

EXPERIMENTO DE BERNOULLI
Solo son posibles dos resultados: éxito o fracaso. Podemos definir una variable aleatoria
Discreta X tal que:
                            Éxito  1 fracaso  0
Si la probabilidad de éxito es p y la de  fracaso 1 - p, podemos construir una función de probabilidad:

Un típico experimento de Bernoulli es el lanzamiento de una moneda con probabilidad p para cara y (1-p) para cruz.

Veremos, más adelante, que la distribución de Bernoulli es un caso particular de la distribución Binomial con n =

DISTRIBUCIÓN GEOMÉTRICA
Consideremos el siguiente experimento: Partimos de un experimento de Bernoulli donde la probabilidad de que ocurra un suceso es p (éxito) y la probabilidad de que no ocurra q = 1- p (fracaso). Repetimos nuestro experimento hasta conseguir el primer éxito. Definimos la variable aleatoria X, como el número de fracasos hasta que se obtiene el primer éxito.


DISTRIBUCION BINOMIAL
En estadística, la distribución binomial es una distribución de probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles dos resultados. A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.

MODELO DE RECUPERACIÓN DE INDEPENDENCIA BINARIA
El modelo probabilístico como modelo de recuperación de independencia binaria fue desarrollado por Robertson y Spark Jones. Este modelo afirma que pueden caracterizarse los documentos de una colección mediante el uso de términos de indización. Obviamente existe un subconjunto ideal de documentos que contiene únicamente los documentos relevantes a una necesidad de información para la cual se realiza una ponderación de los términos que componen la consulta realizada por el usuario. A continuación el sistema calcula la semejanza entre cada documento de la colección y la consulta y presentando los resultados ordenados por grado de probabilidad de relevancia en la relación a la consulta. Este modelo evita la comparación exacta (existencia o no de un término de la consulta en el documento) y posibilita al usuario realizar un proceso de retroalimentación valorando la relevancia de los documentos recuperados para que el sistema pueda calcular la probabilidad en posteriores consultas de que los documentos recuperados sean o no relevantes en función de los términos utilizados en la consulta sean o no relevantes.
DISTRIBUCIÓN DE POISSON
 Supongamos que estamos interesados en estudiar el número de éxitos obtenidos en un número grande de pruebas independientes de Bernoulli, teniendo una probabilidad pequeña de éxito en cada prueba. Es razonable pensar que la distribución venga dada como límite de una distribución B(n; p) con n , p 0. De hecho si se tiene cierto control sobre el producto np, digamos np λ < 65 Modelos continuos cuando n y p 0, podemos calcular el límite. Surge así la distribución de Poisson de parámetro λ > 0 definida por la función de masa.
MODELOS DE REGRESIÓN
Un modelo estadístico de regresión es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta. El modelo estadístico más simple es el usado en los diseños completos aleatorizados (DCA). Su modelo es:

Donde
Y = es la variable de respuesta de interés.
μ = promedio general de la población sobre la cual se está trabajando
t = es la variación que se atribuye a los niveles del factor que se está evaluando (efecto de los tratamientos).
ξ = es la variación de los factores no controlados ( el error experimental)
i = i -éstimo tratamiento
j = j -éstima repetición de cada tratamientos
j(i) = es la variación de las unidades experimentales anidado en los tratamientos.

Los modelos estadísticos pueden ser lineales o no lineales.




1 comentario:

  1. Exelente ! muchas gracias me han ayudado en mi tarea de mate , publiquen mas información :v

    ResponderBorrar