DISTRIBUCIONES DE PROBABILIDAD: BINOMIAL, POISSON Y NORMAL
Objetivos
-
- Seleccionar la distribución de probabilidad para modelizar un experimento aleatorio
- Calcular probabilidades de las distribuciones Binomial, Poisson y Normal
- Calcular cuantiles
- Generar valores aleatorios de una distribución determinada.
Introducción
Una variable aleatoria se puede definirse, intuitivamente, como una cantidad cuyo valor no es fijo pero puede tomar diferentes valores. La distribución de probabilidad se utiliza para describir la probabilidad de que se den los diferentes valores.
La distribución de probabilidad de una variable aleatoria modeliza un experimento aleatorio, describiendo teóricamente la forma en que varían los resultados de dicho experimento. Intuitivamente es una lista de los resultados posibles del experimento junto con las probabilidades que se esperarían ver asociadas con cada resultado.
En la teoría de la probabilidad existen muchos modelos teóricos que resultan de utilidad en una gran variedad de situaciones prácticas, ya que sirven para modelizar gran número de situaciones reales. Estas distribuciones o modelos de probabilidad se dividen en dos grandes grupos dependiendo del tipo de la variable aleatoria que modelizan. Así, distinguimos entre distribuciones de probabilidad discretas, si la variable aleatoria que modelizan es de naturaleza discreta y distribuciones de probabilidad continuas, cuando la variable aleatoria es continua.
Existen muchas distribuciones de probabilidad pero, dado el carácter introductorio de esta práctica, nos limitaremos a estudiar la distribución binomial y la distribución de Poisson como ejemplos de distribuciones discretas y la distribución Normal para ilustrar las distribuciones continuas.
Distribución Binomial
Consideremos repeticiones independientes de un experimento aleatorio con dos posibles resultados a los cuales nos referiremos genéricamente como “éxito” y “fracaso”. El éxito ocurre con una probabilidad p y el fracaso, por tanto, con una probabilidad q = 1-p .
En este contexto, interesa estudiar el número de éxitos en estas repeticiones del experimento aleatorio y, para ello, se define la siguiente variable aleatoria, X = “Número de éxitos en n ensayos independientes con probabilidad de éxito constante p ”.
Entonces decimos que X sigue una distribución binomial de parámetros n y p, y lo representamos como X→B(n, p).
La distribución binomial es una distribución de probabilidad discreta, mide el número de éxitos en una secuencia de n ensayos independientes, con una probabilidad fija p de ocurrencia de éxitos entre los ensayos.
Es evidente que los posibles valores que puede tomar la variable aleatoria (o, lo que es lo mismo, el número de ensayos exitosos de los que se realizan) son los valores comprendidos entre 0 y n.
A continuación vamos a definir y calcular:
- La probabilidad de que la variable aleatoria X tome cada valor concreto o, equivalentemente, el valor de la función masa de probabilidad en cada uno de estos puntos
- La probabilidad que acumula cada uno de los valores de la variable aleatoria X, es decir, el valor de la función de distribución en cada punto de la variable
- Cuantiles de la distribución binomial
- Valores aleatorios de la distribución binomial.
Función masa de probabilidad
La función masa de probabilidad de una variable aleatoria discreta, la cual suele representarse por pi, es una función que asigna una determinada probabilidad a cada uno de los puntos de la variable.
pi = P [X = xi]
En R y RStudio, los valores de la función masa de probabilidad de una variable con distribución binomial se obtienen a través de la función dbinom, la cual necesita los siguientes argumentos:
dbinom(x, size, prob)
donde:
- x: es el valor (o los valores) de la variable para el cual (o los cuales) queremos calcular la función masa de probabilidad
- size y prob: son los dos parámetros de la distribución binomial (n y p, respectivamente). En caso de que el argumento esté formado por dos o más valores, éstos vendrán concatenados mediante la función c(,).
Función de distribución
La función de distribución evaluada en un punto xi de una variable aleatoria discreta se denota por F(xi) y viene dada por
F(xi) = P[ X ≤ xi ] = P[ X = 0 ] + P[ X = ] + … + P[ X=xi ]
Para calcular valores de la función de distribución de una distribución binomial con R y RStudio utilizaremos la función pbinom, que tiene los siguientes argumentos:
pbinom(q, size, prob)
siendo q el valor (o los valores) de la variable en el cual (o los cuales) queremos calcular la función de distribución y size y prob, los parámetros de la distribución.
Cuantiles de la distribución binomial
Por definición, el cuantil de orden α de una distribución de probabilidad es aquel valor de la distribución que deja a su izquierda una proporción de valores α (o, equivalentemente, un porcentaje del (α x100)% ). Esto es, el cuantil de orden α, será aquel valor k tal que
P[ X ≤ k ] = α
Para calcular cuantiles de una distribución binomial en R y RStudio recurriremos a la función qbinom, que tiene los siguientes argumentos:
qbinom(p, size, prob)
siendo p el orden del cuantil que queremos calcular (en tanto por uno) y, size y prob los dos parámetros que identifican a la distribución binomial.
Generar valores aleatorios de la distribución binomial
Por último, calcular muestras de valores aleatorios generados a partir de una distribución binomial. Esta opción puede resultar de mucho interés en experimentos de simulación en los que se conoce de antemano que la variable de interés sigue una distribución binomial. Para generar estos valores utilizamos la función rbinom de R, la cual requiere los siguientes argumentos:
rbinom(n, size, prob)
donde n es el número de valores aleatorios a generar y size y prob son los dos parámetros de la distribución.
Veamos un ejemplo sencillo en el que se utilizan estas 4 funciones.
Supuesto Práctico 1
Se ha comprobado que la probabilidad de que se funda la lámpara de un televisor en un mes es 0.02. Si el televisor tiene 5 años. Se pide:
a) Definir una variable aleatoria que cuente el número de roturas en un mes. Identificar la distribución de probabilidad que sigue esta variable aleatoria
b) Calcula la Esperanza y varianza de la variable aleatoria
c) Calcular la probabilidad de que no haya ninguna rotura
d) Calcular la probabilidad de que exactamente haya 5 roturas
e) Obtener la probabilidad de que al menos haya 5 roturas
f) Obtener la probabilidad de que haya entre 5 y 25 roturas (ambos inclusive)
g) Calcular el valor de la variable tal que deja a su derecha el 32% de las observaciones
h) Generar una muestra de 30 valores aleatorios de esta distribución.
Solución
a) Definir una variable aleatoria que cuente el número de roturas en un mes. Identificar la distribución de probabilidad que sigue esta variable aleatoria
En primer lugar, definimos la variable aleatoria X = “Número de roturas en un mes”.
A partir de la información que nos proporciona el enunciado podemos afirmar que X→B(60, 0.02).
b) Calcular la Esperanza y varianza de la variable aleatoria
E[X] = np = 60×0.02 = 12
σ² = npq = 60×0.02×0.98 = 1.176
c) Calcular la probabilidad de que no haya ninguna rotura
En este apartado nos piden la probabilidad de que la variable aleatoria tome, exactamente, un valor o, lo que es lo mismo, el valor de la función masa de probabilidad evaluada en el punto xi = 0. Debemos, por tanto, calcular P[X=0]. Para ello, utilizaremos la función dbinom del siguiente modo
> dbinom(0, 60, 0.02)
[1] 0.2975531
La probabilidad que buscamos es, por tanto, 0.2975531.
d) Calcular la probabilidad de que exactamente haya 5 roturas
Hay que calcular P[X=5]
> dbinom(5, 60, 0.02)
[1] 0.005753035
La probabilidad que buscamos es, por tanto, 0.005753035
e) Obtener la probabilidad de que al menos haya 5 roturas
En este caso, la probabilidad que nos piden calcular es P[X ≥ 5]. Como P[X ≥ 5] = P[X=5] + P[X=6] + … + P[X=20 ], podríamos pensar en utilizar de nuevo la función dbinom para obtener cada una de estas probabilidades puntuales y después sumarlas. Sin embargo, esto sería un proceso bastante tedioso, pues implicaría el cálculo de muchas probabilidades.
Por lo tanto, sabiendo que la probabilidad puede expresarse como P[X ≥ 5] = 1 – P[X ≤ 4]. Y que la función de distribución evaluada en un punto xi se define como F(xi) = P[X ≤ xi]. Tenemos que calcular
P[X ≥ 5] = 1 – P[X ≤ 4] = 1 – F(4).
De manera que para calcular la probabilidad que nos pide el enunciado únicamente debemos hacer una llamada a la función pbinom tal y como se muestra a continuación:
1 – pbinom(4, 60, 0.02)
[1] 0.007024641
Concluimos, por tanto, que P[X ≥ 5] = 0.007024641.
f) Obtener la probabilidad de que haya entre 5 y 25 roturas (ambos inclusive)
En esta ocasión, nos piden calcular la probabilidad en un intervalo. Más concretamente, la probabilidad que necesitamos calcular es P[5 ≤ X ≤ 25] . De nuevo, teniendo en cuenta que: P[5 ≤ X ≤ 25] = P[X=5] + P[X=6] + … + P[X=25], podríamos usar la función dbinom para obtener el valor de la función masa de probabilidad en cada uno de estos puntos y después sumarlos. Pero existe una alternativa más sencilla. La probabilidad P[5 ≤ X ≤ 25] puede reescribirse como
P[5 ≤ X ≤ 25] = P[X ≤ 25] – P[ X ≤ 5] = F(25) – F(4)
por lo que el cálculo de dicha probabilidad se reduce al cálculo del valor de la función de distribución en los puntos 4 y 75. Podemos calcular ambos valores de forma simultánea mediante la función pbinom del siguiente modo:
> pbinom(c(4, 25), 60, 0.02)
[1] 0.9929754 1.0000000
De manera que la probabilidad que buscamos es:
> 1.0000000 – 0.99297547
[1] 0.0070246
Concluimos, por tanto, que P[5 ≤ X ≤ 25] = 0.0070246.
g) Calcular el valor de la variable tal que deja a su derecha el 32% de las observaciones
El valor de la variable que deja a su derecha un 32% de las observaciones es el mismo que deja a su izquierda el 68% restante. Por tanto, debemos calcular el cuantil de orden 0.68 de una distribución binomial de parámetros 60 y 0.02. Utilizaremos, para ello, la función qbinom.
> qbinom(0.68, 60, 0.02)
[1] 2
h) Generar una muestra de 30 valores aleatorios de esta distribución.
En este último apartado vamos a utilizar la función rbinom para generar la muestra de 30 valores aleatorios.
> rbinom(30, 60, 0.02)
[1] 2 1 0 0 0 1 0 0 2 1 1 0 1 0 4 1 1 2 1 1 2 0 0 0 0 1 2 0 0 4
Nota: Dado el carácter aleatorio de los valores generados en este apartado, dichos valores pueden no coincidir con los que se obtengan a través de otra llamada a la función rbinom.
Distribución de Poisson
La distribución de Poisson es una distribución de probabilidad discreta que sirve para modelizar la probabilidad de que ocurra un determinado número de eventos durante cierto período de tiempo. A modo de ejemplo, la distribución de Poisson se utiliza frecuentemente para contar el número de llamadas que una centralita telefónica recibe por unidad de tiempo o el número de clientes que llegan a un determinado establecimiento en un período de tiempo dado.
A diferencia de la distribución binomial, la cual necesita dos parámetros para ser correctamente identificada, la distribución de Poisson se define a partir de un único parámetro, que suele notarse por λ. Generalmente, el parámetro λ representa el número medio de sucesos que ocurren por unidad de tiempo. Entonces, podemos definir la variable aleatoria X = “Número de sucesos aleatorios que ocurren en un determinado periodo de tiempo” e identificar su distribución, X → P(λ). Los posibles valores que puede tomar una variable con distribución de Poisson van desde 0 a infinito.
Puesto que la distribución de Poisson también es una distribución discreta, los valores que podemos calcular son los mismos que ya estudiamos para la distribución binomial. Por lo tanto, para la distribución de Poisson obtendremos valores de la función masa de probabilidad, de la función de distribución y de los cuantiles. También generaremos muestras de valores aleatorios que siguen distribuciones de Poisson.
El tratamiento computacional con R de la distribución de Poisson es similar al que hemos empleado con la distribución binomial. La diferencia más notable es que el sufijo “binom” de las funciones dbinom, pbinom, qbinom y rbinom se sustituye por el sufijo “pois”, de manera que dbinom, pbinom, qbinom y rbinom se sustituyen por dpois, ppois, qpois y rpois cuando trabajamos con una distribución de Poisson.
Función masa de probabilidad
La función dpois calcula valores de la función masa de probabilidad de una distribución de Poisson. Sus argumentos son:
dpois(x, lambda)
dond:
- x: es el valor (o los valores) de la variable para el cual (o los cuales) queremos calcular la función masa de probabilidad
- lambda: es el parámetro que define la distribución de Poisson.
Función de distribución
La función ppois se utiliza para calcular valores de la función de distribución (esto es, probabilidades acumuladas) de una variable con distribución de Poisson. Sus argumentos son:
ppois(q, lambda)
donde:
- q: es el valor (o los valores) de la variable en el cual (o los cuales) queremos calcular la función de distribución
- lambda: el parámetro que identifica la distribución.
Cuantiles de la distribución de Poisson
La función qpois se utiliza para calcular los valores de los cuantiles de una distribución de Poisson, es decir, los valores de la variable con distribución de Poisson que dejan a su izquierda una determinada proporción de observaciones. Los argumentos de esta función son:
qpois(p, lambda)
donde:
- p: es la proporción de observaciones que dejará a su izquierda el cuantil en cuestión (es decir, el orden de dicho cuantil)
- lambda: el parámetro de la distribución de Poisson.
Generar valores aleatorios de la distribución de Poisson
La función rpois se utiliza para generar valores aleatorios de una distribución de Poisson y sus argumentos son:
rpois(n, lambda)
donde:
- n: es el número de elementos aleatorios a generar
- lambda: el parámetro que define la distribución de Poisson.
Veamos mediante un ejemplo sencillo cómo se utilizan cada una de estas 4 funciones.
Supuesto Práctico 2
El número medio de enfermos recibidos cada 10 minutos en un centro sanitario entre las 10 horas y las 15 horas es 1.8. Suponiendo que dicho número de enfermos sigue una distribución de Poisson. Se pide:
a) Definir una variable aleatoria que cuente el número de enfermos recibidos cada 10 minutos e identificar la distribución de probabilidad que sigue esta variable aleatoria
b) Calcular la probabilidad de que entre las 12 horas y las 12 horas y 10 minutos haya:
b1) Ningún enfermo
b2) Exactamente 2 enfermos
b3) Más de 8 enfermos
b4) Entre 8 y 15 clientes (ambos inclusive)
b5) Obtener la mediana de la variable
b6) Generar una muestra de 20 valores aleatorios de la distribución.
Solución
a) Definir una variable aleatoria que cuente el número de enfermos recibidos cada 10 minutos e identificar la distribución de probabilidad que sigue esta variable aleatoria
En primer lugar vamos a definir la variable aleatoria = X = “Número de enfermos recibidos cada 10 minutos en el centro sanitario”. Sabemos, por el enunciado que X → P(1.8)
b) Calcular la probabilidad de que entre las 12 horas y las 12 horas y 10 minutos haya:
b1) Ningún enfermo
En este apartado se pide la probabilidad de que la variable aleatoria X tome exactamente el valor 0, es decir, el valor de la función masa de probabilidad de X evaluada en el punto 0. Para ello, vamos a utilizar la función dpois.
> dpois(0, 1.8)
[1] 0.1652989
Dicha probabilidad es 0.1652989.
b2) Exactamente 2 enfermos
En este apartado se pide la probabilidad de que la variable aleatoria X tome exactamente el valor 2, es decir, el valor de la función masa de probabilidad de X evaluada en el punto 2. Para ello, vamos a utilizar la función dpois.
dpois(2, 1.8)
[1] 0.2677842
P[X = 2] = 0.2677842
b3) Más de 8 enfermos
La probabilidad que nos piden calcular en este caso es P[X ≥9] . Para calcularla, expresamos una probabilidad del tipo ≥ en función de los valores de la función de distribución de la variable. Para ello, tendremos en cuenta que
P[X ≥ 9] = 1 – P[X ≤ 8] = 1 – F(8)
De manera que para calcular P[X ≥ 9] únicamente necesitamos calcular el valor de la función de distribución de la variable evaluada en el punto 8, para lo cual utilizaremos la función ppois.
> 1 – ppois(8, 9)
[1] 0.5443474
Por tanto, se tiene que P[X ≥ 9] = 0.5443474
b4) Entre 8 y 15 clientes (ambos inclusive)
En este apartado, la probabilidad que nos piden calcular es P[8 ≤ X ≤ 15] . Vamos a obtenerla a través de dos métodos distintos: uno basado en la función masa de probabilidad y otro que utiliza la función de distribución.
Para calcular P[8 ≤ X ≤ 15] usando la función masa de probabilidad, tenemos que tener en cuenta que
P[8 ≤ X ≤15] = P[X = 8] + P[ X = 9] + …+ P[X = 15]
Por tanto, necesitamos obtener, y después sumar, los valores de la función masa de probabilidad de la variable evaluada en los puntos 8, 9, 10,…, 15. De esta forma hay demasiados sumandos
dpois (8, 1.8) + dpois (9, 1.8) +…+ dpois (15, 1.8)
Esta estrategia sólo tiene cabida cuando el intervalo para el cual queremos calcular su probabilidad es relativamente estrecho y está compuesto por pocos valores. En cualquier otro caso, debemos utilizar un enfoque distinto, basado en la función de distribución.
Esta alternativa, de utilizar la función de distribución, para calcular P[8 ≤ X ≤ 15] parte de que dicha probabilidad puede reescribirse como
P[8 ≤ X ≤ 15] = P[X ≤ 15] – P[ X ≤ 7] = F(15) – F(7)
De manera que, usando la función ppois, se tiene que:
> ppois(c(7, 15), 1.8)
[1] 0.9994385 1.0000000
De modo que la probabilidad que buscamos puede obtenerse como la diferencia entre los dos valores que proporciona la función ppois.
> 1.0000000 – 0.9994385
[1] 0.0005615
Por tanto, P[8 ≤ X ≤ 15] = 0.0005615
b5) Obtener la mediana de la variable
La mediana de una variable aleatoria es el valor de la variable que deja a su izquierda el 50% de las observaciones, quedando el 50% restante a la derecha de tal valor. De aquí se deduce que la mediana de una variable coincide con el cuantil de orden 0.5 de la variable. Por ello, se utiliza la función qpois para obtener la mediana de la variable X tal y como se muestra a continuación:
> qpois(0.5, 1.8)
[1] 2
Podemos concluir, por tanto, que la mediana de la variable es 2.
b6) Generar una muestra de 20 valores aleatorios de la distribución.
Por último, vamos a generar 20 valores aleatorios de esta distribución de Poisson a través de la función rpois.
> rpois(20, 1.8)
[1] 2 1 0 1 1 1 2 0 2 0 0 4 2 1 1 1 1 4 1 0
Nota: Dado el carácter aleatorio de los valores generados en este apartado, dichos valores pueden no coincidir con los que se obtengan a través de otra llamada a la función rpois.
Distribución Normal
La distribución Normal es la más importante y de mayor uso de las distribuciones continuas, debido a la gran cantidad de fenómenos aleatorios que modeliza. Esta distribución también se conoce como gaussiana o de Gauss, en honor a su descubridor. La distribución Normal viene identificada por dos parámetros, μ y σ, que coinciden con la media y la desviación típica de la distribución. Cuando una variable aleatoria, X , siga una distribución normal lo notaremos X → N(μ, σ)
La función de densidad de probabilidad, función de densidad, o, simplemente, densidad de una variable aleatoria continua es una función, usualmente denominada \(f(x)\) que describe la densidad de la probabilidad en cada punto del espacio de tal manera que la probabilidad de que la variable aleatoria tome un valor dentro de un determinado conjunto sea la integral de la función de densidad sobre dicho conjunto(
El tratamiento computacional con R y RStudio de la distribución Normal en particular, y de cualquier distribución de probabilidad continua en general, es similar al que se utiliza con las distribuciones discretas. La principal salvedad se encuentra en la función dnorm. Esta función es la equivalente para la distribución normal a dbinom y dpois en las distribuciones binomal y de Poisson, respectivamente. Recordemos que las funciones, dbinom y dpois devuelven la probabilidad puntual para cada uno de los valores posibles que puede tomar una variable con distribución binomial y de Poisson, respectivamente. Pero el cálculo de probabilidades en valores concretos en una distribución continua no tiene sentido, ya que dicha probabilidad vale 0. Por todo ello, dnorm devuelve el valor de la función de densidad en un punto (o puntos) determinado. Veamos cuáles son los argumentos de esta función:
dnorm(x, mean = 0, sd = 1)
siendo:
- x: es el valor (o los valores) de la variable para el cual (o los cuales) queremos calcular la función de densidad
- mean: es la media de la variable
- sd: la desviación típica de la variable.
Por defecto, se considera una distribución Normal de media 0 y desviación típica 1, es decir, se considera una distribución Normal estándar o tipificada. De este modo, si al llamar a la función dnorm no especificamos ningún valor para la media y la desviación estándar, R considerará estos valores por defecto, por lo que estaremos calculando valores de la función de densidad en una normal de media 0 y desviación típica 1. En caso de estar trabajando con una distribución Normal con una media y/o desviación típica diferente, lo indicaremos a través de estos parámetros.
Las funciones pnorm, qnorm y rnorm se comportan de forma similar a sus equivalentes para las variables discretas y devuelven valores de la función de distribución, cuantiles y valores aleatorios de una distribución normal, respectivamente. Sus argumentos son los siguientes:
pnorm(q, mean = 0, sd = 1)
qnorm(p, mean = 0, sd = 1)
rnorm(n, mean = 0, sd = 1)
siendo:
- q: el valor (o valores) para el cual (o los cuales) queremos calcular la función de distribución
- p: el orden del cuantil que queremos obtener
- n: el número de valores aleatorios a generar
- mean y sd: los dos parámetros que identifican a la distribución Normal.
Vamos a aplicar todas estas funciones en un ejemplo concreto.
Supuesto Práctico 3
En unos estudios realizados a un determinado tipo de aves rapaces. Se comprueba que la longitud de las alas extendidas, X, es una variable aleatoria que se distribuye aproximadamente según una curva Normal, de media 110 cm. y desviación típica 4 cm. Elegida un ave al azar y suponiendo que las longitudes se distribuyen normalmente, calcular:
a) La probabilidad de que la longitud de las alas esté comprendida entre 110 y 115 cm.
b) La probabilidad de que la longitud de las alas sea mayor que 105 cm.
c) La probabilidad de que la longitud de las alas sea menor de 100 cm.
d) La longitud mínima del 20% de las alas que más miden
e) Quince longitudes aleatorias que sigan dicha distribución.
Solución
En primer lugar, vamos a definir la variable aleatoria X. Por el enunciado del problema, sabemos que X → N(110, 4)
a) La probabilidad de que la longitud de las alas esté comprendida entre 110 y 115 cm.
En este primer apartado, nos piden calcular P[110 ≤ X ≤ 115] . Esta probabilidad puede reescribirse como
P[110 ≤ X ≤ 115] = P[X ≤ 115] – P[ X ≤ 110] = F(115) – F(110)
es decir, como una diferencia de valores de la función de distribución de la variable. Vamos a utilizar la función pnorm para obtener estos valores, de manera que la diferencia entre ambos nos dará la probabilidad que buscamos.
> pnorm(c(115, 110), mean = 110, sd = 4)
[1] 0.8943502 0.5000000
> 0.8943502 – 0.5000000
[1] 0.3943502
Por lo que podemos concluir que P[110 ≤ X ≤ 115] = 0.3943502 .
b) La probabilidad de que la longitud de las alas sea mayor que 105 cm.
En este caso, la probabilidad que tenemos que obtener es P[X > 105]. Esta probabilidad es equivalente a
P[X > 105] = 1 – P[X ≤ 105] = 1 – F(105)
por lo que también puede calcularse a partir de un valor de la función de distribución. Usemos, de nuevo, la función pnorm para calcular este valor de la función de distribución y así obtener la probabilidad buscada.
> pnorm(105, mean = 110, sd = 4)
[1] 0.1056498
> 1- 0.1056498
[1] 0.8943502
La probabilidad de que la longitud de las alas sea mayor que 105 cm. es 0.8943502.
c) La probabilidad de que la longitud de las alas sea menor de 100 cm.
La probabilidad de que la longitud de las alas sea 100 cm. o menos se puede escribir como P[X ≤ 100] = F(100). Esto es, la probabilidad coincide con el valor de la función de distribución evaluada en el punto 100.
> pnorm(100, mean = 110, sd = 4)
[1] 0.006209665
De manera que P[X ≤ 100] = 0.006209665
d) La longitud mínima del 20% de las alas que más miden
Para entender qué valor debemos calcular, veamos el siguiente gráfico:
Gráfico 1: Representación del percentil 80 en la recta real
Suponiendo que la recta azul representa los valores de la variable ordenados de menos a mayor, buscamos el 20% de los valores más grandes de la variable (que estarán situados a la derecha). El mínimo de estos valores (representado con un punto rojo) será aquel valor que deje a su derecha el 20% de las observaciones. Pero este punto será también aquel que deja a su izquierda el 80% de las observaciones restantes. Por tanto, el valor que debemos calcular es el percentil 80. Utilizaremos para ello la función qnorm.
> qnorm(0.8, mean = 110, sd = 4)
[1] 113.3665
La longitud que buscamos es 113.3665 cm.
e) Quince longitudes aleatorias que sigan dicha distribución.
Vamos a generar estos 15 longitudes aleatorias usando la función rnorm.
> rnorm(15, mean = 110, sd = 4)
[1] 109.8886 111.8642 111.4913 111.5209 110.0206 107.9751 116.2190
[8] 111.7862 105.5341 107.6144 111.2416 111.1966 105.9855 106.4936
[15] 116.0270
Nota: Dado el carácter aleatorio de los valores generados en este apartado, dichos valores pueden no coincidir con los que se obtengan a través de otra llamada a la función rnorm.
Ejercicios
Ejercicios Guiados
Ejercicio Guiado1
Por larga experiencia se ha determinado que la meningitis por salmonelas, enfermedad rara, pero muy grave de los lactantes, produce una mortalidad del 60%. Durante un brote epidémico en una gran ciudad, en un hospital de dicha ciudad, ingresaron 16 niños lactantes atacados por la enfermedad. Se pide:
a) Definir una variable aleatoria que cuente el número de supervivientes que ingresan en el hospital con la enfermedad e identificar la distribución de probabilidad que sigue esta variable aleatoria
b) Probabilidad de que sobrevivan todos los pacientes
c) Probabilidad de que sobrevivan más de la mitad de los pacientes
d) Probabilidad de que mueran todos los pacientes
e) Probabilidad de que más de dos pacientes sobrevivan
f) Probabilidad de que el número de sobrevivientes esté comprendido entre 6 y 10 pacientes, incluidos estos extremos
g) Generar una muestra aleatoria con 10 de valores de esta distribución.
Ejercicio Guiado2
Una solución que contiene un determinado virus en una concentración de 6×106 por mm3. En la misma solución hay 3×106 bacterias. Suponiendo que los virus se distribuyen al azar entre las bacterias, se pide:
a) Definir una variable aleatoria que cuente el número de virus en la solución e identificar la distribución de probabilidad que sigue esta variable aleatoria
b) Probabilidad de que las bacterias no estén afectas por el virus
c) Probabilidad de que las bacterias estén afectas por el virus
d) Probabilidad de que las bacterias tengan al menos dos virus fijados en ellas
e) Probabilidad de que las bacterias tengan exactamente dos virus fijados en ellas
f)Probabilidad de que las bacterias tengan entre 6 y 10 virus fijados en ellas, incluidos estos extremos
g) Generar una muestra aleatoria con 10 de valores de esta distribución.
Ejercicio Guiado3
La concentración en plomo en partes por millón en la corriente sanguínea de un individuo tiene de media 0.25 y una desviación típica de 0.11. Supongamos que dicha concentración sigue una ley Normal. Se pide:
a) Definir la variable aleatoria e identificar la distribución de probabilidad que sigue esta variable aleatoria
b) Una concentración superior o igual a 0.6 partes por millón se considera extremadamente alta ¿Cuál es la probabilidad de que un individuo seleccionado al azar esté incluido en esa categoría?
c) Obtener la probabilidad de que la concentración en plomo, en partes por millón, de un individuo sea inferior a 0.15
d) Obtener la probabilidad de que la concentración en plomo, en partes por millón, de un individuo esté comprendidos entre 0.3 y 0.7
e) Determinar la concentración mínima del 30% de los individuos con más concentración
f) Determinar la mediana de esta distribución
g) Generar una muestra de tamaño 12 para esta distribución Normal.
Ejercicio Guiado 1 (Resuelto)
Por larga experiencia se ha determinado que la meningitis por salmonelas, enfermedad rara, pero muy grave de los lactantes, produce una mortalidad del 60%. Durante un brote epidémico en una gran ciudad, en un hospital de dicha ciudad, ingresaron 16 niños lactantes atacados por la enfermedad. Se pide:
a) Definir una variable aleatoria que cuente el número de supervivientes que ingresan en el hospital con la enfermedad e identificar la distribución de probabilidad que sigue esta variable aleatoria
b) Probabilidad de que sobrevivan todos los pacientes
c) Probabilidad de que sobrevivan más de la mitad de los pacientes
d) Probabilidad de que mueran todos los pacientes
e) Probabilidad de que más de dos pacientes sobrevivan
f) Probabilidad de que sobrevivan por lo menos dos pacientes
g) Probabilidad de que el número de sobrevivientes esté comprendido entre 6 y 10 pacientes, incluidos estos extremos
h) Generar una muestra aleatoria con 10 de valores de esta distribución.
Solución:
a) Definir una variable aleatoria que cuente el número de supervivientes que ingresan en el hospital con la enfermedad e identificar la distribución de probabilidad que sigue esta variable aleatoria
Definimos la variable aleatoria X = “Nº de pacientes que sobreviven”
Esta variable aleatoria tiene una distribución Binomial de parámetros n = 16 y p = 0.4. (X → B (16, 0.4))
b) Probabilidad de que sobrevivan todos los pacientes
En este apartado piden la probabilidad de que la variable aleatoria tome exactamente el valor 16, es decir, piden la función masa de probabilidad evaluada en el punto 16
P[Sobrevivan todos los pacientes] = P[X = 16]
Para resolverlo utilizamos la función dbinom(x, size, prob)
> dbinom(16,16, 0.4)
[1] 4.294967e-07
Por tanto, P[Sobrevivan todos los pacientes] = P[X =16] = 0.00000042
c) Probabilidad de que sobrevivan más de la mitad de los pacientes
P[Sobrevivan más de la mitad] = P[X > 8] = 1 – P[X ≤ 8] = 1 – F(8). Para resolverlo utilizamos la función pbinom
> 1 – pbinom (8,16, 0.4)
[1] 0.1422697
P[Más de la mitad de los pacientes sobrevivan] = P[X > 8] = 1 – P[X ≤ 8] = 0.1422697
d) Probabilidad de que mueran todos los pacientes
P[Mueran todos los pacientes] = P[X = 0]
> dbinom(0,16, 0.4)
[1] 0.000282111
P[Mueran todos los pacientes] = P[X = 0] = 0.000282111
e) Probabilidad de que más de dos pacientes sobrevivan
P[Sobrevivan más de dos pacientes] = P[X > 2] = 1 – P[X ≤ 2] = 1 – F(2). Para resolverlo utilizamos la función pbinom
> 1 – pbinom (2,16, 0.4)
[1] 0.9816628
P[Sobrevivan más de dos pacientes] = P[X > 2] = 1 – P[X ≤ 2] = 0.9816628
f) Probabilidad de que sobrevivan por lo menos dos pacientes
P[Sobrevivan por lo menos dos pacientes] = P[X ≥ 2] = 1 – P[X < 2] = 1 – F(1). Para resolverlo utilizamos la función pbinom
> 1 – pbinom (1,16, 0.4)
[1] 0.9967087
P[Sobrevivan por lo menos dos pacientes] = P[X ≥ 2] = 1 – P[X < 2] = 0.9967087
g) Probabilidad de que el número de sobrevivientes esté comprendido entre 6 y 10 pacientes, incluidos estos extremos
c) Contraigan la gripe entre tres y cinco pacientes, ambos inclusive
P[Sobrevivan entre 6 y 10 pacientes (incluidos extremos)] = P[6 ≤ X ≤ 10] =P[X ≤ 10] – P[X < 6 ] = P[X ≤ 10] – P[X ≤ 5 ] = F(10) – F(5)
Por lo que el cálculo de dicha probabilidad se reduce al cálculo del valor de la función de distribución en los puntos 10 y 5. Podemos calcular ambos valores de forma simultánea mediante la función pbinom del siguiente modo
> pbinom (c(10, 5),16, 0.4)
[1] 0.9808581 0.3288404
> 0.9808581 – 0.3288404
[1] 0.6520177
P[Sobrevivan entre 6 y 10 pacientes (incluidos extremos)] = P[6 ≤ X ≤ 10] =P[X ≤ 10] – P[X < 6 ] = F(10) – F(5) = 0.6520177
h) Generar una muestra aleatoria con 10 de valores de esta distribución.
Para generar una muestra aleatoria utilizamos la función rbinom
> rbinom(10, 16, 0.4)
[1] 7 9 8 5 6 4 8 5 8 5
Nota: Dado el carácter aleatorio de los valores generados en este apartado, dichos valores pueden no coincidir con los que se obtengan a través de otra llamada a la función rbinom.
Ejercicio Guiado2 (Resuelto)
Una solución que contiene un determinado virus en una concentración de 6×106 por mm3. En la misma solución hay 3×106 bacterias. Suponiendo que los virus se distribuyen al azar entre las bacterias, se pide:
a) Definir una variable aleatoria que cuente el número de virus en la solución e identificar la distribución de probabilidad que sigue esta variable aleatoria
b) Probabilidad de que las bacterias no estén afectas por el virus
c) Probabilidad de que las bacterias estén afectas por el virus
d) Probabilidad de que las bacterias tengan al menos dos virus fijados en ellas
e) Probabilidad de que las bacterias tengan exactamente dos virus fijados en ellas
f) Probabilidad de que las bacterias tengan más de cuatro y menos de 8 virus fijados en ellas
g) Generar una muestra aleatoria con 10 de valores de esta distribución.
Solución:
a) Definir una variable aleatoria que cuente el número de virus en la solución e identificar la distribución de probabilidad que sigue esta variable aleatoria
Definimos la variable aleatoria X = “Nº de virus por bacterias en la solución”
Los virus se distribuyen al azar entre las bacterias. La distribución del número de virus por bacterias es una distribución de Poisson de media λ = (6×106) ⁄(3×106)= 2. X → P(2)
b) Probabilidad de que las bacterias no estén afectas por el virus
Hay que calcular la probabilidad de que la variable aleatoria X tome el valor 0
P[No afectadas por el virus] = P[X = 0]
Es decir, el valor de la función masa de probabilidad de la variable aleatoria X en el punto 0. Para ello, vamos a utilizar la función dpois
> dpois(0, 2)
[1] 0.1353353
P[No afectadas por el viru] = P[X = 0] = 0.1353353
c) Probabilidad de que las bacterias estén afectas por el virus
P[Afectadas por el viru] = 1 – P[No afectadas por el viru] = 1 – P[X = 0]
> 1 – dpois(0, 2)
[1] 0.8646647
P[Afectadas por el viru] = 1 – P[X = 0] = 1- 0.1353353 = 0.8646647
d) Probabilidad de que las bacterias tengan al menos dos virus fijados en ellas
P[Al menos dos virus] = P[X ≥ 2] = 1 – P[X < 2] = 1 – P[X = 0] – P[X = 1]
> 1 – ( dpois (0, 2) + dpois (1, 2) )
[1] 0.5939942
o bien
P[Al menos dos virus] = P[X ≥ 2] = 1 – P[X < 2] = 1 – P[X ≤ 1] = 1 – F(1). Para ello, utilizamos la función ppois
> 1 – ppois(1, 2)
[1] 0.5939942
b) Lleguen menos de quince pacientes en una hora
P[Lleguen menos de cinco pacientes en una hora] = P[X < 5] = P[X ≤ 4]
Se puede obtener mediante la función masa de probabilidad o la función de distribución.
En el caso de la función masa de probabilidad
P[Lleguen menos de cinco pacientes en una hora] = P[X < 5] = P[X ≤ 4] = P[X = 0] + P[X = 1] + P[X = 2] + P[X = 3] + P[X = 4]
Es decir, el valor de la función masa de probabilidad de la variable aleatoria X en los puntos: 0, 1, 2, 3 y 4. Para ello, vamos a utilizar la función dpois
> dpois (0, 10) + dpois (1, 10) + dpois (2, 10) + dpois (3, 10) + + dpois (4, 10)
[1] 0.02925269
En el caso de la función de distribución
P[Lleguen menos de cinco pacientes en una hora] = P[X < 5] = P[X ≤ 4] = F(4). Para ello, utilizamos la función ppois
> ppois(4, 10)
[1] 0.02925269
e) Probabilidad de que las bacterias tengan exactamente dos virus fijados en ellas
Hay que calcular P[X = 2]. Para ello, vamos a utilizar la función dpois
> dpois(2, 2)
[1] 0.2706706
P[X = 2] = 0.2706706
f) Probabilidad de que las bacterias tengan más de cuatro y menos de 8 virus fijados en ellas
P[más de cuatro y menos de ocho virus] = P[4 < X < 8] = P[X < 8] – P[X ≤ 4] = P[X ≤ 7] – P[X ≤ 4] = F(7) – F(4)
Hemos expresado la función masa de probabilidad en función de la función de distribución de la variable evaluada en los puntos 7 y 4. Para resolverlo utilizamos la función ppois
> ppois(c(4, 7), 2)
[1] 0.9473470 0.9989033
> 0.9989033 – 0.9473470
[1] 0.0515563
P[más de cuatro y menos de ocho virus] = P[X ≤ 7] – P[X ≤ 4] = 0.0515563
d) Generar una muestra aleatoria con 10 de valores de esta distribución.
> rpois (10, 2)
[1] 2 2 1 3 0 3 3 3 2 3
Ejercicio Guiado 3 (Resuelto)
La concentración en plomo en partes por millón en la corriente sanguínea de un individuo tiene de media 0.25 y una desviación típica de 0.11. Supongamos que dicha concentración sigue una ley Normal. Se pide:
a) Definir la variable aleatoria e identificar la distribución de probabilidad que sigue esta variable aleatoria
b) Una concentración superior o igual a 0.6 partes por millón se considera extremadamente alta ¿Cuál es la probabilidad de que un individuo seleccionado al azar esté incluido en esa categoría?
c) Obtener la probabilidad de que la concentración en plomo, en partes por millón, de un individuo sea inferior a 0.15
d) Obtener la probabilidad de que la concentración en plomo, en partes por millón, de un individuo esté comprendidos entre 0.3 y 0.7
e) Determinar la concentración mínima del 30% de los individuos con más concentración
f) Determinar la mediana de esta distribución
g) Generar una muestra de tamaño 12 para esta distribución Normal.
Solución
a) Definir una variable aleatoria que cuente el número de supervivientes que ingresan en el hospital con la enfermedad e identificar la distribución de probabilidad que sigue esta variable aleatoria
Se define la variable, X = “Concentración en plomo de un individuo”. Esta variable tiene distribución Normal con media 0.25 y desviación típica 0.11; X → N(0.25, 0.11)
b) Una concentración superior o igual a 0.6 partes por millón se considera extremadamente alta ¿Cuál es la probabilidad de que un individuo seleccionado al azar esté incluido en esa categoría?a)
P[ X ≥ 0.6 ] = 1 – P[X ≤ 0.6] = 1 – F(0.6)
Calculamos la probabilidad pedida utilizando la función de distribución. Usamos la función pnorm
> 1 – pnorm(0.6, mean = 0.25, sd = 0.11)
[1] 0.0007317683
Por lo tanto, P[ X ≥ 0.6 ] = 0.0007317683
c) Obtener la probabilidad de que la concentración en plomo, en partes por millón, de un individuo sea inferior a 0.15
Para calcular P[ X < 0.15 ] utilizamos la función pnorm
> pnorm(0.15, mean = 0.25, sd = 0.11)
[1] 0.0007317683
d) Obtener la probabilidad de que la concentración en plomo, en partes por millón, de un individuo esté comprendidos entre 0.3 y 0.7
P[Niveles comprendidos entre 0.3 y 0.7] = P[0.3 ≤ X ≤ 0.7] = P[X ≤ 0.7] – P[X ≤ 0.3] = F(0.7)- F(0.3). Utilizamos de nuevo la función de distribución pnorm
> pnorm(c(0.7, 0.3),mean = 0.25, sd = 0.11)
[1] 0.9999785 0.6752819
> 0.9999785 – 0.6752819
[1] 0.3246966
Por lo tanto, P[Niveles comprendidos entre 0.3 y 0.7] = P[0.3 ≤ X ≤ 0.7] = P[X ≤ 0.7] – P[X ≤ 0.3] = 0.3246966
e) Determinar la concentración mínima del 30% de los individuos con más concentración
Se pide calcular un valor de la distribución de X, tal que P[X < x] = 0.30
El valor que tenemos que calcular es el cuantil 25. Utilizamos la función qnorm.
> qnorm(0.30, mean = 0.25, sd = 0.11)
[1] 0.1923159
Se obtiene como resultado P[X < 0.1923159] = 0.30
f) Determinar la mediana de esta distribución
Media = Moda = Mediana = 0.25
g) Generar una muestra de tamaño 12 para esta distribución Normal.
> rnorm(12, mean = 0.25, sd = 0.11)
[1] 0.34891212 0.28912985 0.27835061
[4] 0.22699688 0.21144003 0.25942971
[7] 0.21443050 0.28756905 0.39852037
[10] -0.02553467 0.22977419 0.26571378
Ejercicios Propuestos
Ejercicio Propuesto 1
El delegado de una casa dedicada a la fabricación de calculadoras, vende el mismo días 5 calculadoras iguales a distintas empresas de una misma localidad. La probabilidad de que este tipo de calculadoras estén en funcionamiento 3 años después es 0.8. Calcular las siguientes probabilidades.
a) Las cinco calculadoras estén fuera de servicio 3 años más tarde
b) Las cinco calculadoras estén en servicio 3 años más tarde
c) Dos calculadoras a lo sumo estén fuera de servicio
d) No más de tres calculadoras a lo sumo estén fuera de servicio
e) Entre 1 y 4 calculadoras estén fuera de servicio
f) Generar una muestra aleatoria de tamaño 8 del número de calculadoras en funcionamiento.
Ejercicio Propuesto 2
El número de capturas diarias de loros en la cuenca del Amazonas para su utilización como animales domésticos sigue una distribución de Poisson de parámetro 5. Calcular las siguientes probabilidades:
a) No se produzcan más de cuatro capturas en un día
b) Se produzcan al menos cuatro capturas en un día
c) Se produzcan menos de cuatro capturas en un día
d) Calcular la mediana de la variable aleatoria
e) En una semana no se produzcan más de cuatro capturas ningún día
f) Generar una muestra aleatoria de tamaño 8 del número de capturas diarias de loros.
Ejercicio Propuesto 3
Se observó que el número de glóbulos rojos (en millones por microlitro) de un grupo de individuos sigue una distribución Normal de media 4.5 y desviación típica 0.5. Se pide:
a) La probabilidad de que una persona tenga más de 4.85
b) La probabilidad de que una persona tenga menos de 4.85
c) La probabilidad de que una persona tenga entre 4.25 y 4.75
d) Los cuartiles de la distribución
e) Si se desea estudiar los hábitos alimenticios del 20% de personas con mayor número de glóbulos rojos ¿Cuál es el número mínimo de glóbulos rojos de dichas personas?
f) Una muestra aleatoria de 20 valores de la distribución
Ejercicio Propuesto 4
La cantidad de radiación que puede ser absorbida por un individuo antes de que le sobrevenga la muerte tiene una media de 500 roentgen y una desviación típica de 150 roentgen. Supongamos que la distribución de la cantidad de radiación sigue una ley Normal. Se pide:
a) ¿Cuál es la probabilidad de que la cantidad de radiación sea superior a 600 roentgen?
b) ¿Cuál es la probabilidad de que la cantidad de radiación esté entre 650 roentgen y 750 roentgen?
c) ¿Cuál es el porcentaje de supervivientes para un nivel de radiación de 800 roentgen?
d) ¿Por encima de qué nivel de dosificación sobrevivirían solamente el 5% de los expuestos?
e) Obtener el percentil 75.
Ejercicio Propuesto 1 (Resuelto)
El delegado de una casa dedicada a la fabricación de calculadoras, vende el mismo días 5 calculadoras iguales a distintas empresas de una misma localidad. La probabilidad de que este tipo de calculadoras estén en funcionamiento 3 años después es 0.8. Calcular las siguientes probabilidades.
a) Las cinco calculadoras estén fuera de servicio 3 años más tarde
b) Las cinco calculadoras estén en servicio 3 años más tarde
c) Dos calculadoras a lo sumo estén fuera de servicio
d) No más de tres calculadoras a lo sumo estén fuera de servicio
e) Entre 1 y 4 calculadoras estén fuera de servicio
f) Generar una muestra aleatoria de tamaño 8 del número de calculadoras en funcionamiento.
Solución:
Se define la variable, X = “Número de calculadoras que están en funcionamiento 3 años después.” X → B(5, 0.8)
a) Las cinco calculadoras estén fuera de servicio 3 años más tarde
P[X = 0] = 0.00032
b) Las cinco calculadoras estén en servicio 3 años más tarde
P[X = 5] = 0.32768
c) Dos calculadoras a lo sumo estén fuera de servicio
Y = “Número de calculadoras que fuera de servicio” Y → B(5, 0.2)
P[Y ≤ 2] = 0.94208
d) No más de tres calculadoras a lo sumo estén fuera de servicio
P[Y ≤ 3] = 0.99328
e) Entre 1 y 4 calculadoras estén fuera de servicio
P[1 ≤ Y ≤ 4] = 0.2624
f) Generar una muestra aleatoria de tamaño 8 del número de calculadoras en funcionamiento.
Para generar una muestra de la variable aleatoria Y → B(5, 0.8), utilizamos la función rbinom.
Solución del Ejercicio Propuesto 1
Ejercicio Propuesto 2 (Resuelto)
El número de capturas diarias de loros en la cuenca del Amazonas para su utilización como animales domésticos sigue una distribución de Poisson de parámetro 5. Calcular las siguientes probabilidades:
a) No se produzcan más de cuatro capturas en un día
b) Se produzcan al menos cuatro capturas en un día
c) Se produzcan menos de cuatro capturas en un día
d) Calcular la mediana de la variable aleatoria
e) En una semana no se produzcan más de cuatro capturas ningún día
f) Generar una muestra aleatoria de tamaño 8 del número de capturas diarias de loros.
Solución:
Se define la variable, X = “Número de capturas diarias de loros” X → P(5)
a) No se produzcan más de cuatro capturas en un día
P[X ≤ 4] = 0.4404933
b) Se produzcan al menos cuatro capturas en un día
P[X ≥ 4] = 0.5595067
c) Se produzcan menos de cuatro capturas en un día
P [X < 4] = 0.2650259
d) Calcular la mediana de la variable aleatoria
La mediana es 5
e) En una semana no se produzcan más de cuatro capturas ningún día
Y = “Número de capturas en los 7 días de la semana donde no se producen más de 4 capturas” Y → B(7, 0.4405)
P[Y = 7] = 0.003218262
f) Generar una muestra aleatoria de tamaño 8 del número de capturas diarias de loros.
Para generar 8 valores aleatorios de la distribución de Poisson utilizamos la función rpois.
7 4 2 3 3 4 2 1
Solución del Ejercicio Propuesto 2
Ejercicio Propuesto 3 (Resuelto)
Se observó que el número de glóbulos rojos (en millones por microlitro) de un grupo de individuos sigue una distribución Normal de media 4.5 y desviación típica 0.5. Se pide:
a) La probabilidad de que una persona tenga más de 4.85
b) La probabilidad de que una persona tenga menos de 4.85
c) La probabilidad de que una persona tenga entre 4.25 y 4.75
d) Los cuartiles de la distribución
e) Si se desea estudiar los hábitos alimenticios del 20% de personas con mayor número de glóbulos rojos ¿Cuál es el número mínimo de glóbulos rojos de dichas personas?
f) Una muestra aleatoria de 20 valores de la distribución.
Solución:
a) La probabilidad de que una persona tenga más de 4.85
P[X > 4.85] = 0.2419637
b) La probabilidad de que una persona tenga menos de 4.85
P[X < 4.85] = 0.7580363
c) La probabilidad de que una persona tenga entre 4.25 y 4.75
P[4.25 ≤ X ≤ 4.75] = 0.382925
d) Los cuartiles de la distribución
los tres cuartiles de esta distribución son 4.162755, 4.500000, 4.837245
e) Si se desea estudiar los hábitos alimenticios del 20% de personas con mayor número de glóbulos rojos ¿Cuál es el número mínimo de glóbulos rojos de dichas personas?
El número mínimo pedido es : 4.920811
e) Una muestra aleatoria de 20 valores de la distribución.
Para obtener una muestra de 20 valores aleatorios de la distribución normal utilizamos la función rnorm
Solución del Ejercicio Propuesto 3
Ejercicio Propuesto 4 (Resuelto)
La cantidad de radiación que puede ser absorbida por un individuo antes de que le sobrevenga la muerte tiene una media de 500 roentgen y una desviación típica de 150 roentgen. Supongamos que la distribución de la cantidad de radiación sigue una ley Normal. Se pide:
a) ¿Cuál es la probabilidad de que la cantidad de radiación sea superior a 600 roentgen?
b) ¿Cuál es la probabilidad de que la cantidad de radiación esté entre 650 roentgen y 750 roentgen?
c) ¿Cuál es el porcentaje de supervivientes para un nivel de radiación de 800 roentgen?
d) ¿Por encima de qué nivel de dosificación sobrevivirían solamente el 5% de los expuestos?
e) Obtener el percentil 75.
Solución:
X → N(500, 150)
a) ¿Cuál es la probabilidad de que la cantidad de radiación sea superior a 600 roentgen?
P[X > 600] = 0.2524925
b) ¿Cuál es la probabilidad de que la cantidad de radiación esté entre 650 roentgen y 750 roentgen?
P[650 < X < 750] = 0.1108649
c) ¿Cuál es el porcentaje de supervivientes para un nivel de radiación de 800 roentgen?
P[X ≥ 800] = 0.02275013
d) ¿Por encima de qué nivel de dosificación sobrevivirían solamente el 5% de los expuestos?
El valor pedido es 746.728
e) Obtener el percentil 75.
El percentil 75 es 601.1735
Solución del Ejercicio Propuesto 4
Autora: Ana María Lara Porras. Universidad de Granada. (2017)