Práctica 4

DISTRIBUCIONES DE PROBABILIDAD: BINOMIAL, POISSON Y NORMAL

Objetivos

    • Seleccionar la distribución de probabilidad para modelizar un experimento aleatorio
    • Calcular probabilidades de las distribuciones Binomial, Poisson y Normal
    • Calcular cuantiles
    • Generar valores aleatorios de una distribución determinada.

Introducción

En la teoría de la probabilidad existen muchos modelos teóricos que resultan de utilidad en una gran variedad de situaciones prácticas, ya que sirven para modelizar gran número de situaciones reales. Estas distribuciones o modelos de probabilidad se dividen en dos grandes grupos dependiendo del tipo de la variable que modelizan. Así, distinguimos entre distribuciones de probabilidad discretas, si la variable aleatoria que modelizan es de naturaleza discreta y distribuciones de probabilidad continuas, cuando la variable aleatoria es continua.

Existen muchas distribuciones de probabilidad pero, dado el carácter introductorio de esta práctica, nos limitaremos a estudiar la distribución binomial y la distribución de Poisson como ejemplos de distribuciones discretas y la distribución Normal para ilustrar las distribuciones continuas.

Función masa de probabilidad

Una variable aleatoria no está perfectamente definida si no se conocen los valores que puede tomar (recorrido), pero dichos valores son impredecibles. Puesto que el comportamiento de una variable aleatoria está gobernado por el azar, debemos determinar dicho comportamiento en términos de probabilidades. Para ello se utilizan dos funciones: la Función Masa de Probabilidad y la Función de Distribución.

La función masa de probabilidad de una variable aleatoria discreta es una función que a cada valor posible de dicha v.a. le asigna una probabilidad. Así en los ejemplos:

  • Ejemplo. La v.a. X = “Cara superior de una moneda ” puede tomar los valores X={1, 0} con probabilidades P(X)={1/2, 1/2}. Así, la probabilidad de que la v.a.
    • X tome el valor 1, que se denota por P[X=1], vale 1/2 (P[X=1]=1/2) y que
    • X tome el valor 0, que se denota por, P[X=0], vale 1/2 (P[X=0]=1/2).
  • Ejemplo. La v.a. X = “Máximo de los dos números obtenidos” puede tomar los valores X={1, 2, 3, 4, 5, 6} con probabilidades P(X)={1/36, 3/36, 5/36, 7/36, 9/36, 11/36}. Así, por ejemplo, P[X=2]=3/36 o P[X=6]=11/36.

la Función Masa de Probabilidad de la variable aleatoria discreta \( X \), se denota por \( p_i \), y se define como la probabilidad de que la v.a. \( X \) tome un valor \( x_i \), \( p_i = P[X= x_i] \), si verifica las siguientes propiedades:

  •   \( \displaystyle \sum_{i=1}^{k} p_i = 1 \)
  •  \( p_i  \geq 0 \hspace{.2cm}  \forall i  \)

En una variable aleatoria continua no tiene sentido determinar una función, como en las vv.aa. discretas, que asigne a cada valor posible de dicha v.a. una probabilidad; puesto que la v.a. continua puede tomar infinitos valores y la probabilidad de que la v.a. tome un valor determinado vale cero. Por ello, en el caso continuo definiremos una función que nos permita calcular la probabilidad de que la v.a. esté comprendida en un intervalo de valores específico. Dicha función recibe el nombre de Función de Densidad de probabilidad, y se denota por  f(x).

La Función de Densidad de probabilidad, es una función definida para todos los números reales tal que satisface las siguientes condiciones:

  1. \( f(x) \geq 0  \)   (no negativa) \( \forall x \)
  2.  \( \int_{- \infty}^{+ \infty}f(x)dx=1 \) (El área comprendida entre la gráfica de f y el eje x es igual a 1)
  3.  \( P[a < X < b] = \int_{a}^{b}f(x)dx \) (Para cualquier valor real entre los números a y b,  \( P[a < X < b] \) representa el área comprendida entre la gráfica de f(x), el eje OX y las rectas x=a y x=b).

Función de distribución

Se define la Función de Distribución de la variable aleatoria \( X \), y se denota por \( F(X) \), como la probabilidad de que la v.a. \( X \)  tome un valor menor o igual que \( x \)

\( F_{X}(x) = P [X \leq x] \hspace {1cm} \forall x \)

Expresión 1: Función de distribución

Es decir, \( F(X) \) es una función de los números reales, R, en el intervalo [0,1]

\( F_X : R \longrightarrow [0,1] \) de forma que

\(  \forall x \in R, \hspace {1cm} F_{X} (x) = P[X \leq x] \)

Expresión 2: F(X)

La variable aleaoria discreta está caracterizada por la función masa de probabilidad. Conocidos los valores \( p_i \) se puede conocer la función de distribución. En efecto,

 \(   \begin{array}{ll} F(x_1) & = P[X \leq x_1] = P[X=x_1] = p_1 \\  F(x_2) & = P[X \leq x_2] = P[X=x_1] + P[X=x_2] = p_1 + p_2  \\  \vdots & \vdots  \\ F(x_i) & = P[X \leq x_i] =  \displaystyle \sum_{j=1}^{i }P[X=x_j]  = p_1 + p_2 + \dots + p_i \\ \end{array}  \)

Expresión 3: Función de distribución conocidos los valores pi 

Propiedades

  • \(  P1) \)   \(  F{X}(.) \)  es una función no-decreciente
  • \(  P2) \)   \(  F{X}(.) \)  es continua a la derecha
  • \(  P3) \)   \(  F{X}(+ \infty) = +1 \)  y  \(  F{X}(- \infty) =  0 \)
  • \(  P4) \)   \(  P[x_1 < X  \leq  x_2] = F(x_2) – F(x_1)  \)
  • \(  P5) \)   \(  P[X > x] = 1 – F(x) \)

En la variable aleatoria continua \( X \), recibe el nombre de Función de Distribución, y se denota por \( F_{X} \) (o \( F \) cuando en el contexto está claro a la v.a. que se refiere), la función \( F: R \rightarrow [0,1] \) definida por:

\( F(x_i) = P [X \leq x_i] = \displaystyle \int_{-\infty}^{x_i} f(x) dx \)

Expresión 4: Función de distribución en la v.a. continua

La función de densidad y la función de distribución de una v.a. continua están relacionadas:

\( F(x) =  \displaystyle \int_{-\infty}^{x} f(x) dx  \hspace {2cm} \) \( f(x) =  \displaystyle \frac {\partial F(x)}{ \partial x } = F´(x) \)

Expresión 5: Función de distribución y función de densidad

Por lo tanto se verifica:

  1.  \( P[a < X < b] = F(b) – F(a) \)
  2.  \( P[X < a] = F(a) \)
  3.  \( P[X > b] = 1 – F(b) \)

La función de distribución es monótona no-decreciente, continua por lo menos a la derecha y tal que

\( \displaystyle \lim_{x \to -\infty } F(x) = 0 \hspace {2cm} \) y \( \hspace {2cm} \displaystyle \lim_{x \to +\infty} F(x) = 1   \)

Expresión 6: Valores extremos de la función de distribución

Se comprueba fácilmente que si \( X \) es una v.a. continua entonces la probabilidad del suceso \( X \) igual a constante es cero, \( P[X= a] =0 \) , aunque no es el suceso imposible. En efecto,

\( P[X= a] =  \displaystyle \int_{a}^{a} f(x) dx =0 \)

Expresión 7: P[X=a]

Distribución Binomial

Consideremos repeticiones independientes de un experimento aleatorio con dos posibles resultados a los cuales nos referiremos genéricamente como “éxito” y “fracaso”. El éxito ocurre con una probabilidad \(  p \) y el fracaso, por tanto, con una probabilidad \(  q = 1-p \).

En este contexto, interesa estudiar el número de éxitos en estas repeticiones del experimento aleatorio y, para ello, se define la siguiente variable aleatoria,  X = “Número de éxitos en n ensayos independientes con probabilidad de éxito constante p ”. 

Entonces decimos que \(  X \) sigue una distribución binomial de parámetros \(  n \) y \(  p \), y lo representamos como \(  X \rightarrow B (n,p ) \).

La distribución binomial es una distribución de probabilidad discreta, mide el número de éxitos en una secuencia de \(  n \) ensayos independientes, con una probabilidad fija \(  p \) de ocurrencia de éxitos entre los ensayos.

Es evidente que los posibles valores que puede tomar la variable aleatoria (o, lo que es lo mismo, el número de ensayos exitosos de los que se realizan) son los valores comprendidos entre 0 y n.

A continuación vamos a definir y calcular:

  1. La probabilidad de que la variable aleatoria X tome cada valor concreto o, equivalentemente, el valor de la función masa de probabilidad en cada uno de estos puntos
  2. La probabilidad que acumula cada uno de los valores de la variable aleatoria X, es decir, el valor de la función de distribución en cada punto de la variable
  3. Cuantiles de la distribución binomial
  4. Valores aleatorios de la distribución binomial.

Función masa de probabilidad

La función masa de probabilidad de una variable aleatoria discreta, la cual suele representarse por \(  p_i \), es una función que asigna una determinada probabilidad a cada uno de los puntos de la variable.

\(  p_i  = P [ X = x_i ] \)

En R, los valores de la función masa de probabilidad de una variable con distribución binomial se obtienen a través de la función dbinom, la cual necesita los siguientes argumentos:

 dbinom(x, size, prob)

donde:

  • x: es el valor (o los valores) de la variable para el cual (o los cuales) queremos calcular la función masa de probabilidad
  • size y prob: son los dos parámetros de la distribución binomial (n y p, respectivamente). En caso de que el argumento  esté formado por dos o más valores, éstos vendrán concatenados mediante la función c(,).

Función de distribución

La función de distribución evaluada en un punto \( x_i \) xi de una variable aleatoria discreta se denota por \(  F(x_i) \) y viene dada por

\(  F(x_i) = P[X \leq x_i] = P [X = 0] + P [X  = 1] + \cdots + P [X = x_i] \) 

Para calcular valores de la función de distribución de una distribución binomial con R utilizaremos la función pbinom, que tiene los siguientes argumentos:

pbinom(q, size, prob)

siendo q el valor (o los valores) de la variable en el cual (o los cuales) queremos calcular la función de distribución y size y prob, los parámetros de la distribución.

Cuantiles de la distribución binomial

Por definición, el cuantil de orden α  de una distribución de probabilidad es aquel valor de la distribución que deja a su izquierda una proporción de valores α (o, equivalentemente, un porcentaje del \(  (α \times100)%  \)).  Esto es, el cuantil de orden \(  α \), será aquel valor \(  k \) tal que

\(  P[ X \leq  k ] = α \)

Para calcular cuantiles de una distribución binomial en R recurriremos a la función qbinom, que tiene los siguientes argumentos:

qbinom(p, size, prob)

siendo p el orden del cuantil que queremos calcular (en tanto por uno) y, size y prob los dos parámetros que identifican a la distribución binomial.

Generar valores aleatorios de la distribución binomial

Por último, calcular muestras de valores aleatorios generados a partir de una distribución binomial. Esta opción puede resultar de mucho interés en experimentos de simulación en los que se conoce de antemano que la variable de interés sigue una distribución binomial. Para generar estos valores utilizamos la función rbinom de R, la cual requiere los siguientes argumentos:

rbinom(n, size, prob)

donde n es el número de valores aleatorios a generar y size y prob son los dos parámetros de la distribución.

Veamos un ejemplo sencillo en el que se utilizan estas 4 funciones.

Supuesto Práctico 1

A un examen se han presentado un total de 80 alumnos y la probabilidad de aprobar el examen es de 0.85. Se pide

a) Definir una variable aleatoria que cuente el número de alumnos que superan el examen. Identificar la distribución de probabilidad que sigue esta variable aleatoria

b) Calcular la probabilidad de que exactamente 55 alumnos superen el examen

c) Obtener la probabilidad de que al menos 65 alumnos superen el examen

d) Obtener la probabilidad de que entre 60 y 75 alumnos (ambos inclusive) superen el examen

e) Calcular el valor de la variable tal que deja a su derecha un 35% de las observaciones

f) Generar una muestra de 20 valores aleatorios de esta distribución.

Solución

a) Definir una variable aleatoria que cuente el número de alumnos que superan el examen. Identificar la distribución de probabilidad que sigue esta variable aleatoria

En primer lugar, definimos la variable aleatoria X  = “Número de alumnos que aprueban el examen de los 80 que se presentan”.

A partir de la información que nos proporciona el enunciado podemos afirmar que  \(  X \rightarrow B(80, 0.85) \).

b)  Calcular la probabilidad de que exactamente 55 alumnos superen el examen

En este apartado nos piden la probabilidad de que la variable aleatoria tome, exactamente, un valor o, lo que es lo mismo, el valor de la función masa de probabilidad evaluada en el punto \(  x_i = 55 \). Debemos, por tanto, calcular \( p_{55} = P[X=55] \). Para ello, utilizaremos la función dbinom del siguiente modo

 > dbinom(55, 80, 0.85)
[1] 0.000120427

La probabilidad que buscamos es, por tanto, 0.00012.

c) Obtener la probabilidad de que al menos 65 alumnos superen el examen

En este caso, la probabilidad que nos piden calcular es \( P[X  \geq  65] \). Como \( P[X  \geq 65] = P[X=65] + P[X=66] + \cdots + P[X=80 ] \), podríamos pensar en utilizar de nuevo la función dbinom para obtener cada una de estas probabilidades puntuales y después sumarlas. Sin embargo, esto sería un proceso bastante tedioso, pues implicaría el cálculo de muchas probabilidades.

Por lo tanto, sabiendo que la probabilidad puede expresarse como \( P[X  \geq 65] = 1 – P[X  \leq 64] \). Y que la función de distribución evaluada en un punto \(  x_i \) se define como \( F(x_i) = P[X  \leq x_i] \). Tenemos que calcular

\(  P[X \geq 65] = 1 – P[X \leq 64] = 1 – F(44) \)

De manera que para calcular la probabilidad que nos pide el enunciado únicamente debemos hacer una llamada a la función pbinom tal y como se muestra a continuación:

> 1 – pbinom(64, 80, 0.85)
[1] 0.8624663
Concluimos, por tanto, que \(  P[X \geq 65]  = 0.8624 \).

d) Obtener la probabilidad de que entre 60 y 75 alumnos (ambos inclusive) superen el examen

En esta ocasión, nos piden calcular la probabilidad en un intervalo. Más concretamente, la probabilidad que necesitamos calcular es \( P[60 \leq X \leq 75] \). De nuevo, teniendo en cuenta que: \( P[60 \leq X \leq 75]  = P[X=60] + P[X=61] + \cdots + P[X=75] \), podríamos usar la función dbinom para obtener el valor de la función masa de probabilidad en cada uno de estos puntos y después sumarlos. Pero existe una alternativa más sencilla. La probabilidad \( P[60 \leq X \leq 75] \) puede reescribirse como

\( P[60 \leq X \leq 75]  = P[X \leq 75] – P[ X \leq 59] = F(75) – F(59) \)

por lo que el cálculo de dicha probabilidad se reduce al cálculo del valor de la función de distribución en los puntos 59 y 75. Podemos calcular ambos valores de forma simultánea mediante la función pbinom del siguiente modo:

> pbinom(c(59, 75), 80, 0.85)
[1] 0.006305257 0.995263001
De manera que la probabilidad que buscamos es:

>  0.995263001 –  0.006305257
[1] 0.9889577

Concluimos, por tanto, que \( P[60 \leq X \leq 75] = 0.988 \).

e) Calcular el valor de la variable tal que deja a su derecha un 35% de las observaciones

El valor de la variable  que deja a su derecha un 35% de las observaciones es el mismo que deja a su izquierda el 65% restante. Por tanto, debemos calcular el cuantil de orden 0.65 de una distribución binomial de parámetros 80 y 0.85. Utilizaremos, para ello, la función qbinom.

> qbinom(0.65, 80, 0.85)
[1] 69

f) Generar una muestra de 20 valores aleatorios de esta distribución

En este último apartado vamos a utilizar la función rbinom para generar la muestra de 20 valores aleatorios.

> rbinom(20, 80, 0.85)
 [1] 65 69 73 71 72 69 73 73 64 68 67 72 67 73 61 67 69 64 69 68

 Nota: Dado el carácter aleatorio de los valores generados en este apartado, dichos valores pueden no coincidir con los que se obtengan a través de otra llamada a la función rbinom.

Distribución de Poisson

La distribución de Poisson es una distribución de probabilidad discreta que sirve para modelizar la probabilidad de que ocurra un determinado número de eventos durante cierto período de tiempo. A modo de ejemplo, la distribución de Poisson se utiliza frecuentemente para contar el número de llamadas que una centralita telefónica recibe por unidad de tiempo o el número de clientes que llegan a un determinado establecimiento en un período de tiempo dado.

A diferencia de la distribución binomial, la cual necesita dos parámetros para ser correctamente identificada, la distribución de Poisson se define a partir de un único parámetro, que suele notarse por \( \lambda \). Generalmente, el parámetro \( \lambda \) representa el número medio de sucesos que ocurren por unidad de tiempo. Entonces, podemos definir la variable aleatoria  X = “Número de sucesos aleatorios que ocurren en un determinado periodo de tiempo” e identificar su distribución, \(  X \rightarrow P(λ) \). Los posibles valores que puede tomar una variable con distribución de Poisson van desde 0 a infinito.

Puesto que la distribución de Poisson también es una distribución discreta, los valores que podemos calcular son los mismos que ya estudiamos para la distribución binomial. Por lo tanto, para la distribución de Poisson obtendremos valores de la función masa de probabilidad, de la función de distribución y de los cuantiles. También generaremos muestras de valores aleatorios que siguen distribuciones de Poisson.

El tratamiento computacional con R de la distribución de Poisson es similar al que hemos empleado con la distribución binomial. La diferencia más notable es que el sufijo binom de las funciones dbinom, pbinom, qbinom y rbinom se sustituye por el sufijo pois, de manera que dbinom, pbinom, qbinom y rbinom se sustituyen por dpois, ppois, qpois y rpois cuando trabajamos con una distribución de Poisson.

Función masa de probabilidad

La función dpois calcula valores de la función masa de probabilidad de una distribución de Poisson. Sus argumentos son:

dpois(x, lambda)

donde:

  • x: es el valor (o los valores) de la variable para el cual (o los cuales) queremos calcular la función masa de probabilidad
  • lambda:  es el parámetro que define la distribución de Poisson.

Función de distribución

La función ppois se utiliza para calcular valores de la función de distribución (esto es, probabilidades acumuladas) de una variable con distribución de Poisson. Sus argumentos son:

ppois(q, lambda)

donde:

  • q: es el valor (o los valores) de la variable en el cual (o los cuales) queremos calcular la función de distribución
  • lambda: el parámetro que identifica la distribución.

Cuantiles de la distribución de Poisson

La función qpois se utiliza para calcular los valores de los cuantiles de una distribución de Poisson, es decir, los valores de la variable con distribución de Poisson que dejan a su izquierda una determinada proporción de observaciones.  Los argumentos de esta función son:

qpois(p, lambda)

 donde:

  • p: es la proporción de observaciones que dejará a su izquierda el cuantil en cuestión (es decir, el orden de dicho cuantil)
  • lambda: el parámetro de la distribución de Poisson.

Generar valores aleatorios de la distribución de Poisson

La función rpois se utiliza para generar valores aleatorios de una distribución de Poisson y sus argumentos son:

rpois(n, lambda)

 donde:

  • n: es el número de elementos aleatorios a generar
  • lambda: el parámetro que define la distribución de Poisson.

Veamos mediante un ejemplo sencillo cómo se utilizan cada una de estas 4 funciones.

Supuesto Práctico 2

Una sucursal bancaria de un pueblo pequeño atiende, en promedio, a 6 clientes por día. Se pide:

a) Definir una variable aleatoria que cuente el número de clientes por días e identificar la distribución de probabilidad que sigue esta variable aleatoria

b)  Calcular la probabilidad de que en un día dado, la sucursal atienda exactamente a 4 clientes

c)  Calcular la probabilidad de que, en un día cualquiera, la sucursal atienda al menos a 6 clientes

d) Calcular la probabilidad de que, en un día dado, la sucursal reciba entre 6 y 8 clientes (ambos inclusive)

e) Obtener la mediana de la variable

f)  Generar una muestra de 10 valores aleatorios de la distribución.

Solución

a) Definir una variable aleatoria que cuente el número de clientes por días e identificar la distribución de probabilidad que sigue esta variable aleatoria

En primer lugar vamos a definir la variable aleatoria: X = “Número de clientes que atiende la sucursal bancaria en un día”. Sabemos, por el enunciado que \( X \rightarrow P(6) \)

b)  Calcular la probabilidad de que en un día dado, la sucursal atienda exactamente a 4 clientes

En este apartado se pide la probabilidad de que la variable aleatoria X tome exactamente el valor 4, es decir, el valor de la función masa de probabilidad de X evaluada en el punto 4. Para ello, vamos a utilizar la función dpois.

> dpois(4, 6)
[1] 0.1338526

Dicha probabilidad es 0.1338.

c)  Calcular la probabilidad de que, en un día cualquiera, la sucursal atienda al menos a 6 clientes

La probabilidad que nos piden calcular en este caso es \( P[X \geq 6] \) . Para calcularla, utilizaremos una estrategia similar a la que empleamos en el apartado c) del supuesto práctico 1, en donde expresamos una probabilidad del tipo \( \geq \) en función de los valores de la función de distribución de la variable. Para ello, tendremos en cuenta que

\( P[X \geq 6] = 1 – P[X \leq 5] = 1 – F(5) \)

De manera que para calcular \( P[X \geq 6]  \) únicamente necesitamos calcular el valor de la función de distribución de la variable evaluada en el punto 5, para lo cual utilizaremos la función ppois.

> 1 – ppois(5, 6)
[1] 0.5543204

Por tanto, se tiene que \( P[X \geq 6] = 0.554 \)

d) Calcular la probabilidad de que, en un día dado, la sucursal reciba  entre 6 y 8 clientes (ambos inclusive)

En este apartado, la probabilidad que nos piden calcular es \( P[6 \leq X \leq 8] \). Vamos a obtenerla a través de dos métodos distintos: uno basado en la función masa de probabilidad y otro que utiliza la función de distribución.

Para calcular \( P[6 \leq X \leq 8] \) usando la función masa de probabilidad, tenemos que tener en cuenta que

\( P[6 \leq X \leq 8] = P[X  = 6] + P[ X = 7] + P[X = 8] \)

Por tanto, necesitamos obtener, y después sumar, los valores de la función masa de probabilidad de la variable evaluada en los puntos 6, 7 y 8.

> dpois (6, 6) + dpois (7, 6) + dpois (8, 6)
[1] 0.4015579

Esta estrategia sólo tiene cabida cuando el intervalo para el cual queremos calcular su probabilidad es relativamente estrecho y está compuesto por pocos valores. En cualquier otro caso, debemos utilizar un enfoque distinto, basado en la función de distribución.

Esta alternativa, de utilizar la función de distribución, para calcular \( P[6 \leq X \leq 8] \) parte de que dicha probabilidad puede reescribirse como

\( P[6 \leq X \leq 8] = P[X \leq 8] – P[ X \leq 5] = F(8) – F(5) \)

De manera que, usando la función ppois, se tiene que:

> ppois(c(5, 8), 6)
[1] 0.4456796 0.8472375

De modo que la probabilidad que buscamos puede obtenerse como la diferencia entre los dos valores que proporciona la función ppois.

> 0.8472375 – 0.4456796
[1] 0.4015579

Por tanto, \( P[6 \leq X \leq 8] = 0.40155 \)

e) Obtener la mediana de la variable

La mediana de una variable aleatoria es el valor de la variable que deja a su izquierda el 50% de las observaciones, quedando el 50% restante a la derecha de tal valor. De aquí se deduce que la mediana de una variable coincide con el cuantil de orden 0.5 de la variable. Por ello, se utiliza la función qpois para obtener la mediana de la variable X  tal y como se muestra a continuación:

> qpois(0.5, 6)
[1] 6

Podemos concluir, por tanto, que la mediana de la variable  es 6.

f)  Generar una muestra de 10 valores aleatorios de la distribución.

Por último, vamos a generar 10 valores aleatorios de esta distribución de Poisson a través de la función rpois.

> rpois(10, 6)
[1] 3 5 5 7 5 5 4 6 3 7

Nota: Dado el carácter aleatorio de los valores generados en este apartado, dichos valores pueden no coincidir con los que se obtengan a través de otra llamada a la función rpois.

Distribución Normal

La distribución Normal es la más importante y de mayor uso de las distribuciones continuas, debido a la gran cantidad de fenómenos aleatorios que modeliza. Esta distribución también se conoce como gaussiana o de Gauss, en honor a su descubridor. La distribución Normal viene identificada por dos parámetros, \( \mu \)  y  \( σ \), que coinciden con la media y la desviación típica de la distribución. Cuando una variable aleatoria, \( X \), siga una distribución normal lo notaremos \( X \rightarrow N(μ, σ) \).

El tratamiento computacional con R de la distribución Normal en particular, y de cualquier distribución de probabilidad continua en general, es similar al que se utiliza con las distribuciones discretas. La principal salvedad se encuentra en la función dnorm. Esta función es la equivalente para la distribución normal a dbinom y dpois en las distribuciones binomal y de Poisson, respectivamente. Recordemos que las funciones, dbinom y dpois devuelven la probabilidad puntual para cada uno de los valores posibles que puede tomar una variable con distribución binomial y de Poisson, respectivamente. Pero el cálculo de probabilidades en valores concretos en una distribución continua no tiene sentido, ya que dicha probabilidad vale 0. Por todo ello, dnorm devuelve el valor de la función de densidad en un punto (o puntos) determinado. Veamos cuáles son los argumentos de esta función:

dnorm(x, mean = 0, sd = 1)

siendo:

  • x: es el valor (o los valores) de la variable para el cual (o los cuales) queremos calcular la función de densidad
  • mean: es la media de la variable
  • sd: la desviación típica de la variable.

Por defecto, se considera una distribución Normal de media 0 y desviación típica 1, es decir, se considera una distribución Normal estándar o tipificada. De este modo, si al llamar a la función dnorm no especificamos ningún valor para la media y la desviación estándar, R considerará estos valores por defecto, por lo que estaremos calculando valores de la función de densidad en una normal de media 0 y desviación típica 1. En caso de estar trabajando con una distribución Normal con una media y/o desviación típica diferente, lo indicaremos a través de estos parámetros.

Las funciones pnorm, qnorm y rnorm se comportan de forma similar a sus equivalentes para las variables discretas y devuelven valores de la función de distribución, cuantiles y valores aleatorios de una distribución normal, respectivamente. Sus argumentos son los siguientes:

pnorm(q, mean = 0, sd = 1)

qnorm(p, mean = 0, sd = 1)

rnorm(n, mean = 0, sd = 1)

siendo:

  • q: el valor (o valores) para el cual (o los cuales) queremos calcular la función de distribución
  • p: el orden del cuantil que queremos obtener
  • n: el número de valores aleatorios a generar
  • mean y sd: los dos parámetros que identifican a la distribución Normal.

Vamos a aplicar todas estas funciones en un ejemplo concreto.

Supuesto Práctico 3

En unos estudios realizados sobre el peso de los estudiante de un colegio, se obtiene que el peso medio es 70 kg. y la desviación típica es 3 kg. Seleccionando un estudiante al azar y suponiendo que los pesos se distribuyen según una Normal, calcular:

a) La probabilidad de que el estudiante pese entre 60 kg. y 75 kg. (ambos inclusive)

b) La probabilidad de que el estudiante pese más de 90 kg.

c) La probabilidad de que el estudiante pese 64 kg. o menos

d) El peso mínimo del 10% de los estudiantes que más pesan

e) Doce pesos aleatorios que sigan dicha distribución.

Solución

En primer lugar, vamos a definir la variable aleatoria X. Por el enunciado del problema, sabemos que \( X  \rightarrow N(70, 3) \)

a) La probabilidad de que el estudiante pese entre 60 kg. y 75 kg. (ambos inclusive)

En este primer apartado, nos piden calcular \( P[60 ≤ X ≤ 75] \). Esta probabilidad puede reescribirse como

\( P[60 ≤ X ≤  75] = P[X ≤ 75] – P[ X ≤  60] = F(75) – F(60) \)

es decir, como una diferencia de valores de la función de distribución de la variable. Vamos a utilizar la función pnorm para obtener estos valores, de manera que la diferencia entre ambos nos dará la probabilidad que buscamos.

> pnorm(c(75, 60), mean = 70, sd = 3)
[1] 0.9522096477 0.0004290603
> 0.9522096477 – 0.0004290603
[1] 0.9517806

Por lo que podemos concluir que \( P[60 ≤ X ≤  75] = 0.95178 \).

b) La probabilidad de que el estudiante pese más de 90 kg.

En este caso, la probabilidad que tenemos que obtener es \( P[X > 90] \). Esta probabilidad es equivalente a

\( P[X > 90] = 1 – P[X ≤ 90] = 1 – F(90) \)

por lo que también puede calcularse a partir de un valor de la función de distribución. Usemos, de nuevo, la función pnorm para calcular este valor de la función de distribución y así obtener la probabilidad buscada.

> pnorm(90, mean = 70, sd = 3)
[1] 1
> 1-1
[1] 0

La probabilidad de que un estudiante pese más de 90 kg. es 0.

c) La probabilidad de que el estudiante pese 64 kg. o menos

La probabilidad de que el estudiante pese 64 kg. o menos se puede escribir como \( P[X ≤64] = F(64) \). Esto es, la probabilidad coincide con el valor de la función de distribución evaluada en el punto 64.

> pnorm(64, mean = 70, sd = 3)
[1] 0.02275013

De manera que \( P[X ≤64] = 0.02275 \)

d) El peso mínimo del 10% de los estudiantes que más pesan

Para entender qué valor debemos calcular, veamos el siguiente gráfico:

P4 - img1Gráfico 1: Representación del percentil 90 en la recta real

Suponiendo que la recta azul representa los valores de la variable ordenados de menos a mayor, buscamos el 10% de los valores más grandes de la variable (que estarán situados a la derecha). El mínimo de estos valores (representado con un punto rojo) será aquel valor que deje a su derecha el 10% de las observaciones. Pero este punto será también aquel que deja a su izquierda el 90% de las observaciones restantes. Por tanto, el valor que debemos calcular es el percentil 90. Utilizaremos para ello la función qnorm.

> qnorm(0.9, mean = 70, sd = 3)
[1] 73.84465

El peso que buscamos es 73.84 kg.

e)  Doce pesos aleatorios que sigan dicha distribución

Vamos a generar estos 12 pesos aleatorios usando la función rnorm.

> rnorm(12, mean = 70, sd = 3)
[1] 71.25560 71.18510 67.92676 72.43674 67.50546 74.52945 74.22862 74.44032
[9] 75.23202 71.34951 66.13856 69.30546

Nota: Dado el carácter aleatorio de los valores generados en este apartado, dichos valores pueden no coincidir con los que se obtengan a través de otra llamada a la función rnorm.




Ejercicios

Ejercicios Guiados

Ejercicio Guiado1

Se pretende comprobar la efectividad de una determinada vacuna contra la gripe. Para ello se administra dicha vacuna a un grupo de 15 pacientes. La probabilidad de que el paciente vacunado contraiga la gripe es 0.3. Calcula las siguientes probabilidades:

a) Ningún paciente contraiga la gripe

b) Más de dos pacientes contraigan la gripe

c) Contraigan la gripe entre tres y cinco pacientes, ambos inclusive

d) Generar una muestra aleatoria con 20 de valores de una distribución Binomial de parámetros n = 10 y prob = 0.2.

Ejercicio Guiado2

En un servicio de urgencias de un determinado hospital se sabe que por término medio llegan diez pacientes durante una hora. Calcula la probabilidad de que:

a) Lleguen exactamente cinco pacientes en una hora

b) Lleguen menos de quince pacientes en dos horas

c) Lleguen más de cuatro y menos de ocho pacientes en una hora

d) Generar una muestra de tamaño 15 para una distribución de Poisson de parámetro media igual a 30.

Ejercicio Guiado3

Se ha estudiado el nivel de glucosa en sangre en ayunas en un grupo de diabéticos. Esta variable se supone que sigue una distribución Normal, con media 106 mg/100 ml y desviación típica 8 mg/100 ml.
Se pide:

a) Obtener la probabilidad de que el nivel de glucosa en sangre en un diabético sea inferior a 120 mg/100 ml

b) ¿Qué porcentaje de diabéticos tienen niveles de glucosa en sangre comprendidos entre 90 y 130 mg/100 ml?

c) Hallar el valor de la variable caracterizado por la propiedad de que el 25% de todos los diabéticos tiene un nivel de glucosa en ayunas inferior a dicho valor

d) Generar una muestra de tamaño 12 para la una distribución Normal con media igual a 5 y desviación típica igual a 3.


Ejercicio Guiado 1 (Resuelto)

Se pretende comprobar la efectividad de una determinada vacuna contra la gripe. Para ello se administra dicha vacuna a un grupo de 15 pacientes. La probabilidad de que el paciente vacunado contraiga la gripe es 0.3. Calcula las siguientes probabilidades:

a) Ningún paciente contraiga la gripe

b) Más de dos pacientes contraigan la gripe

c) Contraigan la gripe entre tres y cinco pacientes, ambos inclusive

d) Generar una muestra aleatoria con 20 de valores de una distribución Binomial de parámetros n = 10 y prob = 0.2.


Solución:

Definimos la variable aleatoria X = “Nº de pacientes vacunados que contraen la gripe de un grupo de 15 pacientes”
Esta variable aleatoria tiene una distribución Binomial de parámetros n = 15 y p = 0.3. (\(  X  → B (15, 0.3) \))

a) Ningún paciente contraiga la gripe

En este apartado piden la probabilidad de que la variable aleatoria tome exactamente el valor 0, es decir, piden la función masa de probabilidad evaluada en el punto 0

\(  P[Ningún \hspace{.2cm} paciente \hspace{.2cm} contraiga \hspace{.2cm} la \hspace{.2cm} gripe] = P[X = 0] \)

Para resolverlo utilizamos la función dbinom

> dbinom(0,15, 0.3)
[1] 0.004747562
Por tanto,

\(  P[Ningún \hspace{.2cm} paciente \hspace{.2cm} contraiga \hspace{.2cm} la \hspace{.2cm} gripe] = P[X = 0] = 0.0047 \)

b) Más de dos pacientes contraigan la gripe

\(  P[Más \hspace{.2cm} de \hspace{.2cm} dos \hspace{.2cm} pacientes \hspace{.2cm} contraigan \hspace{.2cm} la \hspace{.2cm} gripe] = P[X > 2] = 1 – P[X ≤ 2] = 1 – F(2) \)

Para resolverlo utilizamos la función pbinom 

> 1 – pbinom (2,15, 0.3)
[1] 0.8731723

\(   \begin{array}{ll}  P[Más \hspace{.2cm} de \hspace{.2cm} dos \hspace{.2cm} pacientes \hspace{.2cm} contraigan \hspace{.2cm} la \hspace{.2cm} gripe]  & = \\ & = P[X > 2] = 1 – P[X ≤ 2] = 0.8731 \end {array} \)

c) Contraigan la gripe entre tres y cinco pacientes, ambos inclusive

\(   \begin{array}{ll} P[Contraigan \hspace{.2cm} la \hspace{.2cm} gripe \hspace{.2cm} entre \hspace{.2cm} 3 \hspace{.2cm} y \hspace{.2cm} 5 \hspace{.2cm} pacientes] =  & \\  =   P[3 ≤ X ≤ 5] = P[X ≤ 5] – P[X < 3 ]  = P[X ≤ 5] – P[X ≤ 2] = F(5) – F(2) & \end {array} \)

Por lo que el cálculo de dicha probabilidad se reduce al cálculo del valor de la función de distribución en los puntos 5 y 2. Podemos calcular ambos valores de forma simultánea mediante la función pbinom del siguiente modo

> pbinom (c(2, 5),15, 0.3)
[1] 0.1268277 0.7216214
> 0.7216214 – 0.1268277
[1] 0.5947937

\(   \begin{array}{ll} P[Contraigan \hspace{.2cm} la \hspace{.2cm} gripe \hspace{.2cm} entre \hspace{.2cm} 3 \hspace{.2cm} y \hspace{.2cm} 5 \hspace{.2cm} pacientes] = & \\ = P[3 ≤ X ≤ 5] = P[X ≤ 5] –  P[X ≤ 2] = F(5) – F(2) = 0.5947 & \end {array} \)

d) Generar una muestra aleatoria de tamaño 20 de valores de una distribución Binomial de parámetros n = 10 y prob = 0.2

Para generar una muestra aleatoria utilizamos la función rbinom

> rbinom(20, 10, 0.2)
[1] 2 1 2 0 2 0 0 4 2 1 1 2 1 4 1 0 4 2 3 2

Nota: Dado el carácter aleatorio de los valores generados en este apartado, dichos valores pueden no coincidir con los que se obtengan a través de otra llamada a la función rbinom.


Ejercicio Guiado2 (Resuelto)

En un servicio de urgencias de un determinado hospital se sabe que por término medio llegan diez pacientes durante una hora. Calcula la probabilidad de que:

a) Lleguen exactamente cinco pacientes en una hora

b) Lleguen menos de quince pacientes en una hora

c) Lleguen más de cuatro y menos de ocho pacientes en una hora

d) Generar una muestra de tamaño 15 para una distribución de Poisson de parámetro media igual a 30.


Solución:

Definimos la variable aleatoria X = “Nº de pacientes que acuden al servicio de urgencias de un hospital en una hora”
Esta variable sigue una distribución Poisson de parámetro \( λ = 10 \). \( X → P(10) \)

a) Lleguen exactamente cinco pacientes en una hora

Hay que calcular la probabilidad de que la variable aleatoria X tome exactamente el valor 5

\(  P[Lleguen \hspace{.2cm} exactamente \hspace{.2cm} cinco \hspace{.2cm} pacientes \hspace{.2cm} en \hspace{.2cm} una \hspace{.2cm} hora] = P[X = 5] \)

Es decir, el valor de la función masa de probabilidad de la variable aleatoria X en el punto 5. Para ello, vamos a utilizar la función dpois

> dpois(5, 10)
[1] 0.03783327

\(  P[Lleguen \hspace{.2cm} exactamente \hspace{.2cm} cinco \hspace{.2cm} pacientes \hspace{.2cm} en \hspace{.2cm} una \hspace{.2cm} hora] = P[X = 5] = 0.0378 \)

b) Lleguen menos de quince pacientes en una hora

\(  P[Lleguen \hspace{.2cm} menos \hspace{.2cm} de \hspace{.2cm} cinco \hspace{.2cm} pacientes \hspace{.2cm} en \hspace{.2cm} una \hspace{.2cm} hora] = P[X < 5] = P[X ≤ 4] \) 

Se puede obtener mediante la función masa de probabilidad o la función de distribución.

En el caso de la función masa de probabilidad

\(   \begin{array}{ll} P[Lleguen \hspace{.2cm} menos \hspace{.2cm} de  \hspace{.2cm} cinco \hspace{.2cm} pacientes \hspace{.2cm} en \hspace{.2cm} una \hspace{.2cm} hora]  = &  \\  =  P[X < 5] = P[X ≤ 4]  = P[X = 0] + P[X = 1] + P[X = 2] + P[X = 3] + P[X = 4]  &  \end{array} \)

Es decir, el valor de la función masa de probabilidad de la variable aleatoria X en los puntos: 0, 1, 2, 3 y 4. Para ello, vamos a utilizar la función dpois

> dpois (0, 10) + dpois (1, 10) + dpois (2, 10) + dpois (3, 10) + + dpois (4, 10)
[1] 0.02925269

En el caso de la función de distribución

\(  P[Lleguen \hspace{.2cm} menos \hspace{.2cm} de  \hspace{.2cm} cinco \hspace{.2cm} pacientes \hspace{.2cm} en  \hspace{.2cm} una \hspace{.2cm} hora] = P[X < 5] = P[X ≤ 4] = F(4) \)

Para ello, utilizamos la función ppois
> ppois(4, 10)
[1] 0.02925269

c) Lleguen más de cuatro y menos de ocho pacientes en una hora

\(   \begin{array}{ll} P[Lleguen \hspace{.2cm}más \hspace{.2cm} de \hspace{.2cm} cuatro \hspace{.2cm} y \hspace{.2cm} menos \hspace{.2cm} de \hspace{.2cm} ocho \hspace{.2cm} pacientes] = &  \\  =  P[4 < X < 8] = P[X < 8] – P[X ≤ 4] = P[X ≤ 7] – P[X ≤ 4] = F(7) – F(4)  & \end{array} \)

Hemos expresado la función masa de probabilidad en función de la función de distribución de la variable evaluada en los puntos 7 y 4. Para resolverlo en R utilizamos la función ppois

> ppois(c(4, 7), 10)
[1] 0.02925269 0.22022065
> 0.22022065 – 0.02925269
[1] 0.190968

\( P[Lleguen \hspace{.2cm} más \hspace{.2cm} de \hspace{.2cm} cuatro \hspace{.2cm} y \hspace{.2cm} menos \hspace{.2cm} de \hspace{.2cm} 8] = P[X ≤ 7] – P[X ≤ 4] = 0.1909 \)

d) Generar una muestra de tamaño 15 para una distribución de Poisson de parámetro media igual a 30

> rpois (15, 30)
 [1] 28 24 39 22 20 19 23 31 24 40 32 38 29 25 32


Ejercicio Guiado 3 (Resuelto)

Se ha estudiado el nivel de glucosa en sangre en ayunas en un grupo de diabéticos. Esta variable se supone que sigue una distribución Normal, con media 106 mg/100 ml y desviación típica 8 mg/100 ml.
Se pide:

a) Obtener la probabilidad de que el nivel de glucosa en sangre en un diabético sea inferior a 120 mg/100 ml

b) ¿Qué porcentaje de diabéticos tienen niveles de glucosa en sangre comprendidos entre 90 y 130 mg/100 ml?

c) Hallar el valor de la variable caracterizado por la propiedad de que el 25% de todos los diabéticos tiene un nivel de glucosa en ayunas inferior a dicho valor

d) Generar una muestra de tamaño 12 para la una distribución Normal con media igual a 5 y desviación típica igual a 3.


Solución

Se define la variable, X = “Nivel de glucosa en sangre en un diabético”. Esta variable tiene distribución Normal con media 106 y desviación típica 8; \( X → N(106, 8) \)

a) Obtener la probabilidad de que el nivel de glucosa en sangre en un diabético sea inferior a 120 mg/100 ml

\( P[Nivel \hspace{.2cm}de \hspace{.2cm} glucosa \hspace{.2cm} sea \hspace{.2cm} inferior \hspace{.2cm} a \hspace{.2cm} 120] = P[X < 120] = F(120) \)

Calculamos la probabilidad pedida utilizando la función de distribución. Usamos la función pnorm

> pnorm(120, mean = 106, sd = 8)
[1] 0.9599408

Por lo tanto,

\(    P[Nivel \hspace{.2cm} de \hspace{.2cm} glucosa \hspace{.2cm}sea \hspace{.2cm} inferior \hspace{.2cm} a \hspace{.2cm} 120] = 0.9599 \)

b) ¿Qué porcentaje de diabéticos tienen niveles de glucosa en sangre comprendidos entre 90 y 130 mg/100 ml?

\(   \begin{array}{ll} P[Niveles \hspace{.2cm} comprendidos \hspace{.2cm} entre \hspace{.2cm} 90 \hspace{.2cm} y \hspace{.2cm} 130]  = &  \\  =  P[90 ≤ X ≤ 130] = P[X ≤ 130] – P[X ≤ 90] = F(130)- F(90)  & \end{array} \)

Utilizamos de nuevo la función de distribución pnorm

> pnorm(c(130, 90),mean = 106, sd = 8)
[1] 0.99865010 0.02275013
> 0.99865010- 0.02275013
[1] 0.9759

Por lo tanto,

\(   \begin{array}{ll} P[Niveles \hspace{.2cm} comprendidos  \hspace{.2cm} entre \hspace{.2cm} 90 \hspace{.2cm} y \hspace{.2cm} 130] = &  \\  = P[X <= 130] – P[X < 90]  = 0.9759 & \end{array} \)

c) Hallar el valor de la variable caracterizado por la propiedad de que el 25% de todos los diabéticos tiene un nivel de glucosa en ayunas inferior a dicho valor

Se pide calcular un valor de la distribución de  \( X \),  tal que \( P[X < x] = 0.25 \)
El valor que tenemos que calcular es el cuantil 25. Utilizamos la función qnorm.

> qnorm(0.25, mean = 106, sd = 8)
[1] 100.6041

Se obtiene como resultado \( P[X < 100.6041] = 0.25 \)

d) Generar una muestra de tamaño 12 para la una distribución Normal con media igual a 5 y desviación típica igual a 3.

> rnorm(12, mean = 5, sd = 3)
[1] 4.764470 7.124756 8.790588 3.268813 1.533834 3.463991 8.116047 3.097280
 [9] 8.316036 4.906755 3.550390 4.613455



Ejercicios Propuestos

Ejercicio Propuesto 1

Se realiza un estudio en el parque natural de Sierra Nevada, donde la probabilidad de que una planta sea una especie protegida es de 0.35. Se pide:

a) Calcular la probabilidad de encontrar 8 plantas de especies protegidas entre 10 de la zona

b) Calcular la probabilidad de encontrar entre 2 y 5 plantas de especies protegidas entre 9 de la zona

c) Hallar la probabilidad de que entre 6 plantas de la zona se encuentren 4 que no estén protegidas

d) Si se seleccionan 20 plantas de la zona, calcular el número mediano de plantas protegidas

e)  Generar una muestra aleatoria de tamaño 8 del número de plantas protegidas que se obtendrían al seleccionar 16 plantas de la zona.


Ejercicio Propuesto 2

Una máquina que se utiliza para analizar los componentes químicos de muestras analiza un promedio de 6 muestras por hora. Calcular las siguientes probabilidades:

a)  No se analice ninguna muestra en una hora

b)  Se analicen al menos seis muestras en una hora

c)  Se analicen menos de 5 muestras en una hora

d)  Se dispone de una nueva máquina que, según sus especificaciones, analiza un promedio de 15 muestras por hora. Calcular la probabilidad de analizar seis muestras en una hora.


Ejercicio Propuesto 3

Una de las mayores contribuciones a la contaminación atmosférica es la provocada por los hidrocarburos procedentes de los tubos de escape de los automóviles.  Definimos la variable aleatoria X que mide los gramos de hidrocarburo emitidos por un automóvil por cada dos kilómetros. Supongamos que X sigue una distribución Normal con una media de 1 gramo y una desviación típica de 0.25 gramos. Calcular:

a) La probabilidad de que un automóvil emita más de 1.5 gramos

b) La probabilidad de que un automóvil emita menos de 1.2 gramos

c) La probabilidad de que un automóvil emita entre 1.3 y 1.4 gramos

d) Los cuartiles de la distribución

e) Una muestra aleatoria de 10 valores de la distribución.


Ejercicio Propuesto 4

En cierta especie de aves, se ha detectado una contaminación apreciable de mercurio (Hg) en sangre. La concentración de mercurio en sangre está distribuida normalmente con media 0.25 ppm (partes de Hg por millón, en plasma) y desviación típica 0.08 ppm.

a) ¿Cuál es la probabilidad de que un ave presente un nivel de mercurio en sangre superior a 0.40 ppm ?

b) ¿Cuál es la probabilidad de que un ave tenga un nivel de mercurio en sangre entre 0.20 y 0.50 ppm?

c) ¿Cuál es el nivel máximo de concentración de mercurio en sangre del 40% de las aves menos contaminadas?

d) Generar una muestra de tamaño 10.


Ejercicio Propuesto 1 (Resuelto)

Se realiza un estudio en el parque natural de Sierra Nevada, donde la probabilidad de que una planta sea una especie protegida es de 0.35. Se pide:

a) Calcular la probabilidad de encontrar 8 plantas de especies protegidas entre 10 de la zona

b) Calcular la probabilidad de encontrar entre 2 y 5 plantas de especies protegidas entre 9 de la zona

c) Hallar la probabilidad de que entre 6 plantas de la zona se encuentren 4 que no estén protegidas

d) Si se seleccionan 20 plantas de la zona, calcular el número mediano de plantas protegidas

e)  Generar una muestra aleatoria de tamaño 8 del número de plantas protegidas que se obtendrían al seleccionar 16 plantas de la zona.


Solución:

a) Calcular la probabilidad de encontrar 8 plantas de especies protegidas entre 10 de la zona

\( P[X = 8] = 0.00428 \)

b) Calcular la probabilidad de encontrar entre 2 y 5 plantas de especies protegidas entre 9 de la zona

\( P[2 ≤ Y ≤ 5] = 0.8253 \)

c) Hallar la probabilidad de que entre 6 plantas de la zona se encuentren 4 que no estén protegidas

\( P[U = 4]  = 0.3280 \)

d) Si se seleccionan 20 plantas de la zona, calcular el número mediano de plantas protegidas

El número mediano de plantas protegidas en este caso es 7

e)  Generar una muestra aleatoria de tamaño 8 del número de plantas protegidas que se obtendrían al seleccionar 16 plantas de la zona

Para generar una muestra de la variable aleatoria \( W \rightarrow B(16, 0.35) \), utilizamos la función rbinom.

Solución del Ejercicio Propuesto 1


Ejercicio Propuesto 2 (Resuelto)

Una máquina que se utiliza para analizar los componentes químicos de muestras analiza un promedio de 6 muestras por hora. Calcular las siguientes probabilidades:

a) No se analice ninguna muestra en una hora

b) Se analicen al menos seis muestras en una hora

c) Se analicen menos de 5 muestras en una hora

d) Se dispone de una nueva máquina que, según sus especificaciones, analiza un promedio de 15 muestras por hora. Calcular la probabilidad de analizar seis muestras en una hora.


Solución:

a) No se analice ninguna muestra en una hora

Esta probabilidad es 0.002478

b) Se analicen al menos seis muestras en una hora

 \( P[X ≥ 6]  = 0.55432 \)

c) Se analicen menos de 5 muestras en una hora

 \( P [X < 5]  = 0.28505 \)

d) Se dispone de una nueva máquina que, según sus especificaciones, analiza un promedio de 15 muestras por hora. Calcular la probabilidad de analizar seis muestras en una hora.

\( P[Y = 6]  = 0.004839 \)

Solución del Ejercicio Propuesto 2


Ejercicio Propuesto 3 (Resuelto)

Una de las mayores contribuciones a la contaminación atmosférica es la provocada por los hidrocarburos procedentes de los tubos de escape de los automóviles.  Definimos la variable aleatoria X que mide los gramos de hidrocarburo emitidos por un automóvil por cada dos kilómetros. Supongamos que X sigue una distribución Normal con una media de 1 gramo y una desviación típica de 0.25 gramos. Calcular:

a) La probabilidad de que un automóvil emita más de 1.5 gramos

b) La probabilidad de que un automóvil emita menos de 1.2 gramos

c) La probabilidad de que un automóvil emita entre 1.3 y 1.4 gramos

d) Los cuartiles de la distribución

e) Una muestra aleatoria de 10 valores de la distribución.


Solución:

a) La probabilidad de que un automóvil emita más de 1.5 gramos

\( P[X > 1.5] = 0.02275 \)

b) La probabilidad de que un automóvil emita menos de 1.2 gramos

\( P[X < 1.2] = 0.788144 \)

c) La probabilidad de que un automóvil emita entre 1.3 y 1.4 gramos

\( P[1.3 ≤ X ≤ 1.4] = 0.0602704 \)

d) Los cuartiles de la distribución

los tres cuartiles de esta distribución son 0.8313, 1 y 1.1686

e) Una muestra aleatoria de 10 valores de la distribución.

Para obtener una muestra de 10 valores aleatorios de la distribución Normal utilizamos la función rnorm

[1] 5.058828 4.676714 4.669034 5.567419 4.295687
[6] 4.398480 4.970741 4.088828 4.229598 4.723875

Solución del Ejercicio Propuesto 3


Ejercicio Propuesto 4 (Resuelto)

En cierta especie de aves, se ha detectado una contaminación apreciable de mercurio (Hg) en sangre. La concentración de mercurio en sangre está distribuida normalmente con media 0.25 ppm (partes de Hg por millón, en plasma) y desviación típica 0.08 ppm.

a) ¿Cuál es la probabilidad de que un ave presente un nivel de mercurio en sangre superior a 0.40 ppm ?

b) ¿Cuál es la probabilidad de que un ave tenga un nivel de mercurio en sangre entre 0.20 y 0.50 ppm?

c) ¿Cuál es el nivel máximo de concentración de mercurio en sangre del 40% de las aves menos contaminadas?

d) Generar una muestra de tamaño 10.


Solución:

a) ¿Cuál es la probabilidad de que un ave presente un nivel de mercurio en sangre superior a 0.40 ppm ?

\( P[X > 0.40]  = 0.0303 \)

b) ¿Cuál es la probabilidad de que un ave tenga un nivel de mercurio en sangre entre 0.20 y 0.50 ppm?

\( P[0.20 < X < 0.50]  = 0.7331 \)

c) ¿Cuál es el nivel máximo de concentración de mercurio en sangre del 40% de las aves menos contaminadas?

\( P[X < P_{40}] = 0.2297 \)

d) Generar una muestra de tamaño 10

Solución del Ejercicio Propuesto 4

Autores: David Molina Muñoz y Ana María Lara Porras. Universidad de Granada. (2016)

Reformulado con MathML en 2021 por Ana María Lara Porras

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *