Bioestadística: Ejercicios Resueltos: Tema 3

EJERCICIOS RESUELTOS:

REGRESIÓN MÍNIMO CUADRÁTICA

1. Dadas las distribuciones bidimensionales siguientes, contestar a cada una de las cuestiones planteadas:

\( \begin{array} {|c|c|c|c|} \hline  X/Y  &  10  &  15 &   20 \\ \hline 1  &  0  &  2  &  0  \\ \hline  2  &   1 &   0 &   0 \\ \hline  3  &  0  &  0  &   3 \\ \hline  4  &  0  &  1  &  0 \\ \hline  \end{array} \) \( \hspace{.2cm}  \begin{array} {|c|c|c|c|} \hline  X/Y  &  10  &  15  &  20 \\ \hline  1  &  0  &  2  &  0  \\ \hline  2  &  1  &  0  &   0  \\ \hline  3  &  0  &  0  &  3 \\ \hline  \end{array} \) \( \hspace{.2cm} \begin{array} {|c|c|c|c|} \hline  X/Y  &  10  &  15  &  20  &  25 \\ \hline  1 &   0  &  3  &  0  &  1 \\ \hline  2 &   0  &  0  &  1  &  0 \\ \hline  3 &   2  &  0  &  0  &  0 \\ \hline  \end{array} \)

¿Depende funcionalmente?

a) X de Y (Sol: 1ª tabla: No; 2ª tabla: Si; 3ª tabla: Si)
b) Y de X (Sol:  1ª tabla: Si; 2ª tabla: Si; 3ª tabla: No)

2. Una factoría de una marca de refrescos ha tomado al azar 10 semanas al año, observando la temperatura media correspondiente a cada una de ellas y la cantidad de refrescos pedidos durante cada uno de dichos periodos. La información obtenida es:

\( \begin{array} {|l|c|c|c|c|c|c|c|c|c|c|} \hline  Temperatura \hspace{.2cm} media &   10  &  28  &  12  &  31 &   30  &  19  &  24  &  5  &  9  &  15 \\ \hline N^{o} \hspace{.2cm} de \hspace{.2cm} refrescos  &   21  &   65 &    19 &   72  &  75 &   39  &  67  &  11  &  12  &  24 \\ \hline  \end{array} \)

¿Puede la factoría planificar la cantidad de producción de la temperatura esperada? ¿De qué forma? (Sol: \( y=-9.33+2.723x \hspace{.2cm} ; \hspace{.2cm} r^2=0.95347 \) (Es suficientemente alto)).

3. Se realiza un experimento para estudiar la relación entre el periodo de incubación (número de días desde que se pusieron los huevos) y la media del tiempo de incubación (número  medio de minutos dedicados ininterrumpidamente a la incubación en el nido) en un ave marina: el charrán de pico de gaviota. Se pretende obtener una ecuación mediante la cual se pueda predecir el tiempo medio de incubación (Y) a partir del conocimiento del periodo de incubación (X). Utilizando fotografías a intervalos de tiempo se obtuvieron los siguientes datos. Se pide:

\( \begin{array} {|l|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|} \hline  X  &  0.25 &   0.50  &  1  &  1.5  &  2  &  2.5 &   3  &  4  &  5 &   6  &  7  &  8  &  9 &   10  &  10 \\ \hline Y  &  30    & 18   & 22  &  40 &   19  &  10  &  55 &   23 &   18  &  26  &  21  &  52 &   62 &   45 &   87 \\ \hline  \end{array} \)

a) Calcular la recta de regresión que predice el valor de Y a partir del conocimiento de X  (Sol: \( y=17.357+3.837x \))

b) ¿Existe una relación lineal importante entre las variables?  (Sol: r=0.63 (relación moderadamente fuerte entre las variables)).

4. Se realiza un estudio para investigar la relación entre el nivel de humedad del suelo y la tasa de mortalidad en lombrices. La tasa de mortalidad, Y, es la proporción de lombrices de tierra que mueren tras un periodo de dos semanas; el nivel de humedad, X, viene medido en milímetros de agua por centímetro cuadrado de suelo. Los datos se muestran en la siguiente tabla. Se pide:

\( \begin{array} {|l|c|c|c|c|c|c|c|c|c|c|c|} \hline  X  &  0.31 &   0.31 &   0.56  &  0.56 &   0.89 &   0.89  &  0.96  &  0.96 &   1.15   & 1.15 &   1.25 \\ \hline  Y    & 0.2  &  0.1    & 0  &   0.2 &   0.3  &  0.5  &  0  &   0.6  &  0.4  &  0.2  &  0.5 \\ \hline  \end{array} \)

a) ¿Muestran los datos una tendencia lineal?  (Sol: \( y=0.0097+0.3217x  \hspace{.2cm} ; \hspace{.2cm} r=0.521 \) (relación moderadamente fuerte entre las variables))

b) Determinar el grado de asociación lineal entre la tasa de mortalidad y el nivel de humedad y la bondad del ajuste realizado en la recta de regresión. (Sol: \( r^2=0.2716 \) (el modelo explica un 27.16% de la variabilidad de la tasa de mortalidad)).

5. Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la concentración de estrona en la saliva, X, para predecir la concentración del esteroide en plasma libre, Y. Se extrajeron los siguientes datos a 13 individuos sanos. Se pide:

\( \begin{array} {|l|c|c|c|c|c|c|c|c|c|c|c|c|c|} \hline  X  &  7.4 &   7.5 &   8  &  9  &  9.5  &  10  &  11 &   12.5  &  13 &  14  &  15.5  &  16 &   17 \\ \hline Y  &  25  &  29.5 &    32  &  33.5  &  36  &  42  &  43.5  &  56  &  52.5 &   62 &    61  &  63.5 &   64 \\ \hline  \end{array} \)

a) Estudiar la posible relación lineal entre ambas variables, obteniendo su grado de ajuste. (Sol: \(  y=-1.9824+4.1640x \hspace{.2cm} ; \hspace{.2cm} r^2=0.9501 \) )

b) Utilizar la línea de regresión estimada para predecir el nivel de estrona en plasma libre de un individuo cuyo nivel de estrona en saliva es de 17.5. (Sol:y=70.88).

6. La siguiente tabla muestra la edad (X) y la presión sanguínea (Y) de 10 mujeres:

\( \begin{array} {|l|c|c|c|c|c|c|c|c|c|c|} \hline  Edad  &  56  &  42 &   72  &  36  &  63  &  47 &   55 &   47  &  38 &   42 \\ \hline  Presión  &  148  &  126 &   159    118  &  149 &   130  &  151  &  142  &   114  &  141 \\ \hline  \end{array} \)

Dar una predicción lineal para la presión sanguínea de una mujer de 51 años. (Sol: \(  y=80.444+1.1517x \hspace{.2cm} ; \hspace{.2cm}  139.18 \)).

7. Elegidos 50 matrimonios al azar y preguntadas la edad de ambos al contraer matrimonio se obtuvo la siguiente tabla:

\( \begin{array} {|l|c|c|c|c|c|} \hline  X/Y  &  15-20  &  20-25  &  25-30  &  30-35 &   35-40 \\ \hline  15-18 &   3  &  2  &  3  &  0 &   0 \\ \hline  18-21    & 0 &   4  &   2 &    2 &   0 \\ \hline  21-24  &  0  &  7   & 10  &   6  &   1 \\ \hline  24-27  &  0  &  0   &  2   &  5   & 3 \\ \hline  \end{array} \)

donde X es la edad de la mujer e Y la edad del hombre. Obtener:

a) Recta de regresión de Y/X y de X/Y y el coeficiente de correlación lineal. (Sol: \( y=4.54+1.06x  \hspace{.2cm} ; \hspace{.2cm} x=12.54+0.3289y \hspace{.2cm} ; \hspace{.2cm} r=0.593 \))

b) Preguntada una mujer dijo que se casó con 22 años ¿Qué edad podemos aventurar que tenía el marido al casarse? Preguntado un hombre dijo que se casó con 24 años ¿Qué edad tendría su esposa al casarse? (Sol: 28; 20).

8. Dos variables tienen las siguientes rectas de regresión mínimo-cuadráticas:

\( 8x+2y=1 \hspace{.2cm} ; \hspace{.2cm}   16x+9y-1=0 \)

Calcular x, y y el coeficiente de correlación lineal. (Sol:  0.175; -0.2; r=-0.666).

9. Partiendo de una muestra de 200 pares de observaciones se calcularon las siguientes cantidades:

\(\sum_{i}x_{i}=11.34 \hspace{.2cm} ; \hspace{.2cm}\sum_{i}x_{i}^2=12.16 \hspace{.2cm} ; \hspace{.2cm}\sum_{i}x_{i}y_{i}=22.13 \hspace{.2cm} ; \hspace{.2cm}\sum_{i}y_{i}=20.72;\sum_{i}y_{i}^2=84.96 \)

Se pide:
a) Calcular las dos rectas de regresión y dibujarlas (Sol: \(  y=7.28×10^{-4}+1.824x  \hspace{.2cm} ; \hspace{.2cm}   x=0.0147+0.258y \))

b) ¿Son fiables las predicciones efectuadas con las rectas anteriores?  (Sol: \( r^2=0.4697 \)  (Si es fiable)).

10. En una determinada zona oceánica, se ha realizado un estudio sobre el comportamiento del mar, en relación a diversos factores entre los cuales se encuentra la velocidad del viento. A lo largo de 20 días y durante el último periodo de tiempo se ha observado conjuntamente la velocidad del viento (X) y la altura de las olas (Y). La información obtenida se dispone en la siguiente tabla. Se pide:

\( \begin{array} {|l|c|c|c|c|} \hline  X/Y &   <0.2 &   0.2-1 &   1-3  &  3-7 \\ \hline  <2 &   2  &  0  &  0  &  0 \\ \hline  2-8  &  0  &  5 &   1 &   0 \\ \hline  8-12 &   0  &  0  &  4  &  1 \\ \hline  12-20 &   0  &  0 &   2  &  5 \\ \hline  \end{array} \)

a) Calcular la recta de regresión de Y/X  (Sol:  \( y=-0.4239+0.2870x \))

b) ¿Qué valor asignará a la variable y si dispusiera de un valor x=8.3? ¿Es adecuada tal asignación? (Sol:\(  y=1.95820  \hspace{.2cm} ; \hspace{.2cm} r^2=0.6798 \)  (Buen ajuste)).

11. En un cierto estudio sobre fiabilidad se han obtenido los datos de la siguiente tabla: 

\( \begin{array} {|l|c|c|c|c|c|c|c|} \hline  X/Y &  <3  &  3-4  &  4-5  &  5-6 &  6-7  &  7-8 &   >8 \\ \hline  <5  &  3  &  0  &  0 &   0  &  0  &  0  &  0 \\ \hline 15-20 & 0 & 8 & 0 & 0 & 0 & 0 & 0 \\ \hline  20-25  &  0   & 0   &  9 &   1  &  0 &   0  &  0 \\ \hline  25-30  &  0   &  0  &  0 &   9  &  0 &   0  &  0 \\ \hline 30-35  &  0   &  0  &  0    & 0  &   9  &  0 &   0 \\ \hline  35-40  &  0   &  0  &  0  &  0   &  0  &  7  &  1 \\ \hline   >40  &  0  &  0 &   0 &   0  &  0  &  0 &   3 \\ \hline   \end{array} \)

a) Calcular el coeficiente de correlación lineal. (Sol: 0.9695)

b) Obtener las rectas de regresión de Y/X y de X/Y. (Sol: \( y=0.9747+0.1696x  \hspace{.2cm} ; \hspace{.2cm} x=-3.76+5.5376y \)).

12. Cinco niños de 2, 4, 6, 7 y 8 años pesan respectivamente, 15, 19, 25, 33 y 34 Kgs. Hallar la recta de regresión mínimo cuadrática del peso con respecto a la edad. (Sol: \( y=6.9+3.388x \hspace{.2cm} ; \hspace{.2cm} r^2=0.948 \) (Buen ajuste)).

13. La siguiente tabla muestra el número de calzado y los pesos de 55 estudiantes:

\( \begin{array} {|l|c|c|c|c|c|c|c|} \hline  X/Y &   50  &  60 &   65  &  70  &  75 &   80 &   85 \\ \hline  39  &  1  &  0 &   0 &   0 &   0  &  0  &   0 \\ \hline  40    & 0 &   3 &    3 &    4 &   0  &    0  &  0 \\ \hline  41    & 0 &   3  &   4  &   6  &   0  &  0  &  1 \\ \hline  42  &  0  &  0   &  8   &  8   &  7 &   2 &   0 \\ \hline  43  &  0  &  0   &  2   &  0  &  1  &  0  &  0 \\ \hline  44  &  0  &  0 &   0    & 0   &  0 &   0  &   2 \\ \hline  \end{array} \)

Dar una predicción del peso de un estudiante que calza el 38 ¿Es buena la predicción? (Sol:   \(  y=-80.15+3.59576x  \hspace{.2cm} ; \hspace{.2cm} y=56.48  \hspace{.2cm} ; \hspace{.2cm} r^2=0.3060  \)).

14. Dados los siguientes datos correspondientes a dos variables \( (x_i, y_j) \)

\( \begin{array} {|c|c|c|c|c|c|c|} \hline  x_i &   2  &  4  &  6  &  8 &   10  &  12 \\ \hline y_j  &   7  &   15 &    19 &   23  &  27 &   30 \\ \hline  \end{array} \)

Ajústese a dichos datos una parábola. (Sol: \(  y = 0.484 + 2.998 x – 0.112 x^2 \) )

15. Dada la siguiente distribución 

\( \begin{array} {|l|c|c|c|c|c|} \hline  x_i &   1  &  2  &  3  &  4 &   5 \\ \hline y_j  &   100  &   120 &    110 &   150  &  130 \\ \hline  \end{array} \)

Ajustar una función exponencial del tipo \( \hspace{.3cm} y = a b^x \hspace{.3cm} \) ¿Es mejor dicho ajuste que si ajustamos la recta de regresión de \( \hspace{.3cm} Y/X \) ?

16. De las estadísticas “Tiempos de vuelo y consumos de combustibles” de una compañía aérea, se han obtenido datos relativos a 24 trayectorias realizadas por el Airbus A320. A partir de estos datos de han elaborado los siguientes estadísticos.

\( \sum_{i}x_{i}=31.470 \hspace{.2cm} ; \hspace{.2cm} \sum_{i}y_{i}=219.719 \hspace{.2cm}\sum_{i}x_{i}y_{i}=349.486 \)

\(  \sum_{i}x_{i}^2=51.075 \hspace{.2cm} ;  \hspace{.2cm} \sum_{i}y_{i}^2=2396.504   \hspace{.2cm}; \hspace{.2cm} \sum_{i} x_{i}^2 y_{i}= 633.993 \)

\(  \sum_{i}x_{i}^3= 93.600 \hspace{.2cm} ;  \hspace{.2cm} \sum_{i}x_{i}^4=182.977 \)

La variable \( Y \) expresa el consumo total de combustible en miles de euros, correspondientes a un vuelo de duración \( X \); el tiempo  \( X \) se expresa en horas y se utilizan como unidades de orden inferior fracciones decimales de la hora.

a) Ajustar  un modelo del tipo  \(   Y = a +bx   \), obteniendo la estimación de a y de b. ¿Qué consumo total se estimaría, en miles de euros, para un programa de vuelos compuesto de 100 vuelos de media hora, 200 de una hora y 100 de dos horas?¿ Es fiable esta estimación?

b) Estimar la función \(   Y = a +bx+cx^2   \). Obtener la estimación de a, b y c. ¿Qué consumo total se estimaría, en miles de libras, para un programa de vuelos compuesto de 100 vuelos de media hora, 200 de una hora y 100 de 2 horas?

Soluciones

1. Dadas las distribuciones bidimensionales siguientes, contestar a cada una de las cuestiones planteadas:

\( \begin{array} {|c|c|c|c|} \hline  X/Y  &  10  &  15 &   20 \\ \hline 1  &  0  &  2  &  0  \\ \hline  2  &   1 &   0 &   0 \\ \hline  3  &  0  &  0  &   3 \\ \hline  4  &  0  &  1  &  0 \\ \hline  \end{array} \) \( \hspace{.2cm}  \begin{array} {|c|c|c|c|} \hline  X/Y  &  10  &  15  &  20 \\ \hline  1  &  0  &  2  &  0  \\ \hline  2  &  1  &  0  &   0  \\ \hline  3  &  0  &  0  &  3 \\ \hline  \end{array} \) \( \hspace{.2cm} \begin{array} {|c|c|c|c|} \hline  X/Y  &  10  &  15  &  20  &  25 \\ \hline  1 &   0  &  3  &  0  &  1 \\ \hline  2 &   0  &  0  &  1  &  0 \\ \hline  3 &   2  &  0  &  0  &  0 \\ \hline  \end{array} \)

¿Depende funcionalmente?

a) X de Y (Sol: 1ª tabla: No; 2ª tabla: Si; 3ª tabla: Si)

b) Y de X (Sol:  1ª tabla: Si; 2ª tabla: Si; 3ª tabla: No)

Solución

a) X de Y (Sol: 1ª tabla: No; 2ª tabla: Si; 3ª tabla: Si)

X depende de Y si a cada valor de Y le corresponde uno solo de X. En cada columna un término y sólo uno es distinto de cero. Por lo tanto:

  • En la primera tabla: X no depende de Y
  • En la segunda tabla: X depende de Y
  • En la tercera tabla: X depende de Y

b) Y de X (Sol:  1ª tabla: Si; 2ª tabla: Si; 3ª tabla: No)

Y depende de X si a cada valor de X le corresponde uno solo de Y. En cada fila un término y sólo uno es distinto de cero. Por lo tanto:

  • En la primera tabla: X  depende de Y
  • En la segunda tabla: X depende de Y
  • En la tercera tabla: X no depende de Y

2. Una factoría de una marca de refrescos ha tomado al azar 10 semanas al año, observando la temperatura media correspondiente a cada una de ellas y la cantidad de refrescos pedidos durante cada uno de dichos periodos. La información obtenida es:

\( \begin{array} {|l|c|c|c|c|c|c|c|c|c|c|} \hline  Temperatura \hspace{.2cm} media &   10  &  28  &  12  &  31 &   30  &  19  &  24  &  5  &  9  &  15 \\ \hline N^{o} \hspace{.2cm} de \hspace{.2cm} refrescos  &   21  &   65 &    19 &   72  &  75 &   39  &  67  &  11  &  12  &  24 \\ \hline  \end{array} \)

¿Puede la factoría planificar la cantidad de producción de la temperatura esperada? ¿De qué forma? (Sol: \( y=-9.33+2.723x \hspace{.2cm} ; \hspace{.2cm} r^2=0.95347 \) (Es suficientemente alto)).

Solución 

\( \begin{array} {|r|r|r|r|r|} \hline  Temperatura \hspace{.2cm} X & Cantidad \hspace{.2cm} Y  &  x_i^2  &  y_i^2 & x_iy_i \\ \hline 10  &   21  &   100 &    441 &   210  \\ 28& 65 & 784 &4225 &1820 \\ 12 & 19 & 144 & 361 & 228 \\ 31 & 72 & 961 & 5184 & 2232 \\ 30 & 75 & 900 & 5625 & 2250 \\ 19 & 39 & 361 & 1521 & 741 \\ 24 & 67 & 576 & 4489 & 1608 \\ 5 & 11 & 25 & 121 & 55 \\ 9 & 12 & 81 & 144 & 108 \\ 15 & 24 & 225 & 576 & 360 \\ \hline  183 & 405 & 4157 & 22687 & 9612 \\ \hline  \end{array} \)

¿Puede la factoría planificar la cantidad de producción de la temperatura esperada? ¿De qué forma? (Sol: \( y=-9.33+2.723x \hspace{.2cm} ; \hspace{.2cm} r^2=0.95347 \) (Es suficientemente alto)).

Calculemos el coeficiente de determinación lineal de la cantidad de refrescos con respecto a la temperatura media observada. Si este coeficiente es alto se podrá planificar la producción en función de la temperatura basándose en la función lineal correspondiente.

\( r^2 = \displaystyle \frac {\sigma^2_{xy}}{\sigma^2_x \sigma^2_y} \)

\(  \sigma_{xy} = \displaystyle \frac { \displaystyle \sum x_i  y_i }{n} – \bar{x} \bar{y} =  \displaystyle \frac{9612}{10} –  \displaystyle \frac{183}{10} \displaystyle \frac{405}{10} = 220.05  \)

\( \sigma^{2}_{x} =  \displaystyle \frac {\displaystyle \sum x_i^{2}}{n}-\bar{x}^{2} =  \displaystyle \frac {4157}{10}- (\displaystyle \frac{183}{10})^{2} = 80.81 \)

\( \sigma^{2}_{y} =  \displaystyle \frac {\displaystyle \sum y_i^{2}}{n}-\bar{y}^{2} =  \displaystyle \frac {22687}{10}- (\displaystyle \frac{405}{10})^{2} = 628.45 \)

\( r^2 = \displaystyle \frac {\sigma^2_{xy}}{\sigma^2_x \sigma^2_y} = \displaystyle \frac {(220.05)^2}{80.81 \times 628.45 } = 0.9534697  \Longrightarrow  \hspace{.3cm} \) El 95.35 % es suficientemente alto.

Determinemos la recta de regresión \( Y/X : y = a + bx \)

\( y – \bar{y} = \displaystyle \frac {\sigma_{xy}}{\sigma^2_x} (x-\bar{x}) \)

\(  b =  \displaystyle \frac {\sigma_{xy}}{\sigma^2_x}= \displaystyle \frac {220.05}{80.81} = 2.723 \)

\( a = \bar{y}-b \bar{x} = 40.5 – 2.723 \times 18.3 = -9.33 \)

\( y = a + bx = -9.33 + 2.723 x \)

3. Se realiza un experimento para estudiar la relación entre el periodo de incubación (número de días desde que se pusieron los huevos) y la media del tiempo de incubación (número  medio de minutos dedicados ininterrumpidamente a la incubación en el nido) en un ave marina: el charrán de pico de gaviota. Se pretende obtener una ecuación mediante la cual se pueda predecir el tiempo medio de incubación (Y) a partir del conocimiento del periodo de incubación (X). Utilizando fotografías a intervalos de tiempo se obtuvieron los siguientes datos. Se pide:

\( \begin{array} {|l|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|} \hline  X  &  0.25 &   0.50  &  1  &  1.5  &  2  &  2.5 &   3  &  4  &  5 &   6  &  7  &  8  &  9 &   10  &  10 \\ \hline Y  &  30    & 18   & 22  &  40 &   19  &  10  &  55 &   23 &   18  &  26  &  21  &  52 &   62 &   45 &   87 \\ \hline  \end{array} \)

a) Calcular la recta de regresión que predice el valor de Y a partir del conocimiento de X  (Sol: \( y=17.357+3.837x \))

b) ¿Existe una relación lineal importante entre las variables?  (Sol: r=0.63 (relación moderadamente fuerte entre las variables)).

Solución falta

a) Calcular la recta de regresión que predice el valor de Y a partir del conocimiento de X  (Sol: \( y=17.357+3.837x \))

b) ¿Existe una relación lineal importante entre las variables?  (Sol: r=0.63 (relación moderadamente fuerte entre las variables)).

4. Se realiza un estudio para investigar la relación entre el nivel de humedad del suelo y la tasa de mortalidad en lombrices. La tasa de mortalidad, Y, es la proporción de lombrices de tierra que mueren tras un periodo de dos semanas; el nivel de humedad, X, viene medido en milímetros de agua por centímetro cuadrado de suelo. Los datos se muestran en la siguiente tabla. Se pide:

\( \begin{array} {|l|c|c|c|c|c|c|c|c|c|c|c|} \hline  X  &  0.31 &   0.31 &   0.56  &  0.56 &   0.89 &   0.89  &  0.96  &  0.96 &   1.15   & 1.15 &   1.25 \\ \hline  Y    & 0.2  &  0.1    & 0  &   0.2 &   0.3  &  0.5  &  0  &   0.6  &  0.4  &  0.2  &  0.5 \\ \hline  \end{array} \)

a) ¿Muestran los datos una tendencia lineal?  (Sol: \( y=0.0097+0.3217x  \hspace{.2cm} ; \hspace{.2cm} r=0.521 \) (relación moderadamente fuerte entre las variables))

b) Determinar el grado de asociación lineal entre la tasa de mortalidad y el nivel de humedad y la bondad del ajuste realizado en la recta de regresión. (Sol: \( r^2=0.2716 \) (el modelo explica un 27.16% de la variabilidad de la tasa de mortalidad)).

Solución 

a) ¿Muestran los datos una tendencia lineal?  (Sol: \( y=0.0097+0.3217x  \hspace{.2cm} ; \hspace{.2cm} r=0.521 \) (relación moderadamente fuerte entre las variables))

b) Determinar el grado de asociación lineal entre la tasa de mortalidad y el nivel de humedad y la bondad del ajuste realizado en la recta de regresión. (Sol: \( r^2=0.2716 \) (el modelo explica un 27.16% de la variabilidad de la tasa de mortalidad)).

5. Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la concentración de estrona en la saliva, X, para predecir la concentración del esteroide en plasma libre, Y. Se extrajeron los siguientes datos a 13 individuos sanos. Se pide:

\( \begin{array} {|l|c|c|c|c|c|c|c|c|c|c|c|c|c|} \hline  X  &  7.4 &   7.5 &   8  &  9  &  9.5  &  10  &  11 &   12.5  &  13 &  14  &  15.5  &  16 &   17 \\ \hline Y  &  25  &  29.5 &    32  &  33.5  &  36  &  42  &  43.5  &  56  &  52.5 &   62 &    61  &  63.5 &   64 \\ \hline  \end{array} \)

a) Estudiar la posible relación lineal entre ambas variables, obteniendo su grado de ajuste. (Sol: \(  y=-1.9824+4.1640x \hspace{.2cm} ; \hspace{.2cm} r^2=0.9501 \) )

b) Utilizar la línea de regresión estimada para predecir el nivel de estrona en plasma libre de un individuo cuyo nivel de estrona en saliva es de 17.5. (Sol:y=70.88).

Solución

a) Estudiar la posible relación lineal entre ambas variables, obteniendo su grado de ajuste. (Sol: \(  y=-1.9824+4.1640x \hspace{.2cm} ; \hspace{.2cm} r^2=0.9501 \) )

b) Utilizar la línea de regresión estimada para predecir el nivel de estrona en plasma libre de un individuo cuyo nivel de estrona en saliva es de 17.5. (Sol:y=70.88).

6. La siguiente tabla muestra la edad (X) y la presión sanguínea (Y) de 10 mujeres:

\( \begin{array} {|l|c|c|c|c|c|c|c|c|c|c|} \hline  Edad  &  56  &  42 &   72  &  36  &  63  &  47 &   55 &   47  &  38 &   42 \\ \hline  Presión  &  148  &  126 &   159    118  &  149 &   130  &  151  &  142  &   114  &  141 \\ \hline  \end{array} \)

Dar una predicción lineal para la presión sanguínea de una mujer de 51 años. (Sol: \(  y=80.444+1.1517x \hspace{.2cm} ; \hspace{.2cm}  139.18 \)).

Solución

Dar una predicción lineal para la presión sanguínea de una mujer de 51 años. (Sol: \(  y=80.444+1.1517x \hspace{.2cm} ; \hspace{.2cm}  139.18 \)).

\( \begin{array} {|r|r|r|r|r|} \hline  x_i & y_i   & x_iy_i &  x_i^2 \\ \hline 56  &   148  &   8288 &    3136 \\ 42 & 126 & 5292 & 1754 \\ 72 & 159 & 11448 & 5184 \\ 36 & 118 & 4248 & 1296 \\ 63 & 149 & 9387 & 3969 \\ 47 & 130 & 6110 & 2209 \\ 55 & 151 & 8305 & 3025 \\ 47 & 142 & 6674 & 2209 \\   38 & 114 & 4332 & 14444 \\  42 & 141 & 5922 & 1764 \\ \hline  498 & 1378 & 70006 & 26000 \\ \hline \end{array} \)

Dar una predicción lineal para la presión sanguínea de una mujer de 51 años. Determinar la recta de regresión Y/x : \( \hspace{.3cm} y= a +bx  \)

\( b = \displaystyle \frac {\sigma_{xy}}{\sigma^{2}_x} = \displaystyle \frac {138.16}{119.96}= 1.1517 \)

\( \sigma_{xy} =  \displaystyle \frac{1}{10}  \displaystyle \sum x_iy_i – \bar{x} \bar{y} =  \displaystyle \frac {70006}{10}-  \displaystyle \frac {498}{10} \times  \displaystyle \frac {1378}{10} = 138.16 \)

\(  \sigma^{2}_x   = \displaystyle \frac { \sum {x_i^2}}{10}  – (\bar{x} )^2 = \displaystyle \frac {26000}{10} = \left ( \displaystyle \frac {498}{10} \right )^2 = 119.96   \)

\( a = \bar{y} – b \bar{x} = 137.8 – 1.1517 \times 49.8 = 80.444  \)

Rexta de regresión  \( \hspace{.3cm} Y /x: y = 80.444 + 1.1517 x \)

La predicción sanguínea para una mujer de 51 años es: \( \hspace{.3cm} Y /x: y = 80.444 + 1.1517 \times 51 = 139.18 \)

7. Elegidos 50 matrimonios al azar y preguntadas la edad de ambos al contraer matrimonio se obtuvo la siguiente tabla:

\( \begin{array} {|l|c|c|c|c|c|} \hline  X/Y  &  15-20  &  20-25  &  25-30  &  30-35 &   35-40 \\ \hline  15-18 &   3  &  2  &  3  &  0 &   0 \\ \hline  18-21    & 0 &   4  &   2 &    2 &   0 \\ \hline  21-24  &  0  &  7   & 10  &   6  &   1 \\ \hline  24-27  &  0  &  0   &  2   &  5   & 3 \\ \hline  \end{array} \)

donde X es la edad de la mujer e Y la edad del hombre. Obtener:

a) Recta de regresión de Y/X y de X/Y y el coeficiente de correlación lineal. (Sol: \( y=4.54+1.06x  \hspace{.2cm} ; \hspace{.2cm} x=12.54+0.3289y \hspace{.2cm} ; \hspace{.2cm} r=0.593 \))

b) Preguntada una mujer dijo que se casó con 22 años ¿Qué edad podemos aventurar que tenía el marido al casarse? Preguntado un hombre dijo que se casó con 24 años ¿Qué edad tendría su esposa al casarse? (Sol: 28; 20).

Solución

\( \begin{array}{|c|c|c|c|c|c|c|} \hline  X / Y &   15-20  &  20-25   & 25-30  & 30-35 & 35-40 & n_{i.} & x{´}_{i}   & x^{´}_i.n_{i.} & x^{´2}_i.n_{i.} & \displaystyle \sum  x{´}_{i} y{´}_{j} n_{.j} \\ \hline 15-18  &  3 &  2  & 3 &  0 &   0 &  8  & -1 & -8 & 8 & 6-2 = 8 \\  18-21 &  0 &  4 &   2  & 2  &  0 &   8  & 0 & 0 & 0 & 0  \\  21-24 &  0  & 7 &   10  &  6  &  1 &   24 & 1 & 24 &  24 & -7 + 6 +2 = 1  \\     24-27 &   0  &  0 & 2 &   5  & 3  & 10 & 2 & 20 & 20 & 10+12 = 22 \\        \hline  n_{.j} & 3 & 13 & 17  & 13 & 4 &  50 & & 36 & 72 & 31   \\ \hline y{´}_{j}  & -2 & -1 & 0 & 1 & 2  & & & &  \\ \hline  y^{´}_j.n_{j} & -6 & -13 &  0 & 13 & 8 & 2 &  & &    \\ \hline  y^{´2}_j.n_{j} & 12 & 13 &  0 & 13 & 16 & 54 & & & \\ \hline \end{array} \)

 

\( x{´}_{i} =  \displaystyle \frac { x_i- 19.5}{3} \hspace{.3cm} ; \hspace{.3cm}  y{´}_{j} =  \displaystyle \frac {y_j- 27.5}{5}  \)

a) Recta de regresión de Y/X y de X/Y y el coeficiente de correlación lineal. (Sol: \( y=4.54+1.06x  \hspace{.2cm} ; \hspace{.2cm} x=12.54+0.3289y \hspace{.2cm} ; \hspace{.2cm} r=0.593 \))

Recta de regresión \( \hspace{.3cm} Y/X ; y = a + bx  \)

\( b = \displaystyle \frac {\sigma_{xy}}{\sigma^{2}_x} = \displaystyle \frac {8.868}{8.2944}= 1.0692  \)

\( \sigma_{x^´y^´} =  \displaystyle \frac{  \displaystyle \sum x^´_iy^´_i n_{.j}} {n} – \bar{x^´} \bar{y^´} =  \displaystyle \frac {31}{50}-  \displaystyle \frac {36}{50} \times  \displaystyle \frac {2}{50} = 0.5912\)

\( \sigma_{xy} =  \sigma_{x^´y^´} \times 3 \times 5 =  8.868 \)

\(  \sigma^{2}_{x^´}   = \displaystyle \frac { \sum {x_i^{2}´}n_{i.}}{n}  – (\bar{x^´} )^2 = \displaystyle \frac {72}{50} – \left ( \displaystyle \frac {36}{50} \right )^2 = 0.9216  \Longrightarrow   \sigma^{2}_x  = 3^2 \times 0.9216 = 8.2844   \)

\( a = \bar{y} – b \bar{x} = 27.7 – 1.0692  \times 21.66 = 4.5421  \)

\(  \bar{y} = \displaystyle \frac {2}{50} \times 5 + 27.5 = 27.7 \hspace {1cm} ; \hspace{1cm} \bar{x} = \displaystyle \frac {36}{50} \times 3 + 19.5 = 21.66   \)

Rexta de regresión  \( \hspace{.3cm} X /Y: x= a + by = 12.5485 + 0.3289 y \)

\( b = \displaystyle \frac {\sigma_{xy}}{\sigma^{2}_y} = \displaystyle \frac {8.868}{26.96}= 0.3289  \)

\( \sigma_{x^´y^´} =  \displaystyle \frac{  \displaystyle \sum x^´_iy^´_i n_{.j}} {n} – \bar{x^´} \bar{y^´} =  \displaystyle \frac {31}{50}-  \displaystyle \frac {36}{50} \times  \displaystyle \frac {2}{50} = 0.5912\)

\( \sigma_{xy} =  \sigma_{x^´y^´} \times 3 \times 5 =  8.868 \)

\(  \sigma^{2}_{y^´}   = \displaystyle \frac { \sum {y_j^{2}´}n_{.j}}{n}  – (\bar{y^´} )^2 = \displaystyle \frac {54}{50} = \left ( \displaystyle \frac {2}{50} \right )^2 = 1.0784  \Longrightarrow   \sigma^{2}_y  = 5^2 \times 1.0784 = 26.96   \)

\( a = \bar{x} – b \bar{y} = 21.66 – 0.3289  \times 27.7 = 12.5485  \)

\(  \bar{y} = \displaystyle \frac {2}{50} \times 5 + 27.5 = 27.7 \hspace {1cm} ; \hspace{1cm} \bar{x} = \displaystyle \frac {36}{50} \times 3 + 19.5 = 21.66   \)

Coeficiente de correlación lineal

\(   r =  \displaystyle \frac {\sigma_{xy}}{\sigma_x \sigma_y} = \displaystyle \frac {8.868}{\sqrt{26.96} \times \sqrt{8.2944}} = 0.593 \)

b) Preguntada una mujer dijo que se casó con 22 años ¿Qué edad podemos aventurar que tenía el marido al casarse? Preguntado un hombre dijo que se casó con 24 años ¿Qué edad tendría su esposa al casarse? (Sol: 28; 20).

Preguntada una mujer dijo que se casó con 22 años ¿Qué edad podemos aventurar que tenía el marido al casarse? 

\( x = 22  \Longrightarrow   y = 4.5421 + 22 \times 1.0692 = 28.0645  \simeq 28 \hspace{.2cm} años \)

Preguntado un hombre dijo que se casó con 24 años ¿Qué edad tendría su esposa al casarse?

\( y = 24  \Longrightarrow   x = 12.5485 + 24 \times 0.3289 = 20.4421  \simeq 20 \hspace{.2cm} años \)

8. Dos variables tienen las siguientes rectas de regresión mínimo-cuadráticas:

\( 8x+2y=1 \hspace{.2cm} ; \hspace{.2cm}   16x+9y-1=0 \)

Calcular x, y y el coeficiente de correlación lineal. (Sol:  0.175; -0.2; r=-0.666).

Solución 

Suponemos que : \(  \hspace{.3cm} Y/X : 8x + 2y = 1 \Longrightarrow y = -4x + 1/2 \)

Suponemos que : \(  \hspace{.3cm} X/Y : 16x + 9y = 1 \Longrightarrow x = -\displaystyle \frac{9}{16} y + \displaystyle \frac{1}{16}\)

Entonces: \(  \hspace{.3cm} r^2 = b \times b^´ = -4 \times \displaystyle \frac{-9}{16} = \displaystyle \frac {72}{32} > 1 \hspace{.3cm} \)  Por lo tanto no es correcta

La recta : \(  \hspace{.3cm} Y/X : 16x + 9y = 1 \Longrightarrow y = -\displaystyle \frac{16}{9}x + \displaystyle \frac{1}{9}\)

La recta  : \(  \hspace{.3cm} X/Y : 8x + 2y = 1 \Longrightarrow x = -\displaystyle \frac{1}{4} y + \displaystyle \frac{1}{8}\)

Por lo tanto: \(  \hspace{.3cm} r^2 = b \times b^´ = \displaystyle \frac{-16}{9} \times \displaystyle \frac{-1}{4} =0.44 < 1 \Longrightarrow r = -0.666 \)

Resolvemos el sistema sustituyendo  \(  \hspace{.3cm} x  \hspace{.3cm}  por  \hspace{.3cm} \bar{x} \hspace{.3cm}, \hspace{.3cm} y  \hspace{.3cm}  por  \hspace{.3cm} \bar{y} \)

\(  \left. \begin{array} \\ \bar{y} =  -\displaystyle \frac{16}{9} \bar{x} + \displaystyle \frac{1}{9}   \\  \bar{x} = -\displaystyle \frac{1}{4} \bar {y} + \displaystyle \frac{1}{8}  \end{array}  \right \} \Longrightarrow \bar{x} = 0.175 \hspace{.3cm}; \hspace{.3cm} \bar{y} = -0.2 \)

9. Partiendo de una muestra de 200 pares de observaciones se calcularon las siguientes cantidades:

\(\sum_{i}x_{i}=11.34 \hspace{.2cm} ; \hspace{.2cm}\sum_{i}x_{i}^2=12.16 \hspace{.2cm} ; \hspace{.2cm}\sum_{i}x_{i}y_{i}=22.13 \hspace{.2cm} ; \hspace{.2cm}\sum_{i}y_{i}=20.72;\sum_{i}y_{i}^2=84.96 \)

Se pide:
a) Calcular las dos rectas de regresión y dibujarlas (Sol: \(  y=7.28×10^{-4}+1.824x  \hspace{.2cm} ; \hspace{.2cm}   x=0.0147+0.258y \))

b) ¿Son fiables las predicciones efectuadas con las rectas anteriores?  (Sol: \( r^2=0.4697 \)  (Si es fiable)).

Solución

a) Calcular las dos rectas de regresión y dibujarlas (Sol: \(  y=7.28×10^{-4}+1.824x  \hspace{.2cm} ; \hspace{.2cm}   x=0.0147+0.258y \))

Recta de regresión  \( \hspace{.3cm} X /Y: x= a + by \Longrightarrow  x = 0.0147 + 0.258 y \)

\( b = \displaystyle \frac {\sigma_{xy}}{\sigma^{2}_y} = \displaystyle \frac {0.054}{0.2097}= 0.258  \)

\( \sigma_{xy} =  \displaystyle \frac{  \displaystyle \sum x_iy_i n_{ij}} {n} – \bar{x} \bar{y} =  \displaystyle \frac {22.13}{400}-  \displaystyle \frac {11.34}{400} \times  \displaystyle \frac {20.72}{400} = 0.054 \)

\(  \sigma^{2}_{y}   = \displaystyle \frac { \sum {y_j^{2}}n_{.j}}{n}  – (\bar{y} )^2 = \displaystyle \frac {84.96}{400} = \left ( \displaystyle \frac {20.72}{400} \right )^2 = 0.2097   \)

\( a = \bar{x} – b \bar{y} = 0.028-0.258  \times 0.05 = 0.0147  \)

\(  \sigma^{2}_{x}   = \displaystyle \frac { \sum {x_i^{2}}n_{i.}}{n}  – (\bar{x} )^2 = \displaystyle \frac {12.96}{400} = \left ( \displaystyle \frac {11.34}{400} \right )^2 = 0.0296    \)

Recta de regresión  \( \hspace{.3cm} Y /X: y= a + bx \Longrightarrow  y = 7.28 \times 10^{-4} + 1.824x  \)

\( b = \displaystyle \frac {\sigma_{xy}}{\sigma^{2}_x} = \displaystyle \frac {0.054}{0.0296}= 1.824 \)

\( a = \bar{y} – b \bar{x} = 0.0518 – 1.824  \times 0.028 = 7.28 \times 10^{-4} \)

b) ¿Son fiables las predicciones efectuadas con las rectas anteriores?  (Sol: \( r^2=0.4697 \)  (Si es fiable)).

\( r^2 = \displaystyle \frac {\sigma^2_{xy}}{\sigma^2_x \sigma^2_y} =  \displaystyle \frac {(0.054)^2}{(0.0296)(0.2097)} = 0.4697 \Longrightarrow  \hspace{.3cm} \) Si es fiable

10. En una determinada zona oceánica, se ha realizado un estudio sobre el comportamiento del mar, en relación a diversos factores entre los cuales se encuentra la velocidad del viento. A lo largo de 20 días y durante el último periodo de tiempo se ha observado conjuntamente la velocidad del viento (X) y la altura de las olas (Y). La información obtenida se dispone en la siguiente tabla. Se pide:

\( \begin{array} {|l|c|c|c|c|} \hline  X/Y &   <0.2 &   0.2-1 &   1-3  &  3-7 \\ \hline  <2 &   2  &  0  &  0  &  0 \\ \hline  2-8  &  0  &  5 &   1 &   0 \\ \hline  8-12 &   0  &  0  &  4  &  1 \\ \hline  12-20 &   0  &  0 &   2  &  5 \\ \hline  \end{array} \)

a) Calcular la recta de regresión de Y/X  (Sol:  \( y=-0.4239+0.2870x \))

b) ¿Qué valor asignará a la variable y si dispusiera de un valor x=8.3? ¿Es adecuada tal asignación? (Sol:\(  y=1.95820  \hspace{.2cm} ; \hspace{.2cm} r^2=0.6798 \)  (Buen ajuste)).

Solución

a) Calcular la recta de regresión de Y/X  (Sol:  \( y=-0.4239+0.2870x \))

\( \begin{array}{|c|c|c|c|c|c|c|} \hline  X / Y &   < 0.2  &  0.2-1   & 1-3  & 3-7 &  n_{i.} & x_{i}   & x_i.n_{i.} & x^{2}_i.n_{i.} & \displaystyle \sum  x_{i} y_{j} n_{i.} \\ \hline <2  &  2 &  0  & 0 &  0 &   2 &  1  & 2 & 2 &  0.2 \\  2-8 &  0 &  5 &   1  & 0  &  6 &   5  & 30 & 150 & 15+10=25  \\    8-12  & 0 &   0  &  4  &  1 &  5 & 10 & 50 &  500 & 80 + 50 = 130  \\     12-20 &   0  &  0 & 2 &   5  & 7  & 16 & 112 & 1792 &  64+400 = 464  \\        \hline  n_{.j} & 2 & 5 & 7  & 6 & 20 &  194 & & 2444 & 619.2   \\ \hline y_{j}  & 0.1 & 0.6 & 2 & 5 & &  \\ \hline  n_{.j} y_j & 0.2  & 3 & 14 & 30 & 47.2 & & & & \\ \hline   n_{.j} y_j^{2} & 0.02 & 1.8 & 28 & 150 & 179.82 & & & & &     \\ \hline \end{array} \)

x : velocidad del viento

y: altura de las olas

Rexta de regresión  \( \hspace{.3cm} Y /X: y= a + bx \Longrightarrow  y = -0.4239 + 0.2870x  \)

\( b = \displaystyle \frac {\sigma_{xy}}{\sigma^{2}_x} = \displaystyle \frac {13.024}{64.44}= 0.2870 \)

\( \sigma_{xy} =  \displaystyle \frac{  \displaystyle \sum x_iy_i n_{ij}} {n} – \bar{x} \bar{y} =  \displaystyle \frac {619.2}{20}-  \displaystyle \frac {194}{20} \times  \displaystyle \frac {47.2}{20} = 8.08624 \)

\(  \sigma^{2}_{x}   = \displaystyle \frac { \sum {x_i^{2}}n_{i.}}{n}  – (\bar{x} )^2 = \displaystyle \frac {2444}{20} = \left ( \displaystyle \frac {194}{20} \right )^2 = 28.11   \)

\( a = \bar{y} – b \bar{x} = \displaystyle \frac { 47.2}{20} – 0.2870 \times \displaystyle \frac {192}{20} = -0.4239 \)

b) ¿Qué valor asignará a la variable y si dispusiera de un valor x=8.3? ¿Es adecuada tal asignación? (Sol:\(  y=1.95820  \hspace{.2cm} ; \hspace{.2cm} r^2=0.6798 \)  (Buen ajuste)).

¿Qué valor asignará a la variable y si dispusiera de un valor x=8.3? 

para  \( \hspace{.3cm} x=8.3 \Longrightarrow  y = -0.4239 + 0.2870 \times 8.3 = 1.9582  \)

¿Es adecuada tal asignación?

\( r^2 = \displaystyle \frac {\sigma^2_{xy}}{\sigma^2_x \sigma^2_y}  \)

\(  \sigma^{2}_{y}   = \displaystyle \frac { \sum {y_j^{2}}n_{.j}}{n}  – (\bar{y} )^2 = \displaystyle \frac {179.82}{20} = \left ( \displaystyle \frac {47.2}{20} \right )^2 = 3.4214  \)

\( r^2 = \displaystyle \frac {\sigma^2_{xy}}{\sigma^2_x \sigma^2_y} =  \displaystyle \frac {(8.086)^2}{(3.4214)(28.11)} = 0.6798 \Longrightarrow  \hspace{.3cm} \) Si es fiable. Es un buen ajuste.

11. En un cierto estudio sobre fiabilidad se han obtenido los datos de la siguiente tabla:

\( \begin{array} {|l|c|c|c|c|c|c|c|} \hline  X/Y &  <3  &  3-4  &  4-5  &  5-6 &  6-7  &  7-8 &   >8 \\ \hline  <5  &  3  &  0  &  0 &   0  &  0  &  0  &  0 \\ \hline 15-20 & 0 & 8 & 0 & 0 & 0 & 0 & 0 \\ \hline  20-25  &  0   & 0   &  9 &   1  &  0 &   0  &  0 \\ \hline  25-30  &  0   &  0  &  0 &   9  &  0 &   0  &  0 \\ \hline 30-35  &  0   &  0  &  0    & 0  &   9  &  0 &   0 \\ \hline  35-40  &  0   &  0  &  0  &  0   &  0  &  7  &  1 \\ \hline   >40  &  0  &  0 &   0 &   0  &  0  &  0 &   3 \\ \hline   \end{array} \)

a) Calcular el coeficiente de correlación lineal. (Sol: 0.9695)

b) Obtener las rectas de regresión de Y/X y de X/Y. (Sol: \( y=0.9747+0.1696x  \hspace{.2cm} ; \hspace{.2cm} x=-3.76+5.5376y \)).

Solución 

\( \begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|c|c|} \hline  X / Y &   < 3  &  3-4   & 4-5  & 5-6 & 6-7 & 7-8 & 8-9 & n_{i.} & x_i & x{´}_{i}   & x^{´}_i.n_{i.} & x^{´2}_i.n_{i.} & \displaystyle \sum  x{´}_{i} y{´}_{j} n_{.j} \\ \hline < 5  &  3 &  0  & 0 &  0 &   0 &  0 & 0 & 3 & 2.5 & -5 & -15 & 75 & 45 \\  15-20 &  0 &  8 &  0  & 0 &  0 &   0  & 0 & 8 & 17.5 & -2 & -16 & 32 & 32  \\  20-25 &  0  & 0 &   9  &  1  &  0 &   0 & 0 & 10 & 22.5 &  -1 &  -10 & 10 & 9  \\     25-30 &   0  &  0 & 0 &   9  & 0 & 0 & 0 & 9 & 27.5 &  0 & 0 & 0 & 0  \\     30-35 &   0  &  0 & 0 & 0 &  9  & 0 & 0 &  9 & 32.5 &  1 & 9 & 9 & 9   \\     35-40 &   0  &  0 & 0 &   0  & 0 & 7 & 1 & 8 & 37.5 &  2 & 16 & 32 & 34   \\  > 40  &   0  &  0 & 0 &   0  & 0 & 0 & 3 & 3 & 42.5 & 3 &   9 & 27 & 27  \\        \hline  n_{.j} & 3 & 8 & 9  & 10 & 9 &  7 & 4 & 50 & & & -7 & 185 & 156   \\ \hline y_j & 2.5 & 3.5 & 4.5 & 5.5 & 6.5 & 7.5 & 8.5 & & & & &   \\ \hline y{´}_{j}  & -3 & -2 & -1 & 0 & 1  & 2 & 3 & & & & &   \\ \hline  y^{´}_j.n_{j} & -9 & -16 &  -9 & 0 & 9 & 14 & 12  & 1 &  &  & & &    \\ \hline  y^{´2}_j.n_{j} & 27 & 32 &  9 & 0 & 9 & 28 & 36 & 141 & & & &  \\ \hline \end{array} \)

\( x{´}_{i} =  \displaystyle \frac { x_i- 27.5}{5} \hspace{.3cm} ; \hspace{.3cm}  y{´}_{j} = y_j  –  5.5  \)

a) Calcular el coeficiente de correlación lineal. (Sol: 0.9695)

\( \sigma_{x^´y^´} =  \displaystyle \frac{  \displaystyle \sum x^´_iy^´_i n_{.j}} {n} – \bar{x^´} \bar{y^´} =  \displaystyle \frac {156}{50}-  \displaystyle \frac {-7}{50} \times  \displaystyle \frac {1}{50} = 3.1228 \)

\( \sigma_{xy} =  \sigma_{x^´y^´} \times 5 =  15.614 \)

\(  \sigma^{2}_{x^´}   = \displaystyle \frac { \sum {x_i^{2}´}n_{i.}}{n}  – (\bar{x^´} )^2 = \displaystyle \frac {185}{50} – \left ( \displaystyle \frac {-7}{50} \right )^2 = 3.6804 \Longrightarrow \sigma_{x^´} = 1.9184  \Longrightarrow   \sigma_{x}  = 5 \times 1.9184   9.59  \)

\(  \sigma^{2}_{y^´}   = \displaystyle \frac { \sum {y_j^{2}´}n_{.j}}{n}  – (\bar{y^´} )^2 = \displaystyle \frac {141}{50} – \left ( \displaystyle \frac {1}{50} \right )^2 = 2.81964 \Longrightarrow   \sigma_{y^´}= 1.679 =  \sigma_y   \)

Coeficiente de correlación lineal

\(   r =  \displaystyle \frac {\sigma_{x^´y^´}}{\sigma_{x^´} \sigma_{y^´}} = \displaystyle \frac {3.1228}{1.9184 \times 1.679} = 0.969 \)

\(   r =  \displaystyle \frac {\sigma_{xy}}{\sigma_x \sigma_y} = \displaystyle \frac {15.614}{9.59 \times 1.679} = 0.969 \)

b) Obtener las rectas de regresión de Y/X y de X/Y. (Sol: \( y=0.9747+0.1696x  \hspace{.2cm} ; \hspace{.2cm} x=-3.76+5.5376y \)). 

Recta de regresión  \( \hspace{.3cm} Y /X: y= a + bx \Longrightarrow  y = 0.9747 + 0.1696 x  \)

\( b = \displaystyle \frac {\sigma_{xy}}{\sigma^{2}_x} = \displaystyle \frac {15.674}{92.01}= 0.1696 \)

\( \bar{x} = \displaystyle \frac{  -7}{50}\times 5 + 27.5 = 26.8 \)

\( \bar{y} = \displaystyle \frac{ 2}{50}\times 1 + 5.5 = 5.52 \)

\( a = \bar{y} – b \bar{x} = 5.52 – 0.1696  \times 26.8 = 0.9747 \)

Recta de regresión  \( \hspace{.3cm} X /Y: x= a + by \Longrightarrow  x = -3.76 + 5.5376 y \)

\( b = \displaystyle \frac {\sigma_{xy}}{\sigma^{2}_y} = \displaystyle \frac {15.674}{2.8196}= 5.5376  \) \( a = \bar{x} – b \bar{y} = 26.8 – 5.5376  \times 5.52 = -3.76 \)

12. Cinco niños de 2, 4, 6, 7 y 8 años pesan respectivamente, 15, 19, 25, 33 y 34 Kgs. Hallar la recta de regresión mínimo cuadrática del peso con respecto a la edad. (Sol: \( y=6.9+3.388x \hspace{.2cm} ; \hspace{.2cm} r^2=0.948 \) (Buen ajuste)).

Solución 

\( \begin{array} {|r|r|r|r|r|} \hline  x_i & y_j   & x_iy_j &  x_i^2  & y_j^{2} \\ \hline 2  &   15  &   30 &    4 & 225  \\ 4 & 19 & 76 & 16 & 361  \\ 6 & 25 & 150 & 36 & 625 \\ 7 & 33 & 231 & 49 & 1089 \\ 8 & 34 & 272 & 64 & 1156 \\ \hline  27 & 126 & 759 & 169 & 3456 \\ \hline \end{array} \)

Recta de regresión  \( \hspace{.3cm} Y /X: y= a + bx \Longrightarrow  y = 6.9 + 3.388 x  \)

\( b = \displaystyle \frac {\sigma_{xy}}{\sigma^{2}_x} = \displaystyle \frac {15.72}{4.64}= 3.388 \)

\( \sigma_{xy} =  \displaystyle \frac{  \displaystyle \sum x_iy_j} {n} – \bar{x} \bar{y} =  \displaystyle \frac {759}{5}-  \displaystyle \frac {27}{5} \times  \displaystyle \frac {126}{5} = 15.72 \)

\(  \sigma^{2}_{x}   = \displaystyle \frac { \sum {x_i^{2}}}{n}  – \bar{x}^2 = \displaystyle \frac {169}{5} – \left ( \displaystyle \frac {27}{5} \right )^2 = 4.64  \)

\( a = \bar{y} – b \bar{x} = \displaystyle \frac {126}{5}-3.388  \times \displaystyle \frac {27}{5} = 6.9 \)

¿Qué grado de bondad tendrían las predicciones efectuadas con la recta anterior?

\( r^2 = \displaystyle \frac {\sigma^2_{xy}}{\sigma^2_x \sigma^2_y} \)

\(  \sigma^{2}_{y}   = \displaystyle \frac { \sum {y_j^{2}}}{n}  – \bar{y}^2 = \displaystyle \frac {3456}{5} – \left ( \displaystyle \frac {126}{5} \right )^2 = 56.16  \)

\( r^2 =  \displaystyle \frac {(15.72)^2}{(4.64)(56.16)} = 0.948 \Longrightarrow  \hspace{.3cm} \)  Es un buen ajuste.

13. La siguiente tabla muestra el número de calzado y los pesos de 55 estudiantes:

\( \begin{array} {|l|c|c|c|c|c|c|c|} \hline  X/Y &   50  &  60 &   65  &  70  &  75 &   80 &   85 \\ \hline  39  &  1  &  0 &   0 &   0 &   0  &  0  &   0 \\ \hline  40    & 0 &   3 &    3 &    4 &   0  &    0  &  0 \\ \hline  41    & 0 &   3  &   4  &   6  &   0  &  0  &  1 \\ \hline  42  &  0  &  0   &  8   &  8   &  7 &   2 &   0 \\ \hline  43  &  0  &  0   &  2   &  0  &  1  &  0  &  0 \\ \hline  44  &  0  &  0 &   0    & 0   &  0 &   0  &   2 \\ \hline  \end{array} \)

Dar una predicción del peso de un estudiante que calza el 38 ¿Es buena la predicción? (Sol:   \(  y=-80.15+3.59576x  \hspace{.2cm} ; \hspace{.2cm} y=56.48  \hspace{.2cm} ; \hspace{.2cm} r^2=0.3060  \)).

Solución 

Dar una predicción del peso de un estudiante que calza el 38 ¿Es buena la predicción? (Sol:   \(  y=-80.15+3.59576x  \hspace{.2cm} ; \hspace{.2cm} y=56.48  \hspace{.2cm} ; \hspace{.2cm} r^2=0.3060  \)).

\( \begin{array}{|c|c|c|c|c|c|c|c|c|} \hline  X / Y &   50 &  60   & 65  & 70 & 75 & 80 & 85 & n_{i.} & x_i.n_{i.} & x^{2}_i.n_{i.} & \displaystyle \sum  x_{i} y_{j} n_{i.} \\ \hline 39  &  1 &  0  & 0 &  0 &   0 &  0  & 0 & 1 &  39 & 1521 & 1950 \\  40 &  0 &  3 &  3  & 4  &  0 &   0  & 0 & 10 & 400 & 16000 &  26200  \\    41  & 0 &  3  &  4  &  6 &  0 & 0 & 1 &  14 & 574 & 23534 & 38745  \\     42 &   0  &  0 & 8 &   8  & 7  & 2 & 0 & 25 &  1050  & 44100 & 74130  \\ 43 &   0  &  0 & 2 &   0  & 1  & 0 & 0 & 3 &  129 & 5547 & 8815  \\   44 &   0  &  0 & 0 &   0  & 0  & 0 & 2 & 2 &  88 & 3872 & 7480  \\     \hline  n_{.j} & 1 & 6 & 17  & 18 & 8 &  2 & 3 & 55 & 2280 & 94574 & 157320     \\ \hline  n_{.j} y_j & 50  & 360 & 1105 & 1260 & 600 & 160  &  255 & 3790 &  & & \\ \hline   n_{.j} y_j^{2} & 2500 & 21600 & 71825 & 88200 & 45000 & 12800 & 21675 & 263600 & &     \\ \hline \end{array} \)

Recta de regresión  \( \hspace{.3cm} Y /X: y= a + bx \Longrightarrow  y = -80.15+3.59576 x  \)

\( \sigma_{xy} =  \displaystyle \frac{  \displaystyle \sum x_iy_j} {n} – \bar{x} \bar{y} =  \displaystyle \frac {157320}{55}-  \displaystyle \frac {2280}{55} \times  \displaystyle \frac {3790}{55} = 3.768 \)

\(  \sigma^{2}_{x}   = \displaystyle \frac { \sum {x_i^{2}}}{n}  – \bar{x}^2 = \displaystyle \frac {94574}{55} – \left ( \displaystyle \frac {2280}{55} \right )^2 = 1.0479  \)

\( b = \displaystyle \frac {\sigma_{xy}}{\sigma^{2}_x} = \displaystyle \frac {3.768}{1.047}= 3.59576 \)

\( a = \bar{y} – b \bar{x} = \displaystyle \frac {3790}{55}-3.59576 \times \displaystyle \frac {2280}{55} = -80.1516 \)

Predicción del peso de un estudiante que calza el 38 \(  \hspace{.3cm} x= 38 \Longrightarrow  y =  -80.15+3.59576 \times 38 = 56.48  \)

\( r^2 = \displaystyle \frac {\sigma^2_{xy}}{\sigma^2_x \sigma^2_y} = \displaystyle \frac {(3.768)^2}{1.0479 \times 44.2644} = 0.3060  \)

\(  \sigma^{2}_{y}   = \displaystyle \frac { \sum {y_j^{2}}}{n}  – \bar{y}^2 = \displaystyle \frac {263600}{55} – \left ( \displaystyle \frac {3790}{55} \right )^2 = 44.2644  \)

14. Dados los siguientes datos correspondientes a dos variables \( (x_i, y_j) \)

\( \begin{array} {|c|c|c|c|c|c|c|} \hline  x_i &   2  &  4  &  6  &  8 &   10  &  12 \\ \hline y_j  &   7  &   15 &    19 &   23  &  27 &   30 \\ \hline  \end{array} \)

Ajústese a dichos datos una parábola. (Sol: \(  y = 0.484 + 2.998 x – 0.112 x^2 \) )

Solución 

Ajústese a dichos datos una parábola. (Sol: \(  y = 0.484 + 2.998 x – 0.112 x^2 \) )

\( \begin{array} {|r|r|r|r|r|r|r|r|} \hline  x_i & y_j   & x^{´}_i &  x^{´2}_i &  x^{´3}_i &   x^{´4}_i &x^{´}_iy_j &  x_i^{´2} y_j \\ \hline 2  &   7  &  -5 &    25 & -125 & 625 & -35 & 175 \\ 4 & 15 & -3 & 9 &-27 & 81 & -45 & 135 \\ 6 & 19 & -1 & 1 & -1 & 1 & -19 & 19 \\ 8 & 23 & 1 & 1 & 1 & 1 & 23 & 23 \\ 10 & 27 & 3 & 9 & 27 & 81 & 81 & 243 \\ 12 & 30 & 5 & 25 & 125 & 625 & 150 & 750 \\  \hline  42 & 121 & 0 & 70 & 0 & 1414 & 155 & 1345 \\ \hline \end{array} \)

Como la media de x: \( \hspace{.3cm} \bar{x} = \displaystyle \frac {42}{5} = 7 \hspace{.3cm} \) vamos a realizar el siguiente cambio de variable \( \hspace{.3cm} x^{´}_i = x_i-7.\hspace{.3cm}  \) Por lo tanto la función a ajustar es: \( \hspace{.3cm}  y ^{*} = a^´+ b^´x^´ + c^´x^{´2} \)

El sistema de ecuaciones normales se convierte en:

\( \left.\begin{array} \\  \sum y_j   =    na^´ + b^´ \sum x^{´}_i + c^´ \sum x^{´2}_i  \\ \sum \sum x^´_i y_j   =   a^´ \sum x^{´}_i  + b^´ \sum x^{´2}_i  + c^´ \sum x^{´3}_i \\  \sum \sum x^{´2}_i y_j   =   a^´ \sum x^{´2}_i  + b^´ \sum x^{´3}_i  + c^´ \sum x^{´4}_i \end{array} \right \} \hspace{.2cm} \) \( \left.\begin{array} \\ 121  = 6a^´ + 0 + 70 c^´ \\ 155  =  0a^´ + 70 b^´ + 0 c^´ \\  1345   = 70 a^´ + 0 b^´ + 1414 c^´ \end{array} \right \} \)

\(  b^´ = \displaystyle \frac {155}{10}= 2.214  \hspace{.2cm} ;  \hspace{.2cm} c^´ = – 0.112  \hspace{.2cm} ;  \hspace{.2cm} a^´=21.47 \)

La parábola ajustad es: \(  \hspace{.2cm}  y^{*} = 21.47 + 2.214 x^´ – 0.112 x^{´2} \hspace{.2cm} \) que en función de la variable original, obtenemos la siguiente ecuación:

\(  y = 21.47 + 2.214 (x-7) – 0.112 (x-7)^{2} = 0.484 + 2.998 x – 0.112 x^2 \)

15. Dada la siguiente distribución 

\( \begin{array} {|l|c|c|c|c|c|} \hline  x_i &   1  &  2  &  3  &  4 &   5 \\ \hline y_j  &   100  &   120 &    110 &   150  &  130 \\ \hline  \end{array} \)

Ajustar una función exponencial del tipo \( \hspace{.3cm} y = a b^x \hspace{.3cm} \) ¿Es mejor dicho ajuste que si ajustamos la recta de regresión de \( \hspace{.3cm} Y/X \) ?

Solución 

Ajustar una función exponencial del tipo \( \hspace{.3cm} y = a b^x \hspace{.3cm} \) ¿Es mejor dicho ajuste que si ajustamos la recta de regresión de \( \hspace{.3cm} Y/X \) ?

Para ajustar una función exponencial del tipo \( \hspace{.3cm} y = a b^x ,\hspace{.3cm} \) En primer lugar, linealizaremos la función tomando logaritmos

\( \log y = \log a + x \log b \)

Llamemos \( V= \log y \hspace{.3cm}, \hspace{.3cm} A = \log a \hspace{.3cm}, \hspace{.3cm} B = \log b \hspace{.3cm}, \hspace{.3cm} \) obtenemos la recta \( \hspace{.3cm}, \hspace{.3cm}  V = A + x B   \)

\( \begin{array} {|l|l|l|l|l|l|l|l|} \hline  x_i &   y_j &  v_i= \log y_j  &  x_iv_i  &  x_i^{2} &  y_j^{2} & x_iy_j & v_i^2 \\ \hline 1  &   100  &  2 &    2 &    1 & 1000 & 100 & 4 \\ 2 & 120 & 2.0792 & 4.1584 & 4 & 14400 & 240 & 4.28  \\ 3 & 110 & 2.0414 & 6.1242 & 9 & 12100 & 330 & 4.16 \\ 4 & 150 & 2.1761 & 8.7044 & 16 & 22500 & 600 & 4.70 \\ 5 & 130 & 2.1139 & 10.5695 & 25 & 16900 & 650  & 4.45 \\ \hline 15 & 610 & 10.410609 & 31.5565 & 55 & 75900 & 1920 & 21.694408 \\ \hline  \end{array} \)

\( B = \displaystyle \frac {\sigma_{ xv}}{\sigma_{ x}^2} \)

\( \sigma_{xv} =  \displaystyle \frac { \sum x_iv_i}{n}-\bar{x}\bar{v} =  \displaystyle \frac {31.5565}{5}-  \displaystyle \frac {15}{5} \times  \displaystyle \frac{10.4106}{5}=0.06494 \)

\( \sigma_ x^2 =  \displaystyle \frac {\sum x^2_i}{n}-(\bar{x})^2 =  \displaystyle \frac {55}{5}-  \left ( \displaystyle \frac {15}{5}\right ) = 2  \)

\( B = \displaystyle \frac {\sigma_{ xv}}{\sigma_{ x}^2} =  \displaystyle \frac{0.06494}{2} = 0.03247  \Longrightarrow  \hspace{.3cm} \) como \( \hspace{.3cm} B = \log b \Longrightarrow b = 10^{0.03247} = 1.0776 \)

\( A = \bar{v} -B \bar{x} = \displaystyle \frac {10.4106}{5} – 0.03247 \times \displaystyle \frac {15}{5} = 1.98471 \Longrightarrow a = 10^{1.9841} = 96.54 \)

Por lo tanto la función ajustada es: \( \hspace{.3cm} y = 96.54 \times 0776^x \)

¿Es mejor dicho ajuste que si ajustamos la recta de regresión de \( \hspace{.3cm} Y/X \) ?

\( \sigma_{xy} =  \displaystyle \frac { \sum x_iy_i}{n}-\bar{x}\bar{y} =  \displaystyle \frac {1920}{5}-  \displaystyle \frac {15}{5} \times  \displaystyle \frac{610}{5}= 18 \)

\( b = \displaystyle \frac {\sigma_{ xy}}{\sigma_{ x}^2} =  \displaystyle \frac{18}{2} = 9 \)

\( a = \bar{y} -b \bar{x} = \displaystyle \frac {610}{5} – 9 \times \displaystyle \frac {15}{5} = 95 \)

Por lo tanto la recta ajustada es: \( \hspace{.3cm} y = 95+9x \)

\( r^2 = \displaystyle \frac {\sigma^2_{xy}}{\sigma^2_x \sigma^2_y} = \displaystyle \frac {(18)^2}{2 \times 296} = 0.547  \)

\(  \sigma^{2}_{y}   = \displaystyle \frac { \sum {y_j^{2}}}{n}  – \bar{y}^2 = \displaystyle \frac {75900}{5} – \left ( \displaystyle \frac {610}{5} \right )^2 = 296  \)

Para calcular la bondad de ajuste de la función exponencial se pueden seguir dos caminos:

\(  V_r = V_y(1-r^2)=296(1-0.547) = 134.088  \)

  1. Calcular la bondad de ajuste de la recta auxiliar \( \hspace{.3cm}  v = A + B x \hspace{.3cm} \) mediante :
\( r^{2}_{vx}   = \displaystyle \frac { \sigma^2_{vx}}{\sigma^{2}_{v} \sigma^{2}_{x}} \hspace{3cm} \) \(  \sigma^{2}_{v}   = \displaystyle \frac { \sum {v_i^{2}}}{n}  – \bar{v}^2 = \displaystyle \frac {21.694408}{5} – \left ( \displaystyle \frac {10.41069}{5} \right )^2 = 0.0036504  \) \( r^{2}_{vx}   = \displaystyle \frac { \sigma^2_{vx}}{\sigma^{2}_{v} \sigma^{2}_{x}} =  \displaystyle \frac {{0.06494}^2}{0.0036504 \times 2} = 0.57763 \)

Pero este valor no es comparable con la bondad de ajuste de la recta \( \hspace{.3cm} y = 95+9x . \hspace{.3cm} \) En el caso lineal, el coeficiente de determinación \( \hspace{.1cm} r^2, \hspace{.1cm} \) que indica que parte de la varianza de la variable dependiente es explicada por la regresión. Si calculamos este coeficiente sobre las rectas transformadas, como en el caso anterior, no tendrá el mismo significado y no serán comparables con los valores obtenidos sobre la bondad de ajuste de una recta o una parábola. Si se quiere hacer un estudio comparativo sobre la bondad de ajuste entre este tipo de funciones y la recta, es más adecuado calcular la bondad de ajuste mediante:

\( S^2_{ry} = \displaystyle \frac { 1}{n}  \sum \sum e^2_{ij}n_{ij} =  \displaystyle \frac { 1}{n} \sum   \sum (y_j-\hat{y}_i)^2n_{ij} \)

siendo: \(  \hspace{.3cm} \hat{y}_i = ab^{x_i} \hspace{.3cm}\) o  \(  \hat{y}_i = ax_i^b \hspace{.3cm}\) o   \(  \widehat{y}_i = a+ \displaystyle \frac {b}{x_i} \hspace{.3cm}\) etc.

2. Calcular directamente la bondad de ajuste de \( \hspace{.3cm} y = ab^x, \hspace{.3cm} \) calculando los residuos, varianza residual y por último el coeficiente de determinación. Este valor si es comparable con el obtenido mediante la recta \( \hspace{.3cm} y = 95+9x , \hspace{.3cm} \) pues se ha obtenido aplicando la misma medida.

 \( \widehat{y}_i = a b^{x_i} \Longrightarrow  \log \widehat{y}_i = \log a + x_i \log b \)

\( \begin{array} {|l|l|l|l|l|l|l|l|} \hline  x_i &  \log \widehat{y}_i = \log a + x_i \log b &  \widehat{y}_i  &  (y_i- \widehat{y}_i )^2  &  y_i \\ \hline 1  &   2.01718  &  104.035 &   16.2812 &    100 \\ 2 & 2.040965 & 112.11146 & 62.229 & 120  \\ 3 & 2.08212 & 120.5591 & 111.494 & 110 \\ 4 & 2.11459 & 130.19371 & 392.289 & 150 \\ 5 & 2.14706 & 140.30075 & 106.1055 & 130 \\ \hline  &  &  & 688.384 &  \\ \hline  \end{array} \)

 \( S^2_r = \displaystyle \frac { 1}{n}  \sum e^2_{i} = \displaystyle \frac { 1}{n}  \sum (y_i-\widehat{y}_i)^2 =  \displaystyle \frac{688.384}{5} = 137.6768 \)

Función exponencial:  \( S^2_r = 137.6768 \)

Función lineal:  \( S^2_r = 134.088 \)

Mejor ajuste es el de la recta de regresión.

16. De las estadísticas “Tiempos de vuelo y consumos de combustibles” de una compañía aérea, se han obtenido datos relativos a 24 trayectorias realizadas por el Airbus A320. A partir de estos datos de han elaborado los siguientes estadísticos.

\( \sum_{i}x_{i}=31.470 \hspace{.2cm} ; \hspace{.2cm} \sum_{i}y_{i}=219.719 \hspace{.2cm}\sum_{i}x_{i}y_{i}=349.486 \)

\(  \sum_{i}x_{i}^2=51.075 \hspace{.2cm} ;  \hspace{.2cm} \sum_{i}y_{i}^2=2396.504   \hspace{.2cm}; \hspace{.2cm} \sum_{i} x_{i}^2 y_{i}= 633.993 \)

\(  \sum_{i}x_{i}^3= 93.600 \hspace{.2cm} ;  \hspace{.2cm} \sum_{i}x_{i}^4=182.977 \)

La variable \( Y \) expresa el consumo total de combustible en miles de euros, correspondientes a un vuelo de duración \( X \); el tiempo  \( X \) se expresa en horas y se utilizan como unidades de orden inferior fracciones decimales de la hora.

a) Ajustar  un modelo del tipo  \(   Y = a +bx   \), obteniendo la estimación de a y de b. ¿Qué consumo total se estimaría, en miles de euros, para un programa de vuelos compuesto de 100 vuelos de media hora, 200 de una hora y 100 de dos horas?¿ Es posible esta estimación?

b) Estimar la función \(   Y = a +bx+cx^2   \). Obtener la estimación de a, b y c. ¿Qué consumo total se estimaría, en miles de libras, para un programa de vuelos compuesto de 100 vuelos de media hora, 200 de una hora y 100 de 2 horas?

Solución 

a) Ajustar  un modelo del tipo  \(   Y = a +bx   \), obteniendo la estimación de a y de b

\( b = \displaystyle \frac {\sigma_{xy}}{\sigma^{2}_x} = \displaystyle \frac {2.5574}{0.4087}= 6.257 \)

n= 24 trayctorias distintas

\( \sigma_{xy} =  \displaystyle \frac{1}{n}  \displaystyle \sum n_{i} x_iy_i – \bar{x} \bar{y} =  \displaystyle \frac {349.486}{24}-  \displaystyle \frac {31.470}{24} \times  \displaystyle \frac {219.719}{24} = 2.5574 \)

\(  \sigma^{2}_x   = \displaystyle \frac { \sum { n_ix_i^2}}{n}  – (\bar{x} )^2 = \displaystyle \frac {51.075}{24} = \left ( \displaystyle \frac {31.470}{24} \right )^2 = 0.4087   \)

\( a = \bar{y} – b \bar{x} =  \displaystyle \frac {219.719}{24} – 6.257 \times  \displaystyle \frac {31.470}{24} = 0.95046 \)

Rexta de regresión  \( \hspace{.2cm} Y /x: y = 0.95046 + 6.257 x \)

¿Qué consumo total se estimaría, en miles de euros, para un programa de vuelos compuesto de 100 vuelos de media hora, 200 de una hora y 100 de dos horas?¿ Es fiable esta estimación? 

100 de media hora \(  \hspace{.2cm} y = 0.95046+6.257 \times 0.5 = 4.078 \Longrightarrow 4.048 \times 100 = 407.8 \hspace{.2cm} \) miles de litros.

200 de una hora \(  \hspace{.2cm} y = 0.95046+6.257 \times 1 = 7.20746 \Longrightarrow 7.20746 \times 200 = 1441.492 \hspace{.2cm} \) miles de litros

100 de dos horas \(  \hspace{.2cm} y = 0.95046+6.257 \times 2 = 13.46446 \Longrightarrow 13.46446 \times 100 = 1346.446 \hspace{.2cm} \) miles de litros.

Consumo = \( 407.8+1441.492+1346.446=3195.738 \hspace{.2cm} \) miles de litros.

¿ Es fiable esta estimación? 

Calculamos el coeficiente de correlación lineal

\(   r =  \displaystyle \frac {\sigma_{xy}}{\sigma_x \sigma_y} = \displaystyle \frac {2.5574}{ \sqrt {0.4087} \times \sqrt {16.041}} = 0.998 \hspace{.2cm}\) es muy fiable

b) Estimar la función \(   Y = a +bx+cx^2   \). Obtener la estimación de a, b y c. 

\( \left.\begin{array} \\  a_{01}  =    a + b a_{10} + c a_{20} \\ a_{11}  =   a a_{10} + b a_{20}+ca_{30} \\  a_{21}  =   a a _{20} + b a_{30} + c a_{40} \end{array} \right \}  \)

\(  a_{01} =\displaystyle \frac {1}{n} \sum n_iy_i = \displaystyle \frac {219.719}{24}=9.1549 \hspace{.3cm};  \hspace{.3cm} a_{10} =\displaystyle \frac {1}{n} \sum n_ix_i = \displaystyle \frac {31.470}{24}=1.31125  \)

\(  a_{20} =\displaystyle \frac {1}{n} \sum n_ix^{2}_i = \displaystyle \frac {51.075}{24}=2.128 \hspace{.3cm};  \hspace{.3cm} a_{11} = \displaystyle \frac {1}{n} \sum n_ix_iy_i = \displaystyle \frac {349.486}{24}=14.561 \)

\(  a_{30} =\displaystyle \frac {1}{n} \sum n_ix^{3}_i = \displaystyle \frac {93.600}{24}=3.9 \hspace{.3cm};  \hspace{.3cm} a_{21} = \displaystyle \frac {1}{n} \sum n_ix^{2}_iy_i = \displaystyle \frac {633.993}{24}=26.41 \)

\(  a_{40} =\displaystyle \frac {1}{n} \sum n_ix^{4}_i = \displaystyle \frac {182.977}{24}=7.6240 \)

\( \left.\begin{array} \\  0.15  =    a + 1.31b + 2.12 c  \\ 14.5  = 1.31   a + 2.12 b + 3.9 c \\  26.41  =   2.12 a  + 3.9 b  + 7.6 c  \end{array} \right \} \Longrightarrow \) \( a=0.794 \hspace{.2cm};  \hspace{.2cm} b=6.676 \hspace{.2cm};  \hspace{.2cm} c= 0.118 \)

\(  y = 0.794 +6.676 + 0.118 x^{2}  \)

¿Qué consumo total se estimaría, en miles de libras, para un programa de vuelos compuesto de 100 vuelos de media hora, 200 de una hora y 100 de 2 horas?

100 de media hora \(  \hspace{.2cm} y = 0.794+6.676 \times 0.5 + 0.118 \times 0.5^{2} = 4.103 \Longrightarrow 4.103 \times 100 = 410.3 \hspace{.2cm} \) miles de litros.

200 de una hora \(  \hspace{.2cm} y = 0.794+6.676 + 0.118 = 7.352 \Longrightarrow 7.352 \times 200 = 1470.4 \hspace{.2cm} \) miles de litros

100 de dos horas \(  \hspace{.2cm} y = 0.794+6.676 \times 2 + 0.118 \times 2^{2} = 13.674 \Longrightarrow 13.674 \times 100 = 1367.4 \hspace{.2cm} \) miles de litros.

Consumo = \( 410.3 + 1470.4 + 1367.4 = 3248.1 \hspace{.2cm} \) miles de litros.

Autora: Ana María Lara Porras. Universidad de Granada

Estadística para Biología y Ciencias Ambientales. Tratamiento informático mediante SPSS. Proyecto Sur Ediciones.