1. A partir de los datos, encontrar la mejor curva de ajuste (modelo probabilístico) para las funciones de densidad marginales de X y Y.
A partir de las gráficas obtenidas en la parte 4, se pudo observar que ambas se acercan a curvas gaussianas, por lo que se describirán como tal. Para obtener las curvas de mejor ajuste, se obtuvo el valor de la media, amplitud y desviación estándar, las cuales son:
- Para x:
- Media: 10.0
- Desviación estándar:3.1691447207203343
$\approx$ 3.17 - Amplitud: 0.12588326364305466
$\approx$ 0.13
- Para y:
- Media: 15.0
- Desviación estándar: 6.068450128041075
$\approx$ 6.07 - Amplitud: 0.06574039037710823
$\approx$ 0.066
Al revisar los valores de las curvas de mejor ajuste, se encuentra que son similares, como se muestra a continuación:
- Para x:
- Media: 9.88371412
- Desviación estándar:3.1691447207203343
- Amplitud: 0.12178123
- Para y:
- Media: 15.08746267
- Desviación estándar: 6.77905397
- Amplitud: 0.06640209
Como se puede haber, hubo variaciones entre los resultados, lo cual se puede atribuir a la definición de la función, pero se acercan lo suficiente para confirmar que son distribuciones gaussianas.
2. Asumir independencia de X y Y. Analíticamente, ¿cuál es entonces la expresión de la función de densidad conjunta que modela los datos?
Se obtiene entonces para X la siguiente función marginal:
Por otro lado, para Y será de la forma:
Finalmente, la función de densidad conjunta será:
3. Hallar los valores de correlación, covarianza y coeficiente de correlación (Pearson) para los datos y explicar su significado.
Se obtuvo entonces:
- Correlación: Dió un valor de 149.54281 dada la definición para valores discretos, lo cual se considera que es muy alto, por lo que se puede asumir que están altamente correlacionados.
- Covarianza: Se obtuvo un valor de 0.06481, lo cual se dice que está cercano a cero, por lo que se dice que la variación que experimentan ambas variables es independiente una de la otra.
- Coeficiente de correlación: Se observa que fue de 0.00337, es decir, muy cercano a cero, por lo que se dice que ante cambios de una de las variables, la otra no va a reaccionar a éstos (Levine, Krehbiel, Berenson, 2006).
Las gráficas se pueden observar en el código denominado Tarea_3_B42016.
- Berenson, M., Levine, D. y Krehbiel, T. (2006). Estadística para administración. Pearson Educación.