Estadística en Python: cálculo de probabilidades (Parte V)
03/12/2017
Ahora entramos en una de mis partes favoritas de la estadística, el cálculo de probabilidades, sin embargo va a ser muy teórico, sin apenas Python. En primer lugar vamos a definir algunos conceptos:
El cálculo de probabilidades nos sirve para valorar el riesgo de nuestras decisiones, anticipar eventos y valorar si nuestras hipótesis eran razonables.
Para el cálculo de probabilidades vamos a seguir la axiomática de Kolmogoroff.
La ley fundamental de las probabilidades, define la probabilidad como la razón entre el número de casos favorables y el número de casos totales.
Esto es muy sencillo de utilizar y no voy a poner código Python. Para calcular tanto el número de casos favorables como el de casos totales es recomendable tener nociones de combinatoria, que resulta extremadamente útil en ese tipo de situaciones.
¿Qué ocurre si disponemos de información suplementaria? Formulado de otra forma, ¿qué pasa si queremos calcular la probabilidad de A sabiendo B ha ocurrido? ¿Daría el mismo resultado? La respuesta es que no, la probabilidad de A condicionada por B se define de la siguiente forma:
¿Cómo se calcula la probabilidad de la intersección de A y B?
Aquí nos damos cuenta que si A es independiente de B, la probabilidad de su intersección es simplemente el producto de Pr{A} y Pr{B}.
La generalización de lo anterior es el conocido teorema de Bayes. Podemos usarlo para resolver una gran cantidad de problemas.
En la provincia de Soria, el negocio de acceso a Internet se reparte entre dos operadores, Timofónica y Robafone y dos únicas marcas de routers, Xisco y Nuaweii. En Soria, la cuota de mercado de Timofónica es del 60% y de Robafone el resto. El 70% de los usuarios dispone de router Xisco y el 30% de ambas marcas. Además se sabe que la probabilidad de corte de acceso es 0.1 para usuarios de Timofónica, 0.15 para Robafone y 0.05 para routers Xisco.
¿Cuál es la probabilidad de que a un usuario se le corte el Internet?
Primero vamos a definir un diccionario pr con las probabilidades que nos da el enunciado. Tenemos varias probabilidades relacionadas con un usuario: operador, router, fallos condicionados, ...
Para calcular la probabilidad de corte de un usuario hay que sumar la probabilidad de ser usuario de una compañía y tener un corte y de ser de otra compañía y tener un corte.
En este caso Pr{Corte} = 0.12. La probabilidad de que un usuario cualquiera de Soria tenga un corte es del 12%.
Si se sabe que un usuario tiene la línea cortada, ¿cuál es la probabilidad de que tenga router Xisco en casa?
En este caso se pide Pr{Xisco|Corte}. Según el teorema de Bayes, esto es:
Que da una probabilidad de 0,29. Es decir, si el usuario tiene un corte, la probabilidad de que en su casa tenga un router Xisco es del 29%.
¿Cuál es la probabilidad de que se produzca un corte a un usuario que no tiene un router Xisco?
En este caso se pide Pr{Corte | Nuaweii}. Y tenemos un pequeño problema y es que no sabemos la probabilidad de que un usuario tenga en su casa Nuaweii. Con un poco de manipulación matemática podemos obtener una expresión que no depende de Pr{Nuaweii}.
Función de probabilidad: Una función que devuelve la probabilidad de ser obtenido un valor en un experimento aleatorio. La suma de las funciones de probabilidad de todos los valores que puede tomar la variable es 1.
Función de distribución F(x) Una función que devuelve la probabilidad de obtener un valor igual o menor al valor en un experimento aleatorio. Esta función lo que hace es ir acumulando.
Función de densidad f(x): Como en variables aleatorias continuas no tiene sentido hablar de función de probabilidad (siempre sería 0), se define la función de densidad, como la función que da la probabilidad de que una variable aleatoria esté entre A y B.
Como es lógico es posible pasar entre función de densidad y de distribución mediante integreación y derivación.
Esperanza matemática (μ) o media poblacional
Mediana: el X que da como resultado 0.5 en la función de densidad, F(X) = 0.5
Varianza:
[latex]
Var(X) = \sigma^2 = E((X-\mu)^2)
[/latex]
Y con esto dejamos este capítulo teórico pero necesario para el siguiente (que será muy útil).
- Experimento cualquier proceso de obtención de una observación o medida en el que se suponen fijos ciertos factores. Los experimentos puede ser deterministas si solo es posible un resultado (aunque sea desconocido) y aleatorios. Llamamos azar a los factores que no controlamos de un experimento aleatorio.
- Probabilidad: la incertidumbre de observar un determinado resultado antes de que se realice el experimento.
- Suceso: el resultado o conjunto de resultados de un experimento aleatorio
- Espacio muestral: el conjunto de todos los resultados posibles de un experimento aleatorio
- Suceso complementario de A: lo que ocurre cuando no ocurre A
- Suceso seguro: Aquel que ocurre siempre. Se representa con Ω
- Suceso imposible: Aquel que no forma parte del espacio muestral
- Sucesos incompatibles: Aquellos que no pueden ocurrir de forma simultánea
El cálculo de probabilidades nos sirve para valorar el riesgo de nuestras decisiones, anticipar eventos y valorar si nuestras hipótesis eran razonables.
Para el cálculo de probabilidades vamos a seguir la axiomática de Kolmogoroff.
Regla de Laplace
La ley fundamental de las probabilidades, define la probabilidad como la razón entre el número de casos favorables y el número de casos totales.
[latex]
Pr\{A\} = \frac{k}{n}
[/latex]
Esto es muy sencillo de utilizar y no voy a poner código Python. Para calcular tanto el número de casos favorables como el de casos totales es recomendable tener nociones de combinatoria, que resulta extremadamente útil en ese tipo de situaciones.
Probabilidad condicionada
¿Qué ocurre si disponemos de información suplementaria? Formulado de otra forma, ¿qué pasa si queremos calcular la probabilidad de A sabiendo B ha ocurrido? ¿Daría el mismo resultado? La respuesta es que no, la probabilidad de A condicionada por B se define de la siguiente forma:
[latex]
Pr\{A | B\} = \frac{Pr\{A \cap B \}}{Pr\{B\}}
[/latex]
¿Cómo se calcula la probabilidad de la intersección de A y B?
[latex]
Pr\{A \cap B\} = Pr\{A\}Pr\{B|A\}
[/latex]
Aquí nos damos cuenta que si A es independiente de B, la probabilidad de su intersección es simplemente el producto de Pr{A} y Pr{B}.
Teorema de Bayes
La generalización de lo anterior es el conocido teorema de Bayes. Podemos usarlo para resolver una gran cantidad de problemas.
En la provincia de Soria, el negocio de acceso a Internet se reparte entre dos operadores, Timofónica y Robafone y dos únicas marcas de routers, Xisco y Nuaweii. En Soria, la cuota de mercado de Timofónica es del 60% y de Robafone el resto. El 70% de los usuarios dispone de router Xisco y el 30% de ambas marcas. Además se sabe que la probabilidad de corte de acceso es 0.1 para usuarios de Timofónica, 0.15 para Robafone y 0.05 para routers Xisco.
¿Cuál es la probabilidad de que a un usuario se le corte el Internet?
Primero vamos a definir un diccionario pr con las probabilidades que nos da el enunciado. Tenemos varias probabilidades relacionadas con un usuario: operador, router, fallos condicionados, ...
pr = dict()
pr["Timofónica"] = 0.6
pr["Robafone"] = 0.4
pr["Xisco"] = 0.7
pr["Xisco Y Nuaweii"] = 0.3
pr["Corte | Timofónica"] = 0.1
pr["Corte | Robafone"] = 0.15
pr["Corte | Xisco"] = 0.05
Para calcular la probabilidad de corte de un usuario hay que sumar la probabilidad de ser usuario de una compañía y tener un corte y de ser de otra compañía y tener un corte.
pr["Corte"] = pr["Corte | Timofónica"]*pr["Timofónica"] + pr["Corte | Robafone"]*pr["Robafone"]
En este caso Pr{Corte} = 0.12. La probabilidad de que un usuario cualquiera de Soria tenga un corte es del 12%.
Si se sabe que un usuario tiene la línea cortada, ¿cuál es la probabilidad de que tenga router Xisco en casa?
En este caso se pide Pr{Xisco|Corte}. Según el teorema de Bayes, esto es:
[latex]
Pr\{Xisco|Corte\} = \frac{Pr\{Xisco \cap Corte\}}{Pr\{Corte\}} = \frac{Pr\{Xisco\}Pr\{Corte | Xisco\}}{Pr\{Corte\}}
[/latex]
pr["Xisco | Corte"] = pr["Xisco"]*pr["Corte | Xisco"]/pr["Corte"]
Que da una probabilidad de 0,29. Es decir, si el usuario tiene un corte, la probabilidad de que en su casa tenga un router Xisco es del 29%.
¿Cuál es la probabilidad de que se produzca un corte a un usuario que no tiene un router Xisco?
En este caso se pide Pr{Corte | Nuaweii}. Y tenemos un pequeño problema y es que no sabemos la probabilidad de que un usuario tenga en su casa Nuaweii. Con un poco de manipulación matemática podemos obtener una expresión que no depende de Pr{Nuaweii}.
[latex]
Pr\{Corte|Nuaweii\} = \frac{Pr\{Corte \cap Nuaweii\}}{Pr\{Nuaweii\}} \\ = \frac{Pr\{Corte \cap (\Omega-Xisco)\}}{1-Pr\{Xisco\}} = \frac{Pr\{Corte - Corte \cap Xisco\}}{1-Pr\{Xisco\}} \\ = \frac{Pr\{Corte\}-Pr\{Corte \cap Xisco\}}{1-Pr\{Xisco\}}
[/latex]
pr["Corte | Nuaweii"] = (pr["Corte"] - pr["Xisco"]*pr["Corte | Xisco"])/(1-pr["Xisco"])
Funciones asociadas
Función de probabilidad: Una función que devuelve la probabilidad de ser obtenido un valor en un experimento aleatorio. La suma de las funciones de probabilidad de todos los valores que puede tomar la variable es 1.
Función de distribución F(x) Una función que devuelve la probabilidad de obtener un valor igual o menor al valor en un experimento aleatorio. Esta función lo que hace es ir acumulando.
Función de densidad f(x): Como en variables aleatorias continuas no tiene sentido hablar de función de probabilidad (siempre sería 0), se define la función de densidad, como la función que da la probabilidad de que una variable aleatoria esté entre A y B.
Como es lógico es posible pasar entre función de densidad y de distribución mediante integreación y derivación.
Medidas asociadas
Esperanza matemática (μ) o media poblacional
[latex]
\mu = E(x) = \int_{-\inf}^{\inf} xf(x)dx
[/latex]
Mediana: el X que da como resultado 0.5 en la función de densidad, F(X) = 0.5
Varianza:
[latex]
Var(X) = \sigma^2 = E((X-\mu)^2)
[/latex]
Y con esto dejamos este capítulo teórico pero necesario para el siguiente (que será muy útil).