Adrianistán

El blog de Adrián Arroyo


Artículos con etiqueta «estadistica»

Estadísticas y felicitaciones de 2020

Este año ha sido peculiar en muchos aspectos. No me voy a enrollar mucho en lo que todo el mundo ya sabe, pero a nivel personal ha sido un año de cambios. Acabé la universidad y entré a trabajar en Telefónica. También estuve sustituyendo una baja por enfermedad en la universidad. Además pude centrarme en algunos proyectos para "acabarlos", todo un logro.

Seguir leyendo

¡Feliz año 2020!

Si tomas los cuatro números primos consecutivos empezando con 17, los elevas al cuadrado y los sumas, ¿qué te da?

Seguir leyendo

Ley de Zipf en el blog

Estaba yo leyendo uno de mis blogs favoritos, Los días y las frases, que pese a lo que se pueda pensar de mí, no trata, ni remotamente de tecnología, programación, etc sino de aforismos e historia. Muy entretenido, siempre leo sus artículos nada más salir. Hace unos meses ya, el autor publicó una entrada sobre la ley de Zipf. Como él lo explica mejor que nadie, voy a copiar literalmente el texto:

Seguir leyendo

Feliz Navidad 2018

Seguir leyendo

Las mejores librerías gratuitas para gráficas en PHP

"Los datos son el nuevo petróleo" es algo que dicen muchas personas y que parece confirmarse si se leen noticias tecnológicas. Y en efecto, actualmente podemos generar una cantidad de datos inmensa de los que podemos extraer una información muy valiosa. Y ahí esta la clave, en "extraer". Los datos como tal no sirven para nada. Al igual que el petróleo, no lo queremos en bruto, sino refinado, tratado. Con los datos pasa lo mismo. Para representar esta información desde hace muchos años estadística ha ido diseñando métodos para representar datos y extraer información de ellos.
Seguir leyendo

Cheatsheet de Pandas

He encontrado esta cheatsheet en formato PDF de cómo manejar Pandas, la cuál es muy interesante y que os dejo aquí.Pandas_Cheat_Sheet Agradecimientos a Irv Lusting que se ha tomado la molestia de hacerla
Seguir leyendo

Estadística en Python: ajustar datos a una distribución (parte VII)

Ya hemos visto con anterioridad que existen modelos que nos hacen la vida más sencilla. Sin embargo, en esos modelos conocíamos ciertos datos de antemano. ¿Qué pasa si tenemos datos y queremos ver si podemos estar ante un modelo de los ya definidos? Este tipo de ajuste es muy interesante, ya que nos permite saber si los datos en bruto pueden parecerse a los modelos de Normal u otros y aprovecharlo
Seguir leyendo

Estadísticas del blog, versión 2017

Antes de acabar el año, es momento de hacer un repaso a las estadísticas del blog. Sé que el año no ha acabado, pero no creo que vaya a haber muchos cambios hasta que sean las campanadas
Seguir leyendo

Estadística en Python: distribución binomial, normal y de Poisson (Parte VI)

Después del rollo del capítulo anterior, vamos a entrar en algo más práctico, modelos de probabilidad. Hemos hablado de las funciones de probabilidad y de densidad, sin embargo, nos falta algo muy importante. ¿Cuáles son esas funciones exactamente? Es donde entran los modelos de probabilidad, modelos estadísticos que se pueden ajustar a una variable aleatoria con mejor o peor precisión y que nos dan los valores de la probabilidad. Empecemos, pero antes hagamos un apunte sobre las equivalencias en SciPy:
  • cdf(x) - Función de distribución F(X)
  • sf(x) = 1 - cdf(x)
  • pmf(x) - Función de probabilidad f(x) (distribuciones discretas)
  • pdf(x) - Función de densidad f(x) (distribuciones continuas)
  • ppf(x) - Función inversa a cdf(x). Nos permite obtener el valor correspondiente a una probabilidad.

Distribución Binomial

Un ensayo de Bernouilli se define como un experimento donde puede darse un éxito o fracaso y donde cada ensayo es independiente del anterior. Por ejemplo, un ensayo de Bernoulli de parámetro 0.5 sería lanzar una moneda a cara o cruz (mitad de posibilidades de cara, mitad de posibilidades de cruz)
Seguir leyendo

Estadística en Python: cálculo de probabilidades (Parte V)

Ahora entramos en una de mis partes favoritas de la estadística, el cálculo de probabilidades, sin embargo va a ser muy teórico, sin apenas Python. En primer lugar vamos a definir algunos conceptos:
  • Experimento cualquier proceso de obtención de una observación o medida en el que se suponen fijos ciertos factores. Los experimentos puede ser deterministas si solo es posible un resultado (aunque sea desconocido) y aleatorios. Llamamos azar a los factores que no controlamos de un experimento aleatorio.
  • Probabilidad: la incertidumbre de observar un determinado resultado antes de que se realice el experimento.
  • Suceso: el resultado o conjunto de resultados de un experimento aleatorio
  • Espacio muestral: el conjunto de todos los resultados posibles de un experimento aleatorio
  • Suceso complementario de A: lo que ocurre cuando no ocurre A
  • Suceso seguro: Aquel que ocurre siempre. Se representa con Ω
  • Suceso imposible: Aquel que no forma parte del espacio muestral
  • Sucesos incompatibles: Aquellos que no pueden ocurrir de forma simultánea
El cálculo de probabilidades nos sirve para valorar el riesgo de nuestras decisiones, anticipar eventos y valorar si nuestras hipótesis eran razonables
Seguir leyendo