Adrianistán

El blog de Adrián Arroyo


Crónica Neuronal: matrices de expresión genética para leucemia

Bienvenidos a un nuevo episodio de la serie Crónica Neuronal. Hoy vamos a tocar un problema del campo de la bioinformática. En concreto, vamos a usar matrices de expresión genética para identificar si un paciente de leucemia la tiene de tipo ALL o de tipo AML. Ambas leucemias tienen síntomas muy parecidos y es interesante poder encontrar un modelo de aprendizaje automático que pueda distinguirlas.

Seguir leyendo

Tu código va a morir

Memento mori. En la Antigua Roma, cuando un general venía victorioso de una campaña, se le organizaba un desfile por las calles de Roma. Lanzaban vítores y proclamas en su honor. No obstante, al lado de él había un siervo, que le iba repitiendo constantemente las limitaciones de la naturaleza humana, con el fin de impedir que incurriese en la soberbia y pretendiese, a la manera de un dios omnipotente, usar su poder ignorando las limitaciones impuestas por la ley y la costumbre. (Wikipedia). Esto se resume en un aforismo, Memento Mori, "Recuerda que vas a morir". Este chorro de realidad nos devuelve a la humildad, y a la vez, si uno lo piensa, nos deja entrever que los problemas de ahora no son tan importantes como muchas veces creemos que son.

Seguir leyendo

Terraform, infraestructura como código declarativo

Como alguno de los lectores ya sabrá, he empezado a trabajar este verano en Telefónica como becario. El proyecto donde estoy es 100% cloud y para ello usamos muchas herramientas. Hoy os vengo a hablar de Terraform, una herramienta que nos permite declarar la infraestructura como código y de forma declarativa.

Seguir leyendo

Podcast sobre Docker

Acaba de salir el segundo episodio del podcast Undefined. Se trata de un podcast donde algunos conocidos hablamos de temas de informática. En este episodio, dedicado a Docker, soy uno de los colaboradores así que: ¡a escucharlo todos!

Seguir leyendo

Re: Rust no es un buen reemplazo de C

Como muchos ya sabéis, podéis contactar conmigo de muchas formas. De entre ellas, Lector anónimo eligió el correo para enviarme esta pregunta:

Seguir leyendo

jq, el sed del siglo XXI

Que levante la mano quién no ha oído hablar de sed. Una herramienta presente en cualquier sistema UNIX, se trata de un editor de texto en modo streaming. Aunque sed es una herramienta muy potente, con un lenguaje de programación propio que es Turing completo, la mayor cantidad de usos son sustituir o extraer datos usando expresiones regulares y los comandos sp de sed. jq es sed para el siglo XXI porque trabaja de forma nativa con JSON, es decir, trabaja con objetos, no con texto plano.

Seguir leyendo

Videojuegos de ordenador para el verano

En este blog no he hablado mucho sobre videojuegos. Me gustan mucho, pero últimamente no juego tanto como antaño. Eso sí, cuando juego, suelo estar bastante tiempo. En la época de verano sin embargo, encuentro más tiempo para jugar. Hasta hace bastante tiempo no tenía un tipo de PC acorde a las exigencias de los juegos actuales. Hace unos años me construí un PC que ya me permitía jugar a bastantes triple A.

Seguir leyendo

Crónica Neuronal: Indian Liver Patients Record

Otro día de verano y otro día de Crónica Neuronal. Hoy he elegido un dataset médico, se trata de Indian Liver Patients Record, o lo que es lo mismo, Registro de pacientes de hígado en la India. Las enfermedades relacionadas con el hígado han ido en aumento en los últimos años: el alcohol, la polución, la comida en mal estado, las drogas y los pepinillos son algunas de las causas de este aumento. En el dataset, originalmente de UCI y bajo licencia Creative Commons Zero, tenemos datos médicos de varias personas y si deben recibir tratamiento para el hígado o no. El objetivo es identificar, dado un paciente nuevo, si debería iniciar un tratamiento del hígado o si por el contrario, está sano.

Seguir leyendo

Crónica Neuronal: House Prices

Bienvenidos a una sección del blog titulada Crónica Neuronal. En esta sección resolveremos problemas reales de Inteligencia Artificial de forma práctica. La estructura es la siguiente. Yo presento un problema, muchas veces sacado de Kaggle, SpainML u otro sitio y voy contando como lo voy resolviendo, escribiendo paso a paso mis pensamientos en cada momento. De hecho, yo no he resuelto estos problemas, sino que los voy resolviendo sobre la marcha mientras escribo la crónica. A los problemas les dedico un tiempo limitado y puede ser posible (como en este caso) que no llegue a resultados satisfactorios.

Seguir leyendo

Web Semántica desde cero: Linked Data y SOLID

Ya hemos visto tres componentes de la Web Semántica: RDF, RDF Schema y SPARQL. Sin embargo, todavía no hemos sido capaces de hiperconectar la información presente en diferentes servidores. La especificación Linked Data, nos da unas pautas a seguir sobre como usar HTTP para conseguir que todo esté hiperconectado. Además veremos el concepto de SOLID, que propuso Tim Berners-Lee para que la ciudadanía recuperase el poder sobre sus datos en la web.

Seguir leyendo