Blog de Inteligencia Artificial y Ciencia de Datos

Artículos del mundo de datos, para hacer los análisis más fáciles 🎸💻

El mundo NLP en el último tiempo - #TeLoResumoAsiNomas

Hola! Resumen: En los últimos 4 años el mundo del NLP ha avanzado pasos exponenciales, una suerte de Ley de Moore pero en NLP. Los grandes quiebres quizás dados por el aumento del poder de computo, y por el surgimiento de los mecanismos de atención. En este post se mencionan muy brevemente...

LEER MÁS

Deep Learning y feature extraction: No es "tan" automático

Como este post recibió mas de 15k visitas en linkedin, lo hago permanente para que no se pierda en el tiempo. Vistosa la imagen, pero -a mi criterio- habría que aclarar las excepciones 🤓. 💡El feature extraction es encontrar nuevas variables que aporten información. En #deeplearning esto es...

LEER MÁS

Tutorial de instalación de R y RStudio (2020)

Este tutorial tiene como propósito hacer el set-up inicial para empezar a desarrollar modelos machine learning en el increíble lenguaje R. Empecemos! ⚠️Si ya tienen R, pero es una versión anterior a la 3.6, instalen la última para evitar problemas. relacionado con este punto, escribí un...

LEER MÁS

Consejos para migrar R y sobrevivir en el tiempo

Este post está basado en hechos reales. Varias veces cuando instalé la última versión de R, y prosegui a instalar todos los paquetes que tenía en la versión anterior, me he encontrado problemas. También aplica cuando actualizamos paquetes después de un tiempo. Decidí hacer este post luego de...

LEER MÁS

Hace la dieta que se viene, comete un fractal!

Muchos sabrán lo que es un fractal, o mejor dicho como apareció en su versión original, sin tanto photoshop, normalmente: Para el que no sabe, hay dos maneras en la que puedo presentarlo, una para darles miedo: Donde Z y C son números complejos, y el colorido del gráfico se basa en ver...

LEER MÁS

Análisis Exploratorio de Datos con R (introducción)

Resumen: El análisis exploratorio de datos (AED) es el primer paso en un proyecto de datos. Crearemos un template de código para hacerlo con solo una función. Introducción El AED consiste en un análisis univariado (1-variable) y bivariado (2-variables). En este artículo revisaremos algunas...

LEER MÁS

Entonces, ¿Cuál es la diferencia entre: Ciencia de Datos, Machine Learning, IA, Deep Learning y... Big Data? 🤯

Muchos artículos que hablan sus diferencias, cuando me preguntan suelo dar las que a mí me parecen las más apropiadas. Algunas diferencias son difusas. Por empezar, hará cuestión de 10 años, lo que hoy se conoce como Ciencia de Datos, se llamaba Data Mining. Hoy día en las noticias, se suele...

LEER MÁS

Jugando con las dimensiones: desde Clustering, PCA, t-SNE.... ¡hasta Carl Sagan!

Jugando con las dimensiones ¡Hola! Este post es un experimento que combina el resultado de t-SNE con dos técnicas de clustering bien conocidas: k-means y hierarchical. Esta será la sección práctica, en R. Pero también, este post explorará el punto de intersección de conceptos como reducción de...

LEER MÁS