

Clasificación de Texto con Naive Bayes en Python
En este post te explico qué es y cómo funciona y cómo puedes usar Naive Bayes en Python, incluyendo un ejemplo de clasificación de texto.
Ver Post.En este blog sobre Data Science encontrarás todo lo que necesitas para mejorar como Data Scientist: aprende a programar algoritmos de machine learning desde 0, automatizar y poner en producción scripts, usar frameworks de Redes Neuronales como Tensorflow... Todo usando tanto Python como R.
En este post te explico qué es y cómo funciona y cómo puedes usar Naive Bayes en Python, incluyendo un ejemplo de clasificación de texto.
Ver Post.En este post te explico qué es un algoritmo genético, cómo funciona y dferentes usos del algoritmo en Python.
Ver Post.En este post te explico, paso a paso, cómo puedes hacer MLOps en R con Docker, Google Cloud y Github Actions.
Ver Post.En este post te explico cómo montar un sistema de control de datos para MLOps con DVC de forma fácil, en Azure, AWS y GCP.
Ver Post.En este post aprenderás paso a paso qué es, cómo funciona y cómo y cuándo usar el algoritmo DBSCAN en Python.
Ver Post.En este post te explico qué es Github Actions, cómo funciona y cómo puedes usar Github Actions para Data Science.
Ver Post.En este tutorial te explico todo sobre MLflow, desde cómo instalarlo en una máquina virtual, como traquear modelos y ponerlos en producción.
Ver Post.Aprende a poner un modelo de Python en producción, usando Sklearn, FastAPI, Docker y tu servicio Cloud favorito.
Ver Post.En este tutorial de Sklearn aprenderás todo lo que necesitas para crear modelos de Machine Learning en Python.
Ver Post.En este post te explico cómo puedes poner tu app Shiny en producción usando Docker y diferentes servicios de Google Cloud.
Ver Post.Aprende Docker paso a paso: qué es, cómo crear un Dockerfile, verbose principales, lanzar la imagen... Todo con un ejemplo práctico en Python.
Ver Post.Aprender a hacer machine learning con R usando caret: preprocesamiento de datos, +230 modelos y mucho más en una única librería.
Ver Post.En este post te explico cómo puedes crear una API en Python. Para ello explico los dos de los principales frameworks: FastAPI y Flask.
Ver Post.Tutorial de dplyr en el que encontrarás explicadas y con ejemplos las funciones principales del paquete para que puedas manipular datos con R.
Ver Post.En este post te explico qué es Git, por qué debes usarlo como Data Scientist y cómo puedes vincular Git con RStudio en Windows y Mac.
Ver Post.En este post te explico cómo funciona el algoritmo kmeans en Python, sus problemas y cómo solucionarlos, programando el algoritmo desde cero.
Ver Post.En este post te explico cómo puedes crear animaciones en Python para crear unos gráficos mucho más impactantes como los barchart races.
Ver Post.En este post te explico todo sobre el algoritmo kNN: las medidas de distancia, cuándo usarlo, problemas que tiene y mucho más.
Ver Post.En este post programo una regresión logística en R desde 0 para que aprendas todo sobre este algoritmo de clasificación.
Ver Post.En este post te explico cómo puedes automatizar un script de Python en Windows y Mac para que puedas sacar el máximo provecho a tus scripts.
Ver Post.En este post programaré un árbol de decisión en Python, explicando todo sobre ello: su función de coste, cómo calcular splits... ¡Y más!
Ver Post.En este post te explico todo sobre la regresión lineal en R: desde cómo obtener los parámetros a cómo calcular su bondad y significatividad.
Ver Post.En este post te explico todo lo que necesitas para poder crear y entrenar redes neuronales densas y convolucionales con Torch en R.
Ver Post.En este post te explico paso a paso cómo programar una red de Neural Style Transfer en Python con Keras y Tensorflow.
Ver Post.En este post descubrirás los distintos sistemas de recomendación que existe, los programaremos desde 0 en R y aprenderás cuándo usarlos.
Ver Post.En este post explico paso a paso cómo puedes automatizar un script de Python en Google Cloud con Cloud Functions, Cloud Scheduler y Pub/Sub.
Ver Post.En este post aprenderás cómo poner tu modelo de R en producción, usando Plumber y Google Cloud, todo a paso a paso y con un ejemplo práctico.
Ver Post.En este post te enseño a cómo crear una Red Generativa Antagónica (GAN) en Python para poder crear imágenes ficticias mediante redes neuronales.
Ver Post.En este post te explico paso a paso cómo crear una máquina virtual con R instalado en Google Cloud.
Ver Post.En este post explico paso a paso cómo puedes crear animaciones en R con el paquete gganimate, así como trucos para que tus animaciones se vean perfect
Ver Post.Te explico cómo programar Kmeans desde 0 en R. Aprenderás todos sus detalles y particularidades, incluyendo cómo elegir el número de clústers.
Ver Post.En este post explico qué son las redes neuronales y detallo paso a paso cómo puedes programar una red neuronal desde 0 en Python.
Ver Post.En este post te explicaré paso a paso cómo automatizar un script R en Google Cloud con App Engine, Cloud Build y Cloud Scheduler.
Ver Post.¿Te imaginas usar Python y R indistintamente? En este post te explico el paquete reticulate al detalle, con el que aprenderás cómo usar Python en R.
Ver Post.En este post te explico qué es una red neuronal convolucional y como ejemplo creo un clasificador de imágenes de perros y gatos en Keras.
Ver Post.En este post te explico, paso a paso, cómo puedes automatizar scripts de R en Windows y Mac y todas las posibilidades que esto te ofrece.
Ver Post.En este post te explicaré paso a paso a cómo crear una red neuronal en R con Tensorflow y por qué esto es mejor que programarla desde 0.
Ver Post.En este post te voy a explicar cómo programar una red neuronal desde 0 en R. Crear clases S4 para neuronas, funciones de activación... ¡Todo!
Ver Post.En este post te explico paso a paso cómo programar con Python y R en el mismo Jupyter Notebook haciendo que ambos lenguajes se entiendan.
Ver Post.El Data Science es algo muy global. Mezcla la programación con la estadística para generar modelos y aplicarlos al mundo delnegocio.
Por eso, saber de Data Science no es solo saber estadística o saber programar, es mucho más. Un Data Scientist debe ser capaz de hacerse las preguntas de negocio adecuadas para detectar opciones de mejora dentro de una organización y mejorarlas mediante datos.
Es cierto que en empresas grandes esos objetivos ya vienen dados. Sin embargo, en empresas medianas que no cuentan con grandes equipos de Data Scientists, muchas veces una misma persona debe realizar todo el proceso, desde la extracción y procesamiento de los datos, el modelado y su puesta en producción.
Precisamente por lo anterior, yo mismo he tenido que aprender (y aprendo) muchas cosas que no aprendí durante el Máster en Big Data.
Y cuando tienes que aprender y buscas cómo hacer ciertas cosas es cuando te das cuenta de que, aunque se escriba mucho sobre Data Science… hay pocos blogs donde se hablan de problemas reales que los data scientists viven en el día a día y cómo solucionarlos.
Por eso decidí a crear este blog: para compartir lo que aprendo en mi trabajo y así poder enseñar a otros Data Scientist a los que les pueda resultar interesante.
Es por ello que en este blog sobre Data Science encontrarás todo lo que necesites para ser un buen Data Scientist, desde programar algoritmos desde cero para entender completamente cómo funcionan hasta cómo poner esos algoritmos en producción usando servicios Cloud, ya sea mediante API o automatizándolos.
Además, si tienes cualquier sugerencia siempre puedes escribirme para ver si te puedo ayudar. De hecho, uno de mis posts con mejor acogida, el de «Cómo poner un modelo de R en producción», ¡me lo sugirió un lector!
Si quieres aprender de Data Science seguro que mi blog te resulta interesante, pero no es el único. Por eso, en esta sencción te quiero compartir otros blogs de Data Science y recursos en los que seguramente encuentres mucho material interesante que, de hecho, yo también uso para aprender. Ahí van:
Si eres nuevo en el mundo de los datos y no sabes cómo o por dónde empezar, yo te recomendaría que primero de todo eligieras un lenguaje de programación.
Como podrás ver, mi lenguaje principal es R, pero también se de Python. Si tu duda es cuál de los dos elegir… yo te diría que si eres programador elijas Python y, sino, R.
Al fin y al cabo, lo importante del Data Science no es lenguaje que utilizas, sino tu capacidad de entender qué es lo quieres y qué tienes que hacer para conseguirlo.
De hecho, una vez aprendas un lenguaje, verás como aprender otro no es difícil. Simplemente deberás entender sus bases y buscar qué función hace lo que tú quieres.
Además, como puedes ver en mi blog escribo tanto de Python como de R. Vamos, que sea cual sea el lenguaje que elijas mi blog de data science te servirá igualmente!
En definitiva, espero que te gusten los posts y, como siempre, si tienes cualquier sugerencia, ¡no dudes en escribrme!