Volver a Proyectos

Coffee Disease Detection

ml

Sistema de visión computacional para detectar enfermedades en plantas de café usando modelos de deep learning.

Machine Learning
Visión Computacional
Deep Learning
Agricultura
CNN
TensorFlow
FastAPI
Streamlit
Coffee Disease Detection

Resumen del Proyecto

Coffee Disease Detection es un sistema avanzado de visión computacional diseñado para identificar enfermedades en plantas de café a partir de imágenes de hojas. Originalmente presentado como una idea ganadora para el bootcamp de Data Science & AI de Le Wagon, este proyecto fue seleccionado como uno de los dos proyectos finales para ser desarrollado por un equipo de cuatro estudiantes.

Como líder del proyecto, coordiné el equipo de desarrollo y guié la creación de una solución integral que puede detectar cinco clases diferentes: hojas saludables y cuatro enfermedades comunes (Cercospora, Roya, Minador y Phoma) que impactan significativamente el rendimiento de cultivos de café.

Características Clave

🧠 Múltiples Arquitecturas de Modelo

  • VGG16 Transfer Learning - Rendimiento estable con medidas anti-overfitting
  • EfficientNetB0 - Optimizado para precisión y eficiencia
  • CNN Personalizado - Modelo ligero para datasets pequeños
  • Detección automática de arquitectura y carga de modelos

🎯 Optimización Enfocada en Enfermedades

  • Pesos de clase personalizados priorizando detección de enfermedades
  • Métricas de recall específicas para enfermedades para minimizar falsos negativos
  • Herramientas de análisis de falsos negativos para mejora del modelo
  • Entrenamiento balanceado con tasas de aprendizaje adaptativas

🚀 Despliegue Listo para Producción

  • Backend FastAPI con documentación integral de API
  • Aplicación web Streamlit para fácil carga de imágenes y predicción
  • Despliegue en Google Cloud con API Dockerizada para inferencia escalable
  • Integración MLflow para seguimiento de experimentos y versionado de modelos
  • Estructura de paquete Python modular para código base mantenible
  • Repositorio web separado disponible en https://github.com/fermx3/coffeedd-web para la aplicación Streamlit

Arquitectura Técnica

Pipeline de Entrenamiento de Modelos

  • Entrenamiento multi-fase con extracción inicial de características y fine-tuning
  • Callbacks personalizados para monitoreo de recall de enfermedades
  • Tasas de aprendizaje adaptativas basadas en tamaño de dataset
  • Evaluación comprensiva con matrices de confusión y métricas detalladas

Procesamiento de Datos

  • Aumento de datos inteligente preservando características de enfermedades
  • Preprocesamiento letterboxing a resolución 224x224
  • División automática train/validation/test
  • Análisis de distribución de clases y balanceo

API y Despliegue

  • API RESTful con endpoints de carga de imágenes y predicción
  • Soporte Base64 y carga de archivos para integración flexible
  • Manejo integral de errores y validación
  • Sistema de caché de producción para optimización de carga de modelos
  • Despliegue en Google Cloud Platform para inferencia escalable basada en la nube

Liderazgo de Proyecto y Coordinación de Equipo

Gestión de Equipo

  • Lideré un equipo de desarrollo de cuatro personas a través del ciclo completo del proyecto
  • Coordiné tareas y cronogramas asegurando entrega oportuna de hitos
  • Apliqué mejores prácticas de ingeniería de software incluyendo control de versiones y documentación
  • Mantuve repositorio integral de GitHub con estructura clara y documentación técnica

Logro en Bootcamp Le Wagon

  • Selección de proyecto ganador entre múltiples ideas propuestas en el bootcamp de Data Science & AI de Le Wagon
  • Uno de dos proyectos finales elegidos para desarrollo por la clase
  • Entrega de proyecto de extremo a extremo desde concepto inicial hasta despliegue en producción

Clasificación de Enfermedades

El sistema detecta estas condiciones de plantas de café:

  1. Saludable - Hojas de café normales, libres de enfermedad
  2. Cercospora - Enfermedad fúngica causando manchas marrones en hojas
  3. Roya - Pústulas naranjas/amarillas en el envés de las hojas
  4. Minador - Daño de insecto creando túneles en las hojas
  5. Phoma - Enfermedad fúngica causando tizón de hojas

Destacados Técnicos

Pesos de Clase Inteligentes

Sistema de pesos personalizado que penaliza la mala clasificación saludable mientras potencia la detección de enfermedades raras:

  • Hojas saludables: Peso reducido para prevenir falsos negativos
  • Enfermedades raras: Peso aumentado para mejor detección
  • Pesos adaptativos: Basados en tamaño y distribución del dataset

Métricas Avanzadas

  • Métrica de Recall de Enfermedades: Métrica personalizada de TensorFlow enfocada en detección de enfermedades
  • Análisis de clasificación binaria: Rendimiento saludable vs. cualquier enfermedad
  • Matrices de confusión detalladas con insights específicos por clase
  • Análisis de falsos negativos para mejora continua

Gestión de Modelos

  • Seguimiento MLflow para gestión de experimentos
  • Registro automático de modelos con versionado
  • Despliegue de modelo de producción con capacidad de pruebas A/B
  • Detección de arquitectura de modelo para carga sin problemas

Impacto y Aplicaciones

  • Detección temprana de enfermedades habilitando tratamiento oportuno
  • Pérdidas reducidas de cultivos a través de identificación precisa
  • Accesibilidad para agricultores vía interfaz web simple
  • Despliegue escalable para organizaciones agrícolas
  • Fundación de investigación para desarrollo de IA agrícola

El sistema representa un avance significativo en agricultura de precisión, proporcionando a los caficultores herramientas impulsadas por IA para proteger sus cultivos y optimizar rendimientos a través de la detección temprana de enfermedades.

Detalles del Proyecto

Objetivo

Construir un sistema preciso y confiable para ayudar a los caficultores a identificar enfermedades de plantas tempranamente, permitiendo tratamiento oportuno y protección de cultivos.

Tema

IA aplicada a agricultura de precisión y detección temprana de enfermedades.

Fecha

15 de noviembre de 2025

Categoría

ml

Tecnologías

Machine Learning
Visión Computacional
Deep Learning
Agricultura
CNN
TensorFlow
FastAPI
Streamlit