Segmentación Semántica con U-Net & DeepLab: Cartografía IGAC
Pipeline completo de deep learning para segmentar cartografía básica oficial del IGAC. Entrena U-Net, DeepLab y más sobre 3 municipios colombianos con metodología reproducible.
Descripción
Proyecto end-to-end de segmentación semántica aplicado a cartografía básica oficial del IGAC (Instituto Geográfico Agustín Codazzi) de Colombia. Entrena modelos estado del arte (U-Net, DeepLab, SegFormer) sobre datos de 3 municipios: Madrid, Mosquera y Fusagasugá. Segmenta 6 clases cartográficas: agua, vegetación, caminos, vías, construcciones y áreas comunes. Incluye etiquetado, entrenamiento, postprocesamiento, validación métrica y metodología completa documentada. Ideal para aprender deep learning geoespacial con datos reales y oficiales de LATAM.
Características
- 🗺️ Datos Oficiales IGAC: cartografía básica de 3 municipios colombianos (Madrid, Mosquera, Fusagasugá)
- 🏷️ 6 Clases Cartográficas: agua, vegetación, caminos, vías, construcciones, áreas comunes
- 🏗️ Arquitecturas Estado del Arte: U-Net, DeepLab v3+, SegFormer, y más comparativas
- 📊 Pipeline Completo: etiquetado → entrenamiento → postprocesamiento → validación
- 🧪 Metodología Reproducible: documentación paso a paso para replicar en otros municipios/países
- 📈 Métricas Rigurosas: IoU, F1-Score, Precision/Recall por clase y global
- 🔧 Postprocesamiento Geoespacial: filtros morfológicos, CRF, simplificación de polígonos
- ✅ Validación Cruzada: evaluación en municipios no vistos durante entrenamiento
- 💾 Exportación GIS: predicciones a GeoJSON, Shapefile, GeoTIFF para uso en SIG
- 📚 Notebooks Educativos: tutorial completo para aprender segmentación semántica aplicada
Stack Tecnológico
Desafíos
- • 🏷️ Etiquetado Preciso: etiquetar 6 clases en cartografía de 3 municipios requiere criterio experto
- • ⚖️ Desbalance de Clases: agua y construcciones abundan, caminos/áreas comunes son minoritarias
- • 🔍 Bordes Precisos: límites entre vías/caminos y construcciones/vegetación son difusos
- • 🌍 Generalización: modelo entrenado en Madrid debe funcionar en Mosquera y Fusagasugá
- • 💾 Manejo de Memoria: imágenes de alta resolución (ortofoto IGAC) requieren estrategias de patches
- • 🧹 Postprocesamiento: ruido en predicciones necesita filtros morfológicos sin perder detalle
Lecciones Aprendidas
- • 🗺️ Uso de Datos Oficiales LATAM: IGAC como fuente confiable y reproducible para proyectos GeoAI
- • 🏗️ Comparativa de Arquitecturas: U-Net vs DeepLab v3+ vs SegFormer en cartografía
- • 🔧 Pipeline MLOps Geoespacial: desde raw data hasta GeoJSON exportable a QGIS
- • 📊 Evaluación Multi-Métrica: IoU, F1, Precision/Recall por clase para diagnóstico detallado
- • 🧪 Metodología Científica: documentar proceso para que otros repliquen en sus regiones
- • 🎓 Educación Práctica: aprender segmentación semántica con datos reales, no sintéticos
- • 🌎 Impacto Territorial: modelos útiles para actualización automática de cartografía básica
¿Te interesa colaborar en este proyecto?
Únete a la comunidad