Contents Menu Expand Light mode Dark mode Auto light/dark mode
Python HOWTOs

Feb 5, 2024

Python HOWTOs

Feb 5, 2024

  • Ingestion de Datos
    • Importación de texto en Python
    • Importación de archivos numéricos usando NumPy
    • Importación de archivos CSV
    • Importación de archivos usando Pandas
    • Importación de archivos JSON
    • Importación de archivos XML
    • Conversión de formatos usando Pandas
  • Uso de Jupyter Lab
    • Uso de básico de Google Colaboratory
    • Creación y ejecución de programas de Python
    • Uso de %%bash y %%writefile
    • Lenguaje Markdown
    • HTML para notebooks
  • Manipulación de datos
    • Operaciones básicas sobre archivos de datos usando Python — 20:33 min
    • Procesamiento básico de datos usando Python — 12:22 min
    • Introducción a NumPy — 14:24 min
  • Limpieza de Datos
    • Transformación de strings a número entero o flotante
    • Transformación de valores enteros a categoría
    • Verificación de rangos numéricos
    • Verificación de rangos de fecha
    • Categorías inconsistentes
    • Consistencia en strings para casos simples
    • Consistencia en strings para casos complejos
    • Rangos numéricos a categorías
    • Reemplazo de strings por categorías
    • Registros duplicados
    • Errores de formato en cadenas de texto
    • Corrección de cadenas de texto
    • Formato de Fechas
    • Organización del código
  • Escritura de código limpio
    • Asignación de nombres
    • Escritura de funciones
    • Estilo
    • Principio de resposabilidad única
    • Principio de abierto-cerrado
    • Principio de sustitución de Likosov
    • Principio de sustitución de la interfase
    • Principio de inversión de dependencias
    • Organización del proyecto
  • Manejo de archivos de configuración
    • Archivos .py
    • Archivos .ini
    • Archivos .json
    • Archivos .yaml o .yml
    • Archivos .xml
    • Librería configparser (lenguaje de configuración básico)
  • Tests de datos con DataTest
    • Introducción a DataTest
    • Testing Automático
    • Pipeline Validation
    • Validación de objetos de Pandas
  • Generación de datos de prueba con Faker
    • Generación de datos con Faker
    • Base Provider
  • Tests de código con pytest
    • pytest
  • Orquestación de procesos con Luigi
    • Tareas secuenciales
    • Tareas en paralelo
    • Pipeline con muchas tareas (WrapperTask)
    • Parametrización (1)
    • Parametrización (2)
    • Command Line
    • Configuration files
    • Configuration files (revisar)
  • Jinja2
    • Creación de una página en HTML con hipervínculos
    • Elementos en una página HTML
    • Formato de una página web usando CSS
    • Reporte básico en HTML
    • Creación de un dashboard en HTML usando Jinja2 (Python)
    • Insersión directa de gráficas en HTML usando Jinja2
  • Flask
    • Creación de un dashboard interactivo usando Flask
    • Desarrollo de una APP para clasificar las flores IRIS usando SDG — 43:33 min
  • Docker
  • Datos Masivos
    • Procesamiento de datos en paralelo con map()
    • Conteo de palabras con map() y Counter()
    • Conteo de palabras
    • Operaciones de acumulación con reduce()
    • Conteo de palabras con map() y reduce()
    • Aceleracion de map()
    • Aceleracion de reduce()
Back to top

Orquestación de procesos con Luigi#

  • Tareas secuenciales
  • Tareas en paralelo
  • Pipeline con muchas tareas (WrapperTask)
  • Parametrización (1)
  • Parametrización (2)
  • Command Line
  • Configuration files
  • Configuration files (revisar)
Next
Tareas secuenciales
Previous
pytest
Made with Sphinx and @pradyunsg's Furo