Formation Apache Airflow : Automatisation et orchestration de flux de données

icon public

Public : Développeurs, DevOps, Administrateurs système ou toute personne souhaitant automatiser des workflows

icon horloge

Durée : 2 jour(s)

Syllabus de la formation Apache Airflow : Automatisation et orchestration de flux de données

Pré-requis : Notions de base en Python - Maitrise des concepts de workflows et pipelines de données

Objectifs : Comprendre et configurer les workflows avec Apache Airflow - Créer, optimiser et superviser des DAGs complexes - Intégrer Airflow dans un environnement de production sécurisé - Utiliser les meilleures pratiques pour garantir des workflows robustes et maintenables

Sanction : Attestation de fin de formation mentionnant le résultat des acquis

Taux de retour à l’emploi : Aucune donnée disponible

Référence : OUT102361-F

Accessibilité : Si vous êtes en situation de handicap, nous sommes en mesure de vous accueillir, n'hésitez pas à nous contacter à referenthandicap@dawan.fr, nous étudierons ensemble vos besoins

Contact : commercial@dawan.fr

À partir de

1 250,00 € HT / jour

1 420,00 €HT

1 785,71 € HT

Pour 10 heures utilisables pendant 12 mois

1 775,00 € HT

Tarif plein:

  • Paiement à 60 jours
  • Report possible à J-3
  • 3 tickets d'assistance
Contacter Dawan
Conteneurs et Orchestrateurs

Programme de Formation Apache Airflow : Automatisation et orchestration de flux de données

Introduction à Apache Airflow

Historique et rôle d'Apache Airflow dans l'orchestration de workflows
Comparaison avec d’autres orchestrateurs : Apache NiFi, Luigi, etc.
Cas d’utilisation courants (ETL, automatisation des processus, etc.)

Architecture d’Airflow

Composants principaux : Scheduler, Webserver, Metadata Database, Worker
Flux de travail interne (DAGs et Tasks)
Installation et configuration de base (Airflow CLI et configuration initiale)

DAGs : Directed Acyclic Graphs

Structure d’un DAG : définition et configuration
Comprendre les opérateurs : BashOperator, PythonOperator, DummyOperator
Programmation d’un premier DAG simple

Exécution des tâches et dépendances

Gestion des dépendances entre tâches
Définition de schémas d’exécution (sequential, parallel, etc.)
Gestion du scheduling avec cron et intervalles de temps (TimeDelta, catchup, etc.)

Monitoring et interface web d’Airflow

Exploration des fonctionnalités clés : Gantt chart, log des tâches, exécution manuelle
Résolution des erreurs et gestion des retards

Atelier Pratique : Création d’un DAG avec des opérateurs multiples

Personnalisation et opérateurs avancés

Développement d’opérateurs personnalisés (PythonOperator avancé)
Utilisation d’opérateurs préconstruits : BranchPythonOperator, SubDagOperator
Introduction aux Sensors pour surveiller des événements (FileSensor, ExternalTaskSensor)

XComs et communication entre tâches

Transfert de données entre tâches via XComs
Meilleures pratiques pour limiter les erreurs

Extensions et intégrations

Connexions avec des bases de données (Postgres, MySQL, etc.)
Intégration avec des outils cloud (AWS, GCP, Azure)

Airflow en production

Configuration avancée : pools, SLA et gestion des priorités
Mise en place de la haute disponibilité
Stratégies de monitoring et alertes

Bonnes pratiques de développement et de gestion des workflows

Structuration des DAGs pour la maintenabilité
Debugging et optimisation des workflows
Gestion des versions et migration

Ateliers pratiques :

  • Mise en œuvre d’un projet complet : orchestration d’un pipeline multi-étapes
  • Optimisation d’un workflow existant

  • Un support et les exercices du cours pour chaque stagiaire
  • Un formateur expert ayant suivi une formation à la pédagogie
  • Boissons offertes pendant les pauses en inter-entreprises
  • Salles lumineuses et locaux facilement accessibles
  • Méthodologie basée sur l'Active Learning : 75% de pratique minimum
  • Matériel pour les formations présentielles informatiques : un PC par participant
  • Positionnement à l'entrée et à la sortie de la formation
  • Certification CPF quand formation éligible

Suite de parcours et formations associées

Pour suivre une session à distance depuis l'un de nos centres, contactez-nous.

Aucune date de programmée actuellement. Pour plus d'information sur les prochaines sessions, nous vous invitons à joindre le service commercial par téléphone au 02/318.50.01 (prix d'un appel local) ou depuis notre formulaire de contact.

Nos centres de formation

  • Bruxelles

    Rue de la Loi, 23

    1040 Bruxelles

  • Distance

    32 Boulevard Vincent Gâche

    44000 Nantes

  • Luxembourg

    5 Rue Goethe

    L-1637 Luxembourg