Plan du cours

Introduction

  • Vue d'ensemble de Databricks et Apache Spark
  • Comprendre l'architecture Databricks

Pour commencer

  • Mise en place de l'environnement
  • Mise en place et configuration de Databricks
  • Naviguer dans l'interface utilisateur Databricks
  • Créer un espace de travail Databricks

Travailler avec des données dans Databricks

  • Connexion à une source de données Apache Spark
  • Comprendre les bases des colonnes et des types de données
  • Gérer le système de fichiers dans les Notebooks

Gestion des emplois et des grappes

  • Créer et configurer des clusters
  • Création de tâches à l'aide du Notebook
  • Exécution des tâches
  • Affichage des travaux et de leurs détails

Utilisation du lac Delta dans Databricks

  • Chargement des données dans Delta Lake
  • Gestion des données dans Delta Lake

Sécurisation Databricks

  • Gestion de la sécurité Databricks
  • Gestion de la sauvegarde et de la restauration

Dépannage

Résumé et prochaines étapes

Pré requis

  • Compréhension de base de l'analyse des données
  • Connaissance de Apache Spark

Audience

  • Ingénieurs de données
  • Data Scientists
  • Développeurs
 14 heures

Nombre de participants



Prix par participant

Nos Clients témoignent (2)

Cours Similaires

Azure for Data Engineer

35 heures

Data Analysis for Marketers

14 heures

Catégories Similaires