Plan du cours

Introduction

  • Aperçu de Databricks et Apache Spark
  • Compréhension de l'architecture de Databricks

Démarrage

  • Configuration de l'environnement
  • Installation et configuration de Databricks
  • Navigation dans l'interface utilisateur de Databricks
  • Création d'un espace de travail Databricks

Travailler avec des données dans Databricks

  • Connexion à une source de données Apache Spark
  • Compréhension des colonnes et types de données de base
  • Gestion du système de fichiers dans les Notebooks

Gestion des tâches et clusters

  • Création et configuration des clusters
  • Création de tâches à l'aide de Notebook
  • Exécution des tâches
  • Affichage des tâches et détails des tâches

Utilisation de Delta Lake dans Databricks

  • Chargement de données dans Delta Lake
  • Gestion des données dans Delta Lake

Sécurisation de Databricks

  • Gestion de la sécurité de Databricks
  • Gestion des sauvegardes et récupérations

Dépannage

Résumé et étapes suivantes

Pré requis

  • Compréhension de base de l'analyse des données
  • Connaissance d'Apache Spark

Public visé

  • Data Engineers
  • Data Scientists
  • Développeurs
 14 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires