Plan du cours

Introduction

  • Vue d'ensemble de Databricks et Apache Spark
  • Comprendre l'architecture Databricks

Pour commencer

  • Mise en place de l'environnement
  • Mise en place et configuration de Databricks
  • Naviguer dans l'interface utilisateur Databricks
  • Créer un espace de travail Databricks

Travailler avec des données dans Databricks

  • Se connecter à une source de données Apache Spark
  • Comprendre les colonnes et les types de données de base
  • Gérer le système de fichiers dans les Notebooks

Gérer les tâches et les clusters

  • Créer et configurer des clusters
  • Créer des tâches à l'aide du Notebook
  • Exécuter des tâches
  • Visualisation des travaux et de leurs détails

Utilisation de Delta Lake dans Databricks

  • Charger des données dans Delta Lake
  • Gestion des données dans Delta Lake

Sécurisation Databricks

  • Gestion de la sécurité Databricks
  • Gestion de la sauvegarde et de la récupération

Résolution des problèmes

Résumé et prochaines étapes

Pré requis

  • Compréhension de base de l'analyse des données
  • Connaissance de Apache Spark

Audience

  • Ingénieurs en données
  • Scientifiques des données
  • Développeurs
 14 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires