Plan du cours

Introduction

  • Apache Arrow vs Parquet

Installation et configuration Apache Arrow

Vue d'ensemble des fonctionnalités et de l'architecture de Apache Arrow

Exploration des données avec Pandas et Apache Arrow

Explorer les données avec Spark et Apache Arrow

Explorer les données avec R et Apache Arrow

Explorer les données avec MapD et Apache Arrow

Autres Data Analysis intégrations

  • PySpark, fichiers Parquet sur S3, et Oracle tables et Elasticsearch indices

Résolution des problèmes

Résumé et conclusion

Pré requis

  • Une compréhension de base de SQL
  • Familiarité avec Python ou R
  • Une certaine familiarité avec Apache Spark
  14 heures
 

Nombre de participants


Début

Fin


Dates are subject to availability and take place between 09:30 and 16:30.
Les formations ouvertes requièrent plus de 3 participants.

Nos Clients témoignent (4)

Cours Similaires

QGIS for Geographic Information System

  21 heures

Catégories Similaires