Plan du cours

Introduction à la plateforme Stratio

  • Aperçu de l'architecture et des modules principaux de Stratio
  • Rôle de Rocket et Intelligence dans le cycle de vie des données
  • Connexion et navigation dans l'interface utilisateur de Stratio

Travailler avec le module Rocket

  • Ingestion de données et création de pipelines
  • Connexion des sources de données et configuration des transformations
  • Utilisation de PySpark pour les tâches de prétraitement dans Rocket

Essentiels de PySpark pour les utilisateurs de Stratio

  • Structures de données et opérations en PySpark
  • Constructions de boucles : utilisation de for, while, if/else
  • Écriture de fonctions personnalisées avec def et leur application

Utilisation avancée de Rocket avec PySpark

  • Ingestion et transformations en streaming
  • Utilisation de boucles et de fonctions dans des scénarios batch et temps réel
  • Bonnes pratiques pour l'optimisation des performances dans les pipelines PySpark

Exploration du module Intelligence

  • Aperçu des fonctionnalités de modélisation et d'analyse des données
  • Sélection, transformation et exploration des caractéristiques
  • Rôle de PySpark dans l'analyse personnalisée et les insights

Construction de flux de travail d'analyse avancés

  • Création de fonctions définies par l'utilisateur (UDFs) dans Intelligence
  • Application des conditionnels et boucles pour la logique de données
  • Cas d'utilisation : segmentation, agrégation et prédiction

Déploiement et collaboration

  • Sauvegarde, exportation et réutilisation des flux de travail
  • Collaboration avec d'autres membres de l'équipe sur Stratio
  • Revue des résultats et intégration avec les outils downstream

Résumé et prochaines étapes

Pré requis

  • Expérience en programmation Python
  • Compréhension des concepts d'analyse de données ou de traitement du big data
  • Connaissances de base d'Apache Spark et du calcul distribué

Audience

  • Ingénieurs des données travaillant sur des plateformes basées sur Stratio
  • Analystes ou développeurs utilisant les modules Rocket et Intelligence
  • Équipes techniques en transition vers des flux de travail PySpark au sein de Stratio
 14 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (4)

Cours à venir

Catégories Similaires