Plan du cours
Introduction à la plateforme Stratio
- Aperçu de l'architecture et des modules principaux de Stratio
- Rôle de Rocket et Intelligence dans le cycle de vie des données
- Connexion et navigation dans l'interface utilisateur de Stratio
Travailler avec le module Rocket
- Ingestion de données et création de pipelines
- Connexion des sources de données et configuration des transformations
- Utilisation de PySpark pour les tâches de prétraitement dans Rocket
Essentiels de PySpark pour les utilisateurs de Stratio
- Structures de données et opérations en PySpark
- Constructions de boucles : utilisation de for, while, if/else
- Écriture de fonctions personnalisées avec def et leur application
Utilisation avancée de Rocket avec PySpark
- Ingestion et transformations en streaming
- Utilisation de boucles et de fonctions dans des scénarios batch et temps réel
- Bonnes pratiques pour l'optimisation des performances dans les pipelines PySpark
Exploration du module Intelligence
- Aperçu des fonctionnalités de modélisation et d'analyse des données
- Sélection, transformation et exploration des caractéristiques
- Rôle de PySpark dans l'analyse personnalisée et les insights
Construction de flux de travail d'analyse avancés
- Création de fonctions définies par l'utilisateur (UDFs) dans Intelligence
- Application des conditionnels et boucles pour la logique de données
- Cas d'utilisation : segmentation, agrégation et prédiction
Déploiement et collaboration
- Sauvegarde, exportation et réutilisation des flux de travail
- Collaboration avec d'autres membres de l'équipe sur Stratio
- Revue des résultats et intégration avec les outils downstream
Résumé et prochaines étapes
Pré requis
- Expérience en programmation Python
- Compréhension des concepts d'analyse de données ou de traitement du big data
- Connaissances de base d'Apache Spark et du calcul distribué
Audience
- Ingénieurs des données travaillant sur des plateformes basées sur Stratio
- Analystes ou développeurs utilisant les modules Rocket et Intelligence
- Équipes techniques en transition vers des flux de travail PySpark au sein de Stratio
Nos clients témoignent (3)
Faire de l'exercice
Joe Pang - Lands Department, Hong Kong
Formation - QGIS for Geographic Information System
Traduction automatique
Des exemples pratiques nous ont permis de ressentir concrètement le fonctionnement du programme. De bonnes explications et une intégration efficace des concepts théoriques et de leur rapport aux applications pratiques.
Ian - Archeoworks Inc.
Formation - ArcGIS Fundamentals
Traduction automatique
J'ai hâte de suivre à nouveau une formation avec Any, il était vraiment excellent. Je ne suis qu'un spécialiste des SIG, mais Any a rendu tout très clair pour moi, il expliquait les processus complexes en termes simples. Continuez comme ça, merci.
Lwazi Qhingana - South African National Roads Agency (SANRAL) SOC Ltd
Formation - Python for Geographic Information System (GIS)
Traduction automatique