Plan du cours
Section 1 : Introduction au Big Data / Présentation du NoSQL NoSQL Théorème CAP Quand le NoSQL est-il approprié Écosystème de stockage en colonnes NoSQL
Section 2 : Cassandra Notions de base Conception et architecture
Cassandra nœuds, clusters, centres de donnéesEspaces de clés, tableaux, lignes et colonnesPartitionnement, réplication, jetonsNiveaux de quorum et de cohérenceLabs : interagir avec Cassandra en utilisant CQLSHSection 3 : Modélisation des données – partie 1 introduction au CQLTypes de données CQL
création d'espaces de clés et de tablesChoisir des colonnes et des typesChoisir les clés primairesDisposition des données pour les lignes et les colonnesTemps de vie (TTL)Interroger avec CQLMises à jour CQLCollections (liste / carte / ensemble)Travaux pratiques : divers exercices de modélisation de données utilisant CQL ; expérimenter des requêtes et des types de données pris en chargeSection 4 : Modélisation des données – partie 2 Création et utilisation d'index secondairesclés composites (clés de partition et clés de clustering)Données de séries chronologiques
Meilleures pratiques pour les données de séries chronologiquesCompteursTransactions légères (LWT)Travaux pratiques : création et utilisation d'index ; modélisation de données de séries chronologiquesSection 5 : Laboratoires de modélisation de données : session de conception de groupe, plusieurs cas d'utilisation de divers domaines sont présentésles étudiants travaillent en groupes pour proposer des designs et des modèlesdiscuter de diverses conceptions, analyser les décisionsLab : implémenter un des scénarios
Section 6 : Pilotes Cassandra Introduction au pilote JavaOpérations CRUD (Créer / Lire / Mettre à jour, Supprimer) à l'aide du client JavaRequêtes asynchronesTravaux pratiques : utilisation de l'API Java pour CassandraSection 7 : Cassandra Les composants internes comprennent Cassandra la conception sous le capot
sstables, memtables, journal de validationchemin de lecture / chemin d'écrituremise en cachenœuds virtuelsSection 8 : Sélection du matériel d'administration
Cassandra distributionInstallation CassandraExécution de benchmarksOutils de surveillance des performances et des activités des nœuds DataStax OpsCenterDiagnostic des problèmes de performances CassandraEnquête sur un crash de nœud
Comprendre la réparation, la suppression et la réplication des donnéesAutres outils et conseils de dépannageCassandra bonnes pratiques (compactage, garbage collection,)Section 9 : Bonus Lab (si le temps le permet) Implémenter un service de musique comme Pandora/Spotify sur Cassandra
Pré requis
- à l'aise avec le langage de programmation Java
- à l'aise dans l'environnement Linux (navigation en ligne de commande, édition de fichiers avec vi / nano)
Lab environment:
Un environnement de travail Cassandra sera fourni aux étudiants. Les étudiants auront besoin d'un client SSH et d'un navigateur pour accéder au cluster.
Zero Install : Il n'est pas nécessaire d'installer Cassandra sur les machines des étudiants !