Accueil
Formation Big Data
Formation Hadoop
Formation Administration de Hadoop avec MapR

Formation Administration de Hadoop avec MapR

(1 Nos clients témoignent)

Public cible :

Ce cours vise à démystifier la technologie Big Data/Hadoop et à montrer qu'elle n'est pas difficile à comprendre.

Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.

Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.

Plan du cours

Big Data Aperçu :

Qu'est-ce que Big Data
Pourquoi Big Data gagne en popularité
Études de cas sur Big Data
Caractéristiques de Big Data
Solutions pour travailler avec Big Data.

Hadoop et ses composants :

Qu'est-ce que Hadoop et quels sont ses composants.
Architecture de Hadoop et les caractéristiques des données qu'il peut traiter/processus.
Historique de Hadoop, entreprises qui l'utilisent et pourquoi elles ont commencé à l'utiliser.
Cadre de travail de Hadoop et ses composants - expliqué en détail.
Qu'est-ce que HDFS et comment lire-écrire dans le Système de fichiers distribué Hadoop.
Comment configurer un cluster Hadoop dans différents modes - indépendant/mode pseudo/déploiement en plusieurs nœuds.

(Cela comprend la configuration d'un cluster Hadoop sous VirtualBox/KVM/VMware, les configurations réseau qui doivent être soigneusement examinées, le démarrage des daemons Hadoop et le test du cluster).

Qu'est-ce que le cadre de travail MapReduce et comment il fonctionne.
Exécution d'emplois MapReduce sur un cluster Hadoop.
Comprendre la réplication, le miroirage et la sensibilité au rack dans le contexte des clusters Hadoop.

Planification de votre cluster Hadoop :

Comment planifier votre cluster Hadoop.
Comprendre le matériel et le logiciel pour planifier votre cluster Hadoop.
Comprendre les charges de travail et planifier le cluster pour éviter les échecs et optimiser sa performance.

Qu'est-ce que MapR et pourquoi MapR :

Aperçu de MapR et de son architecture.
Comprendre et utiliser le système de contrôle MapR, les volumes MapR, les instantanés et les miroirs.
Planification d'un cluster dans le contexte de MapR.
Comparaison de MapR avec d'autres distributions et Apache Hadoop.
Installation de MapR et déploiement du cluster.

Configuration et administration du cluster :

Gestion des services, des nœuds, des instantanés, des volumes miroirs et des clusters distants.
Comprendre et gérer les nœuds.
Compréhension des composants Hadoop, installation des composants Hadoop en parallèle avec les services MapR.
Gestion des données sur le cluster, y compris via NFS, gestion des services et des nœuds.
Gérer les données à l'aide de volumes, gérer les utilisateurs et les groupes, attribuer des rôles aux nœuds, commissionner/décommissionner des nœuds, administrer le cluster et surveiller sa performance, configurer/analyzer et surveiller les métriques pour la surveillance de la performance, configurer et administrer la sécurité MapR.
Comprendre et travailler avec M7 - stockage natif pour les tables MapR.
Configuration et optimisation du cluster pour une meilleure performance.

Mise à niveau du cluster et intégration avec d'autres configurations :

Mise à jour de la version logicielle de MapR et types de mise à niveau.
Configuration du cluster Mapr pour accéder au cluster HDFS.
Configuration d'un cluster MapR sur Amazon Elastic Mapreduce.

Tous les sujets mentionnés ci-dessus incluent des démonstrations et des sessions pratiques pour que les apprenants puissent avoir une expérience pratique de la technologie.

Pré requis

Connaissances de base en Linux FS
Connaissances de base en Java
Connaissance d'Apache Hadoop (recommandé)

28 Heures

Nombre de participants

En ligne

Salle de Classe

Choisir le lieu

Veuillez choisir le lieu souhaité

Prix par participant

Les formations ouvertes requièrent plus de 3 participants.

Formation Administration de Hadoop avec MapR - Réservation

Nom complet *

Email *

Téléphone *

Poste

Nom de l'entreprise

Adresse 1 *

Ville *

État / Province

Pays *

Code postal *

Date de début

Numéro d'identification fiscale

Les dates sont soumises à disponibilité et se déroulent entre 09:30 et 16:30.

Paiement *

Virement bancaire (facture, commande)

Carte de débit / Carte de crédit

Commentaires

Termes et Conditions *

Je suis un représentant autorisé du client et je souhaite réserver la formation / services conformément aux conditions générales et à la politique de confidentialité de NobleProg.

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Formation Administration de Hadoop avec MapR - Demande de renseignements

NobleProg propose des formations professionnelles conçues spécifiquement pour les entreprises et les organisations. Ces formations ne sont pas destinées aux particuliers.

Nom complet *

Email *

Téléphone *

Nombre de participants

Nom de l'entreprise

Adresse de l'entreprise

Comment souhaitez-vous suivre le cours ?

Locaux Clients

En ligne

Salle de Classe

Commentaires

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Administration de Hadoop avec MapR - Demande d'informations consulting

Nom complet *

Téléphone *

Email *

Nom de l'entreprise

Sujet du Conseil *

But du Consulting

Avec qui le consultant travaillera?

Agence de Conseil *

Commentaires

M'informer sur les réductions et les promotions

Veuillez lire notre Politique de Confidentialité pour savoir comment nous utilisons vos données

Nos clients témoignent (1)

des aspects pratiques de la réalisation, ainsi qu'une bonne dose de théorie, ont été bien présentés par Ajay

Dominik Mazur - Capgemini Polska Sp. z o.o.

Formation - Hadoop Administration on MapR

4950 EUR (En ligne)

5750 EUR (Salle de Classe)

Cours Similaires

Formation d'administrateur pour Apache Hadoop

35 Heures

Public cible :

Ce cours est destiné aux spécialistes des TIC à la recherche d'une solution pour stocker et traiter de grands ensembles de données dans un environnement de système distribué.

Goal :

Connaissance approfondie de l'administration des clusters Hadoop.

Analyse de données volumineuses dans la santé

21 Heures

L'analyse de données volumineuses implique le processus d'examen de grands ensembles de données variées afin de découvrir des corrélations, des modèles cachés et d'autres informations utiles.

L'industrie de la santé dispose de masses de données médicales et cliniques complexes et hétérogènes. L'application de l'analyse de données volumineuses à des données de santé présente un énorme potentiel pour tirer des insights permettant d'améliorer la prestation des soins de santé. Cependant, l'énormité de ces ensembles de données pose de grands défis dans les analyses et les applications pratiques à un environnement clinique.

Dans cette formation dirigée par un formateur (à distance), les participants apprendront comment réaliser une analyse de données volumineuses dans la santé tout en effectuant une série d'exercices pratiques guidés.

À la fin de cette formation, les participants seront capables de :

Installer et configurer des outils d'analyse de données volumineuses tels que Hadoop MapReduce et Spark
Comprendre les caractéristiques des données médicales
Appliquer des techniques de grandes données pour gérer les données médicales
Étudier les systèmes et algorithmes de grande donnée dans le contexte des applications de santé

Public visé

Développeurs
Data Scientists

Format du cours permettant d'évaluer les participants

Partie exposé, partie discussion, exercices et pratique intensive.

Note

Pour demander une formation sur mesure pour ce cours, veuillez nous contacter pour organiser.

Hadoop pour Administrateurs

21 Heures

Apache Hadoop est le cadre le plus populaire pour le traitement Big Data sur des clusters de serveurs. Au cours de ce stage de trois jours (quatre jours optionnellement), les participants apprendront les avantages commerciaux et les cas d'utilisation pour Hadoop et son écosystème, comment planifier la mise en place et l'expansion du cluster, comment installer, entretenir, surveiller, résoudre les problèmes et optimiser Hadoop. Ils pratiqueront également le chargement de données massives sur le cluster, se familiariseront avec diverses distributions Hadoop, et exerceront l'installation et la gestion des outils de l'écosystème Hadoop. Le cours se terminera par une discussion sur la sécurisation du cluster avec Kerberos.

“…Les matériaux étaient très bien préparés et couverts en profondeur. La salle d'exercices était très utile et bien organisée”
— Andrew Nguyen, Principal Integration DW Engineer, Microsoft Online Advertising

Audience

Administrateurs Hadoop

Format

Conférences et ateliers pratiques, répartition approximative 60% conférences, 40% ateliers.

Hadoop pour les développeurs (4 jours)

28 Heures

Apache Hadoop est le framework le plus populaire pour traiter des données massives sur des clusters de serveurs. Ce cours introduira un développeur aux divers composants de l'écosystème Hadoop (HDFS, MapReduce, Pig, Hive et HBase).

Hadoop pour Développeurs, niveau Acvancé

21 Heures

Apache Hadoop est l'un des cadres les plus populaires pour traiter les Big Data sur des clusters de serveurs. Ce cours approfondit la gestion des données dans HDFS, Pig, Hive et HBase avancés. Ces techniques de programmation avancées seront bénéfiques aux développeurs expérimentés en Hadoop.

Public cible: développeurs

Durée : trois jours

Format : conférences (50 %) et laboratoires pratiques (50 %).

Hadoop et Spark pour les administrateurs

35 Heures

Cette formation en direct avec instructeur (en ligne ou sur site) s'adresse aux administrateurs système qui souhaitent apprendre à mettre en place, déployer et gérer des clusters Hadoop au sein de leur organisation.

A l'issue de cette formation, les participants seront capables de :

Installer et configurer Apache Hadoop.
Comprendre les quatre composants majeurs de l'écosystème Hadoop : HDFS, MapReduce, YARN et Hadoop Common.
Utiliser le système de fichiers distribués Hadoop (HDFS) pour faire évoluer un cluster vers des centaines ou des milliers de nœuds.
Configurer HDFS comme moteur de stockage pour les déploiements Spark sur site.
Configurer Spark pour accéder à des solutions de stockage alternatives telles qu'Amazon S3 et des systèmes de base de données NoSQL tels que Redis, Elasticsearch, Couchbase, Aerospike, etc.
Exécuter des tâches administratives telles que le provisionnement, la gestion, la surveillance et la sécurisation d'un cluster Apache Hadoop.

HBase pour les Développeurs

21 Heures

Ce cours introduit HBase – un stockage NoSQL basé sur Hadoop. Le cours est destiné aux développeurs qui utiliseront HBase pour développer des applications, ainsi qu'aux administrateurs qui géreront les clusters HBase.

Nous guiderons un développeur à travers l'architecture de HBase, la modélisation des données et le développement d'applications sur HBase. Il abordera également l'utilisation de MapReduce avec HBase, ainsi que certains sujets d'administration liés à l'optimisation des performances. Le cours est très pratique avec de nombreux exercices de laboratoire.

Durée : 3 jours

Public cible : Développeurs & Administrateurs

Apache NiFi pour les Administrateurs

21 Heures

Apache NiFi est une plateforme open-source, basée sur le flux de données, pour l'intégration et le traitement d'événements. Elle permet un routage, une transformation et une médiation en temps réel entre des systèmes disparates, avec une interface utilisateur web et un contrôle granulaire.

Cette formation dirigée par un instructeur (sur site ou à distance) est destinée aux administrateurs et ingénieurs de niveau intermédiaire qui souhaitent déployer, gérer, sécuriser et optimiser les flux de données NiFi dans des environnements de production.

À la fin de cette formation, les participants seront en mesure de :

Installer, configurer et maintenir des clusters Apache NiFi.
Concevoir et gérer des flux de données provenant de sources et de récepteurs variés.
Mettre en œuvre l'automatisation du flux, le routage et la logique de transformation.
Optimiser les performances, surveiller les opérations et dépanner les problèmes.

Format du cours permettant d'évaluer les participants

Cours interactif avec discussion sur l'architecture réelle.
Laboratoires pratiques : construction, déploiement et gestion des flux.
Exercices basés sur des scénarios dans un environnement de laboratoire en direct.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.

Apache NiFi pour les Développeurs

7 Heures

Au cours de cette formation en direct et dirigée par un instructeur dans France, les participants apprendront les principes fondamentaux de la programmation par flux en développant un certain nombre d'extensions, de composants et de processeurs de démonstration à l'aide de Apache NiFi.

A la fin de cette formation, les participants seront capables de :

Comprendre l'architecture de NiFi et les concepts de flux de données.
Développer des extensions en utilisant NiFi et des APIs tierces.
Développer leur propre processeur Apache Nifi.
Ingérer et traiter des données en temps réel à partir de formats de fichiers et de sources de données disparates et peu communs.

Python, Spark et Hadoop pour les grands volumes de données

21 Heures

Cette formation en France (en ligne ou sur site) est destinée aux développeurs qui souhaitent utiliser et intégrer Spark, Hadoop et Python pour traiter, analyser et transformer des ensembles de données complexes et volumineux.

A l'issue de cette formation, les participants seront capables de :

Mettre en place l'environnement nécessaire pour commencer à traiter les big data avec Spark, Hadoop et Python.
Comprendre les fonctionnalités, les composants de base et l'architecture de Spark et Hadoop.
Apprendre à intégrer Spark, Hadoop et Python pour le traitement des big data.
Explorer les outils de l'écosystème Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka et Flume).
Construire des systèmes de recommandation par filtrage collaboratif similaires à Netflix, YouTube, Amazon, Spotify et Google.
Utiliser Apache Mahout pour mettre à l'échelle des algorithmes d'apprentissage automatique.

Formation Administration de Hadoop avec MapR

Public cible :

Plan du cours

Big Data Aperçu :

Hadoop et ses composants :

Planification de votre cluster Hadoop :

Qu'est-ce que MapR et pourquoi MapR :

Configuration et administration du cluster :

Mise à niveau du cluster et intégration avec d'autres configurations :

Pré requis

Nos clients témoignent (1)

Dominik Mazur - Capgemini Polska Sp. z o.o.

Formation - Hadoop Administration on MapR

Cours à venir

Administration de Hadoop avec MapR

Administration de Hadoop avec MapR

Administration de Hadoop avec MapR

Administration de Hadoop avec MapR

Administration de Hadoop avec MapR

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites