Les formations Hadoop

Les formations Hadoop

Apache Hadoop est un framework libre et open source inspiré de deux noyeaux de la gestion BigData de Google: GFS (Google File System) and MapReduce. C'est un framework complet destiné à stocker et traiter de grosses quantités de données. Hadoop est utilisé par la plupart des fournisseurs de service dont Yahoo, Facebook ou LinkedIn.

Nos Clients témoignent

★★★★★
★★★★★

Sous-catégories Hadoop

Plans de cours Hadoop

CodeNomDuréeAperçu
hadoopadmHadoop Administration21 heuresLe cours est dédié aux spécialistes de l'informatique qui recherchent une solution pour stocker et traiter de grands ensembles de données dans un environnement système distribué Objectif du cours: Obtenir des connaissances sur l'administration de cluster Hadoop .
hadoopforprojectmgrsHadoop for Project Managers14 heuresAlors que de plus en plus de projets logiciels et informatiques migrent du traitement local et de la gestion des données au traitement distribué et au stockage de données volumineuses, les chefs de projet trouvent nécessaire de mettre à niveau leurs connaissances et leurs compétences Ce cours présente les chefs de projet au framework de traitement Big Data le plus populaire: Hadoop Dans cette formation, les participants apprendront les composants de base de l'écosystème Hadoop et comment ces technologies peuvent être utilisées pour résoudre des problèmes à grande échelle En apprenant ces fondations, les participants amélioreront également leur capacité à communiquer avec les développeurs et les exécutants de ces systèmes, ainsi qu'avec les scientifiques et les analystes de données impliqués dans de nombreux projets informatiques Public Chefs de projet souhaitant implémenter Hadoop dans leur infrastructure de développement ou informatique existante Gestionnaires de projet ayant besoin de communiquer avec des équipes interfonctionnelles comprenant des ingénieurs de données volumineuses, des spécialistes des données et des analystes commerciaux Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
sqoopMoving Data from MySQL to Hadoop with Sqoop14 heuresSqoop est un outil logiciel open source permettant de transférer des données entre Hadoop et des bases de données relationnelles ou des mainframes Il peut être utilisé pour importer des données à partir d'un système de gestion de base de données relationnelle (SGBDR) tel que MySQL ou Oracle ou un ordinateur central dans le système de fichiers distribués Hadoop (HDFS) Par la suite, les données peuvent être transformées dans Hadoop MapReduce, puis réexportées dans un SGBDR Dans cette formation en ligne, les participants apprendront comment utiliser Sqoop pour importer des données d'une base de données relationnelle traditionnelle vers un stockage Hadoop tel que HDFS ou Hive et vice versa À la fin de cette formation, les participants seront en mesure de: Installez et configurez Sqoop Importer des données de MySQL vers HDFS et Hive Importer des données de HDFS et Hive vers MySQL Public Administrateurs système Les ingénieurs de données Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson Remarque Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser .
hadooppythonHadoop with Python28 heuresHadoop est un framework de traitement Big Data populaire Python est un langage de programmation de haut niveau connu pour sa syntaxe claire et sa lisibilité Dans cette formation en ligne, les participants apprendront à travailler avec Hadoop, MapReduce, Pig et Spark à l'aide de Python, tout en parcourant plusieurs exemples et cas d'utilisation À la fin de cette formation, les participants seront en mesure de: Comprendre les concepts de base de Hadoop, MapReduce, Pig et Spark Utilisez Python avec le système de fichiers distribués Hadoop (HDFS), MapReduce, Pig et Spark Utiliser Snakebite pour accéder par programme à HDFS dans Python Utilisez mrjob pour écrire des jobs MapReduce dans Python Écrire des programmes Spark avec Python Étendre les fonctionnalités de pig en utilisant les UDF Python Gérer les jobs MapReduce et les scripts Pig en utilisant Luigi Public Développeurs Professionnels de l'informatique Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
nifidevApache NiFi for Developers7 heuresApache NiFi (Hortonworks DataFlow) est une plate-forme de traitement de données et de logistique de données intégrée en temps réel qui permet le déplacement, le suivi et l'automatisation des données entre les systèmes Il est écrit en utilisant la programmation basée sur les flux et fournit une interface utilisateur basée sur le Web pour gérer les flux de données en temps réel Dans cette formation en ligne, les participants apprendront les principes fondamentaux de la programmation basée sur les flux en développant un certain nombre d'extensions de démonstration, de composants et de processeurs utilisant Apache NiFi À la fin de cette formation, les participants seront en mesure de: Comprendre l'architecture de NiFi et les concepts de flux de données Développer des extensions en utilisant des API NiFi et tierces Personnaliser développer leur propre processeur Apache Nifi Ingest et traitement de données en temps réel à partir de formats de fichiers et de sources de données disparates et peu communs Public Développeurs Les ingénieurs de données Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
nifiApache NiFi for Administrators21 heuresApache NiFi (Hortonworks DataFlow) est une plate-forme de traitement de données et de logistique de données intégrée en temps réel qui permet le déplacement, le suivi et l'automatisation des données entre les systèmes Il est écrit en utilisant la programmation basée sur les flux et fournit une interface utilisateur basée sur le Web pour gérer les flux de données en temps réel Dans cette formation en ligne, les participants apprendront comment déployer et gérer Apache NiFi dans un environnement de laboratoire en direct À la fin de cette formation, les participants seront en mesure de: Installez et configurez Apachi NiFi Source, transformer et gérer les données à partir de sources de données dispersées et disparates, y compris des bases de données et des lacs de données volumineuses Automatiser les flux de données Activer l'analyse en continu Appliquer différentes approches pour l'ingestion de données Transformez les Big Data et les informations sur les entreprises Public Administrateurs système Les ingénieurs de données Développeurs DevOps Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
datameerDatameer for Data Analysts14 heuresDatameer est une plateforme de business intelligence et d'analyse basée sur Hadoop Il permet aux utilisateurs finaux d'accéder, d'explorer et de mettre en corrélation des données à grande échelle, structurées, semi-structurées et non structurées de manière simple Dans cette formation en ligne, les participants apprendront à utiliser Datameer pour surmonter la courbe d'apprentissage abrupte d'Hadoop à mesure qu'ils progressent dans la configuration et l'analyse d'une série de sources de données volumineuses À la fin de cette formation, les participants seront en mesure de: Créer, organiser et explorer de manière interactive un lac de données d'entreprise Accéder aux entrepôts de données de Business Intelligence, aux bases de données transactionnelles et aux autres magasins analytiques Utiliser une interface utilisateur de feuille de calcul pour concevoir des pipelines de traitement de données endtoend Accéder à des fonctions prédéfinies pour explorer des relations de données complexes Utilisez les assistants draganddrop pour visualiser les données et créer des tableaux de bord Utiliser des tableaux, des graphiques, des graphiques et des cartes pour analyser les résultats de la requête Public Analystes de données Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
tigonTigon: Real-time Streaming for the Real World14 heuresTigon est un framework de traitement de flux opensource, temps réel, lowlatency, highthroughput, native natif, qui se trouve au-dessus de HDFS et de HBase pour la persistance Les applications Tigon traitent des cas d'utilisation tels que la détection et l'analyse des intrusions sur le réseau, l'analyse des marchés des médias sociaux, l'analyse de l'emplacement et les recommandations en temps réel aux utilisateurs Cette formation en ligne, introduite par un instructeur, présente l'approche de Tigon qui consiste à mélanger le traitement en temps réel et le traitement par lots tout en guidant les participants à travers la création d'un exemple d'application À la fin de cette formation, les participants seront en mesure de: Créez de puissantes applications de traitement de flux pour gérer de gros volumes de données Traiter des sources de flux telles que Twitter et Webserver Logs Utilisez Tigon pour joindre, filtrer et agréger rapidement des flux Public Développeurs Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
alluxioAlluxio: Unifying Disparate Storage Systems7 heuresAlexio est un système de stockage distribué virtuel opensource qui unifie les systèmes de stockage disparates et permet aux applications d'interagir avec les données à la vitesse de la mémoire Il est utilisé par des sociétés telles que Intel, Baidu et Alibaba Dans cette formation en ligne, les participants apprendront à utiliser Alexio pour rapprocher différents cadres de calcul avec des systèmes de stockage et gérer efficacement des données à l'échelle de plusieurs octets au fur et à mesure de la création d'une application avec Alluxio À la fin de cette formation, les participants seront en mesure de: Développer une application avec Alluxio Connectez des systèmes et applications Big Data tout en préservant un espace de nom Extraction efficace de la valeur de Big Data dans n'importe quel format de stockage Améliorer les performances de la charge de travail Déployer et gérer Alluxio autonome ou en cluster Public Data scientist Développeur Administrateur du système Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
samzaSamza for Stream Processing14 heuresApache Samza est une architecture computationnelle asynchrone, nearrealtime, opensource pour le traitement de flux Il utilise Apache Kafka pour la messagerie et Apache Hadoop YARN pour la tolérance aux pannes, l'isolation du processeur, la sécurité et la gestion des ressources Cette formation en direct instruite introduit les principes qui sous-tendent les systèmes de messagerie et le traitement des flux distribués, tout en guidant les participants à travers la création d'un exemple de projet Samzabased et d'exécution de tâches À la fin de cette formation, les participants seront en mesure de: Utilisez Samza pour simplifier le code nécessaire pour produire et consommer des messages Découpler la gestion des messages d'une application Utilisez Samza pour implémenter le calcul asynchrone nearrealtime Utilisez le traitement de flux pour fournir un plus haut niveau d'abstraction sur les systèmes de messagerie Public Développeurs Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
hdpHortonworks Data Platform (HDP) for Administrators21 heuresHortonworks Data Platform est une plate-forme de support Apache Hadoop opensource qui fournit une base stable pour le développement de solutions Big Data sur l'écosystème Apache Hadoop Cette formation en direct instruit présente Hortonworks et les participants à la marche à travers le déploiement de la solution Spark + Hadoop À la fin de cette formation, les participants seront en mesure de: Utilisez Hortonworks pour exécuter Hadoop de manière fiable à grande échelle Unifiez les capacités de sécurité, de gouvernance et d'opérations de Hadoop grâce aux flux de travail analytiques agiles de Spark Utiliser Hortonworks pour étudier, valider, certifier et supporter chacun des composants d'un projet Spark Traitez différents types de données, notamment les données structurées, non structurées, inmotion et atrest Public Les administrateurs Hadoop Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
ambariApache Ambari: Efficiently Manage Hadoop Clusters21 heuresApache Ambari est une plate-forme de gestion opensource pour l'approvisionnement, la gestion, la surveillance et la sécurisation des clusters Apache Hadoop Dans cette formation en direct, les participants apprendront les outils et les pratiques de gestion fournis par Ambari pour gérer avec succès les clusters Hadoop À la fin de cette formation, les participants seront en mesure de: Configurer un cluster Big Data en direct à l'aide d'Ambari Appliquez les fonctionnalités et fonctionnalités avancées d'Ambari à divers cas d'utilisation Ajoutez et supprimez des nœuds en toute transparence, au besoin Améliorer les performances d'un cluster Hadoop grâce à l'optimisation et à l'optimisation Public DevOps Administrateurs système DBA Les professionnels du test Hadoop Format du cours Partie conférence, discussion en partie, exercices et pratique lourde de handson .
ApHadm1Apache Hadoop: Manipulation and Transformation of Data Performance21 heuresCe cours est destiné aux développeurs, aux architectes, aux data scientists ou à tout autre profil nécessitant un accès intensif ou régulier aux données L'objectif principal du cours est la manipulation et la transformation des données Parmi les outils de l'écosystème Hadoop, ce cours inclut l'utilisation de Pig and Hive, tous deux fortement utilisés pour la transformation et la manipulation des données Cette formation aborde également les métriques de performance et l'optimisation des performances Le cours est entièrement manuel et ponctué de présentations des aspects théoriques .
apachehAdministrator Training for Apache Hadoop35 heuresPublic: Le cours est destiné aux spécialistes de l'informatique à la recherche d'une solution pour stocker et traiter de grands ensembles de données dans un environnement système distribué Objectif: Connaissance approfondie de l'administration de cluster Hadoop .
BigData_A Practical Introduction to Data Analysis and Big Data35 heuresParticipants who complete this training will gain a practical, real-world understanding of Big Data and its related technologies, methodologies and tools.

Participants will have the opportunity to put this knowledge into practice through hands-on exercises. Group interaction and instructor feedback make up an important component of the class.

The course starts with an introduction to elemental concepts of Big Data, then progresses into the programming languages and methodologies used to perform Data Analysis. Finally, we discuss the tools and infrastructure that enable Big Data storage, Distributed Processing, and Scalability.

Audience

- Developers / programmers
- IT consultants

Format of the course

- Part lecture, part discussion, hands-on practice and implementation, occasional quizing to measure progress.
IntroToAvroApache Avro: Data Serialization for Distributed Applications14 heuresCe cours est destiné à Développeurs Format du cours Conférences, exercices pratiques, petits tests en cours de route pour évaluer la compréhension .
HadoopDevAdHadoop for Developers and Administrators21 heuresHadoop est le framework de traitement Big Data le plus populaire .
ImpImpala for Business Intelligence21 heuresCloudera Impala est un moteur de requête SQL open source massivement parallèle (MPP) pour les clusters Apache Hadoop Impala permet aux utilisateurs d'envoyer des requêtes SQL de faible importance aux données stockées dans Hadoop Distributed File System et Apache Hbase sans nécessiter de mouvement ou de transformation de données Public Ce cours s'adresse aux analystes et aux data scientists effectuant des analyses sur des données stockées dans Hadoop via des outils de Business Intelligence ou SQL Après ce cours, les délégués pourront Extraire des informations significatives des clusters Hadoop avec Impala Rédiger des programmes spécifiques pour faciliter la Business Intelligence dans le dialecte SQL Impala Dépannez Impala .
hivehiveqlData Analysis with Hive/HiveQL7 heuresCe cours couvre l'utilisation du langage Hive SQL (AKA: Hive HQL, SQL sur Hive, HiveQL) pour les personnes qui extraient des données de Hive .
hadoopbaHadoop for Business Analysts21 heuresApache Hadoop est le framework le plus populaire pour le traitement du Big Data Hadoop fournit une capacité analytique riche et profonde, et fait des percées dans le monde analytique BI traditionnel Ce cours présentera un analyste aux composants de base du système écologique Hadoop et à ses analyses Public Analystes d'affaires Durée trois jours Format Conférences et mains sur les laboratoires .
hadoopadm1Hadoop For Administrators21 heuresApache Hadoop est le framework le plus populaire pour le traitement de Big Data sur des grappes de serveurs Dans ce cours de trois (quatre) jours, les participants découvriront les avantages et les cas d'utilisation d'Hadoop et de son écosystème, comment planifier le déploiement et la croissance des clusters, comment installer, maintenir, surveiller, dépanner et optimiser Hadoop Ils pratiqueront également le chargement de données groupées en masse, se familiariseront avec diverses distributions Hadoop et s'entraîneront à l'installation et à la gestion des outils de l'écosystème Hadoop Le cours se termine par une discussion sur la sécurisation du cluster avec Kerberos " Les matériaux étaient très bien préparés et bien couverts Le laboratoire était très utile et bien organisé " - Andrew Nguyen, Ingénieur DW Intégration Principal, Microsoft Online Advertising Public Les administrateurs Hadoop Format Conférences et ateliers pratiques, équilibre approximatif 60% de cours magistraux, 40% de travaux pratiques .
hbasedevHBase for Developers21 heuresCe cours présente HBase - un magasin NoSQL au-dessus de Hadoop Le cours est destiné aux développeurs qui utiliseront HBase pour développer des applications et aux administrateurs qui gèreront les clusters HBase Nous accompagnerons un développeur via l'architecture HBase et la modélisation de données et le développement d'applications sur HBase Il discutera également de l'utilisation de MapReduce avec HBase et de certains sujets d'administration liés à l'optimisation des performances Le cours est très pratique avec beaucoup d'exercices de laboratoire Durée : 3 jours Public : Développeurs et administrateurs .
hadoopdevaAdvanced Hadoop for Developers21 heuresApache Hadoop est l'un des frameworks les plus populaires pour le traitement de Big Data sur des clusters de serveurs Ce cours se penche sur la gestion des données dans HDFS, Advanced Pig, Hive et HBase Ces techniques de programmation avancées seront bénéfiques aux développeurs Hadoop expérimentés Public : développeurs Durée: trois jours Format: conférences (50%) et handson labs (50%) .
hadoopdevHadoop for Developers (4 days)28 heuresApache Hadoop est le framework le plus populaire pour le traitement de Big Data sur des grappes de serveurs Ce cours présentera un développeur à divers écosystèmes (HDFS, MapReduce, Pig, Hive et HBase) Hadoop .
hadoopmaprHadoop Administration on MapR28 heuresPublic:

Ce cours est destiné à démystifier la technologie big data / hadoop et à montrer qu'il n'est pas difficile à comprendre.
bigdataanahealthBig Data Analytics in Health21 heuresL'analyse des données volumineuses implique le processus consistant à examiner de grandes quantités d'ensembles de données variés afin de découvrir des corrélations, des modèles cachés et d'autres informations utiles L'industrie de la santé a des quantités massives de données médicales et cliniques hétérogènes complexes L'application de l'analyse des données volumineuses aux données sur la santé présente un énorme potentiel pour obtenir des informations sur l'amélioration de la prestation des soins de santé Cependant, l'énormité de ces ensembles de données pose de grands défis dans les analyses et les applications pratiques à un environnement clinique Dans le cadre de cette formation en ligne (à distance), les participants apprendront à effectuer des analyses de données volumineuses en matière de santé au cours d'une série d'exercices pratiques À la fin de cette formation, les participants seront en mesure de: Installer et configurer des outils d'analyse de Big Data tels que Hadoop MapReduce et Spark Comprendre les caractéristiques des données médicales Appliquer des techniques de big data pour traiter les données médicales Étudier les systèmes de données volumineuses et les algorithmes dans le contexte des applications de santé Public Développeurs Data Scientists Format du cours Partie conférence, discussion partielle, exercices et pratique lourde de handson Remarque Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser .

Prochains cours Hadoop

FormationDate FormationPrix [A distance / Classe]
Alluxio: Unifying Disparate Storage Systems - Lyon, Gare Lyon Part-Dieumer, 2018-12-26 09:301500EUR / 1900EUR
Alluxio: Unifying Disparate Storage Systems - Lille, Gare Flandresjeu, 2019-01-03 09:301500EUR / 1900EUR
Alluxio: Unifying Disparate Storage Systems - Poitiersjeu, 2019-01-03 09:301500EUR / 1900EUR
Alluxio: Unifying Disparate Storage Systems - Clermont-Ferrand, ZI Le Brézetven, 2019-01-11 09:301500EUR / 1900EUR
Alluxio: Unifying Disparate Storage Systems - Limoges, Centre Villemer, 2019-02-06 09:301500EUR / 1900EUR
Weekend Hadoop cours, Soir Hadoop formation, Hadoop stage d’entraînement, Hadoop formateur à distance, Hadoop formateur en ligne, Hadoop formateur Online, Hadoop cours en ligne, Hadoop cours à distance, Hadoop professeur à distance, Hadoop visioconférence, Hadoop stage d’entraînement intensif, Hadoop formation accélérée, Hadoop formation intensive, Formation inter Hadoop, Formation intra Hadoop, Formation intra Enteprise Hadoop, Formation inter Entreprise Hadoop, Weekend Hadoop formation, Soir Hadoop cours, Hadoop coaching, Hadoop entraînement, Hadoop préparation, Hadoop instructeur, Hadoop professeur, Hadoop formateur, Hadoop stage de formation, Hadoop cours, Hadoop sur place, Hadoop formations privées, Hadoop formation privée, Hadoop cours particulier, Hadoop cours particuliers

Réduction spéciale

FormationLieuDate FormationPrix [A distance / Classe]
R for Data Analysis and Research Tours, Parc Honoré de Balzacmar, 2018-12-18 09:301575EUR / 1975EUR
Docker and KubernetesParis, Opera Boursemer, 2019-01-16 09:304455EUR / 5255EUR
Advanced Automation with AnsibleParis, Opera Bourselun, 2019-02-11 09:302700EUR / 3300EUR
Advanced Statistics using SPSS Predictive Analytics SoftwareStrasbourg, Kibitzenau Station lun, 2019-04-01 09:306300EUR / 7300EUR
R for Data Analysis and Research Orléans, gare centralelun, 2019-04-15 09:301575EUR / 1975EUR

Newsletter offres spéciales

Nous respectons le caractère privé de votre adresse mail. Nous ne divulguerons ni ne vendrons votre adresse email à quiconque
Vous pouvez toujours modifier vos préférences ou vous désinscrire complètement.

Nos clients

is growing fast!

We are looking to expand our presence in France!

As a Business Development Manager you will:

  • expand business in France
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!