Les formations Apache Spark

Les formations Apache Spark

Formation Apache Spark - un moteur de traitement Big Data

Nos Clients témoignent

★★★★★
★★★★★

Sous-catégories Spark

Plans de cours Apache Spark

Title
Durée
Aperçu
Title
Durée
Aperçu
21 hours
Aperçu
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
7 hours
Aperçu
Alluxio est un système de stockage distribué virtuel à source ouverte qui unifie des systèmes de stockage disparates et permet aux applications d’interagir avec les données à la vitesse de la mémoire. Il est utilisé par des sociétés telles qu'Intel, Baidu et Alibaba.

Au cours de cette formation en direct animée par un instructeur, les participants apprendront à utiliser Alluxio pour relier différents cadres de calcul à des systèmes de stockage et à gérer efficacement les données à l'échelle de plusieurs pétaoctets lors de la création d'une application avec Alluxio .

À la fin de cette formation, les participants seront en mesure de:

- Développer une application avec Alluxio
- Connectez des systèmes Big Data et des applications tout en préservant un seul espace de noms
- Extraire efficacement la valeur des mégadonnées dans n'importe quel format de stockage
- Améliorer les performances de la charge de travail
- Déployer et gérer Alluxio autonome ou en cluster

Public

- Data Scientist
- Développeur
- Administrateur du système

Format du cours

- Partie de conférence, partie de discussion, exercices et exercices intensifs
21 hours
Aperçu
L'analyse de données volumineuses implique l'examen de grandes quantités d'ensembles de données variés afin de découvrir des corrélations, des modèles cachés et d'autres informations utiles.

L'industrie de la santé dispose de quantités massives de données médicales et cliniques hétérogènes complexes. L'application de l'analyse de données volumineuses sur les données de santé présente un potentiel énorme pour la compréhension de l'amélioration de la prestation des soins de santé. Cependant, l'énormité de ces ensembles de données pose de grands défis pour les analyses et les applications pratiques dans un environnement clinique.

Au cours de cette formation en direct animée par un instructeur (à distance), les participants apprendront à effectuer des analyses de données volumineuses dans le domaine de la santé tout en effectuant une série d'exercices pratiques en laboratoire.

À la fin de cette formation, les participants seront en mesure de:

- Installer et configurer des outils d'analyse de données volumineuses tels que Hadoop MapReduce et Spark
- Comprendre les caractéristiques des données médicales
- Appliquer des techniques Big Data pour traiter des données médicales
- Etudiez les systèmes de données volumineuses et les algorithmes dans le contexte d'applications de santé

Public

- Développeurs
- Data Scientists

Format du cours

- Partie lecture, partie discussion, exercices et exercices intensifs.

Remarque

- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
28 hours
Aperçu
De nombreux problèmes du monde réel peuvent être décrits en termes de graphiques. Par exemple, le graphique Web, le graphique de réseau social, le graphique de réseau de train et le graphique de langue. Ces graphiques ont tendance à être extrêmement volumineux. leur traitement nécessite un ensemble spécialisé d'outils et de processus - ces outils et processus peuvent être appelés Graph Computing (également appelé Graph Analytics).

Dans cette formation en direct animée par un instructeur, les participants découvriront les offres technologiques et les approches de mise en œuvre pour le traitement des données graphiques. Le but est d'identifier les objets du monde réel, leurs caractéristiques et leurs relations, puis de modéliser ces relations et de les traiter sous forme de données à l'aide d'une approche Graph Computing (également appelée Graph Analytics). Nous commençons par un aperçu général et nous concentrons sur des outils spécifiques en parcourant une série d’études de cas, d’exercices pratiques et de déploiements en direct.

À la fin de cette formation, les participants seront en mesure de:

- Comprendre comment les données de graphique sont persistées et parcourues.
- Sélectionnez le meilleur framework pour une tâche donnée (des bases de données graphiques aux frameworks de traitement par lots).
- Implémentez Hadoop , Spark, GraphX et Pregel pour effectuer des calculs graphiques sur plusieurs machines en parallèle.
- Affichez les problèmes de données volumineuses dans le monde réel en termes de graphiques, de processus et de parcours.

Format du cours

- Partie de conférence, partie de discussion, exercices et exercices intensifs
21 hours
Aperçu
Hortonworks Data Platform (HDP) est une plateforme de support Apache Hadoop source ouverte qui fournit une base stable pour le développement de solutions Big Data sur l’écosystème Apache Hadoop .

Cette formation en direct animée par un instructeur (sur site ou à distance) présente Hortonworks Data Platform (HDP) et guide les participants dans le déploiement de la solution Spark + Hadoop .

À la fin de cette formation, les participants seront en mesure de:

- Utilisez Hortonworks pour exécuter Hadoop de manière fiable à grande échelle.
- Unifiez les capacités de sécurité, de gouvernance et d'exploitation de Hadoop avec les workflows d'analyse agiles de Spark.
- Utilisez Hortonworks pour étudier, valider, certifier et soutenir chacun des composants d’un projet Spark.
- Traitez différents types de données, y compris les données structurées, non structurées, en mouvement et au repos.

Format du cours

- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.

Options de personnalisation du cours

- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
21 hours
Aperçu
Stream Processing fait référence au traitement en temps réel de «données en mouvement», c’est-à-dire à l’exécution de calculs sur les données reçues. Ces données sont lues comme des flux continus provenant de sources de données telles que les événements de capteurs, site web activité des utilisateurs, les métiers financiers, grands coups de carte de crédit, cliquez sur les flux, etc. Stream Processing de Stream Processing des cadres sont capables de lire des volumes importants de données entrantes et fournir des indications précieuses presque instantanément.

Au cours de cette formation en direct animée par un instructeur (sur site ou à distance), les participants apprendront à configurer et à intégrer différents cadres de Stream Processing avec des systèmes de stockage de données volumineux existants ainsi que des applications logicielles et microservices connexes.

À la fin de cette formation, les participants seront en mesure de:

- Installez et configurez différents frameworks de Stream Processing , tels que Spark Streaming et Kafka Streaming.
- Comprendre et sélectionner le cadre le plus approprié pour le travail.
- Traitement des données en continu, simultanément et enregistrement par enregistrement.
- Intégrez les solutions de Stream Processing continu aux bases de données, aux entrepôts de données, aux lacs de données existants
- Intégrez la bibliothèque de traitement de flux la plus appropriée aux applications d'entreprise et aux microservices.

Public

- Développeurs
- Architectes logiciels

Format du cours

- Partie de conférence, partie de discussion, exercices et exercices intensifs

Remarques

- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
14 hours
Aperçu
Magellan is an open-source distributed execution engine for geospatial analytics on big data. Implemented on top of Apache Spark, it extends Spark SQL and provides a relational abstraction for geospatial analytics.

This instructor-led, live training introduces the concepts and approaches for implementing geospacial analytics and walks participants through the creation of a predictive analysis application using Magellan on Spark.

By the end of this training, participants will be able to:

- Efficiently query, parse and join geospatial datasets at scale
- Implement geospatial data in business intelligence and predictive analytics applications
- Use spatial context to extend the capabilities of mobile devices, sensors, logs, and wearables

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
21 hours
Aperçu
La courbe d'apprentissage d' Apache Spark augmente lentement au début, il faut beaucoup d'efforts pour obtenir le premier retour. Ce cours vise à passer à travers la première partie difficile. Après avoir suivi ce cours, les participants comprendront les bases d’ Apache Spark , ils différencieront clairement RDD de DataFrame, ils apprendront les API Python et Scala , ils comprendront les exécuteurs et les tâches, etc. En suivant également les meilleures pratiques, ce cours est fortement axé sur déploiement en nuage, Databricks et AWS. Les étudiants comprendront également les différences entre AWS EMR et AWS Glue, l'un des derniers services Spark d'AWS.

PUBLIC:

Ingénieur de données, DevOps , Data Scientist
21 hours
Aperçu
OBJECTIF:

Ce cours présentera Apache Spark . Les étudiants apprendront comment Spark s'intègre dans l'écosystème du Big Data et comment utiliser Spark pour l'analyse de données. Le cours couvre le shell Spark pour l'analyse de données interactive, les composants internes de Spark, les API Spark, Spark SQL , le streaming Spark, ainsi que l'apprentissage automatique et graphX.

PUBLIC :

Développeurs / Analystes de données
21 hours
Aperçu
Python est un langage de programmation de haut niveau réputé pour sa syntaxe claire et sa lisibilité du code. Spark est un moteur de traitement de données utilisé pour interroger, analyser et transformer le Big Data. PySpark permet aux utilisateurs d’interfacer Spark avec Python .

Au cours de cette formation en direct animée par un instructeur, les participants apprendront à utiliser Python et Spark ensemble pour analyser des données volumineuses au cours d’exercices pratiques.

À la fin de cette formation, les participants seront en mesure de:

- Apprenez à utiliser Spark avec Python pour analyser des Big Data .
- Travaillez sur des exercices qui imitent les circonstances réelles.
- Utilisez différents outils et techniques d'analyse de données PySpark aide de PySpark .

Format du cours

- Partie de conférence, partie de discussion, exercices et exercices intensifs
7 hours
Aperçu
Spark SQL est le module Apache Spark permettant de travailler avec des données structurées et non structurées. Spark SQL fournit des informations sur la structure des données ainsi que sur les calculs en cours. Ces informations peuvent être utilisées pour effectuer des optimisations. Les deux utilisations courantes de Spark SQL sont SQL suivantes:
- pour exécuter SQL requêtes SQL .
- lire les données d'une installation Hive existante.

Lors de cette formation en direct animée par un instructeur (sur site ou à distance), les participants apprendront à analyser divers types de jeux de données à l'aide de Spark SQL .

À la fin de cette formation, les participants seront en mesure de:

- Installez et configurez Spark SQL .
- Effectuer une analyse de données à l'aide de Spark SQL .
- Interrogez des ensembles de données dans différents formats.
- Visualisez les données et les résultats de la requête.

Format du cours

- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.

Options de personnalisation du cours

- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
35 hours
Aperçu
MLlib est la bibliothèque d'apprentissage automatique (ML) de Spark. Son objectif est de rendre l'apprentissage pratique pratique évolutif et facile. Il comprend des algorithmes et des utilitaires d'apprentissage courants, notamment la classification, la régression, la mise en cluster, le filtrage collaboratif, la réduction de la dimensionnalité, ainsi que des primitives d'optimisation de niveau inférieur et des API de pipeline de niveau supérieur.

Il se divise en deux paquets:

-

spark.mllib contient l'API d'origine construite sur les RDD.

-

spark.ml fournit des API de niveau supérieur construites à partir de DataFrames pour la construction de pipelines ML.

Public

Ce cours s’adresse aux ingénieurs et aux développeurs qui souhaitent utiliser une bibliothèque de machines intégrée à Apache Spark
Weekend Apache Spark cours, Soir Spark formation, Spark stage d’entraînement, Spark formateur à distance, Spark formateur en ligne, Spark formateur Online, Spark cours en ligne, Spark cours à distance, Apache Spark professeur à distance, Spark visioconférence, Spark stage d’entraînement intensif, Spark formation accélérée, Apache Spark formation intensive, Formation inter Apache Spark, Formation intra Apache Spark, Formation intra Enteprise Apache Spark, Formation inter Entreprise Apache Spark, Weekend Apache Spark formation, Soir Apache Spark cours, Apache Spark coaching, Apache Spark entraînement, Apache Spark préparation, Spark instructeur, Apache Spark professeur, Apache Spark formateur, Spark stage de formation, Apache Spark cours, Spark sur place, Apache Spark formations privées, Spark formation privée, Apache Spark cours particulier, Spark cours particuliers

Réduction spéciale

Newsletter offres spéciales

Nous respectons le caractère privé de votre adresse mail. Nous ne divulguerons ni ne vendrons votre adresse email à quiconque
Vous pouvez toujours modifier vos préférences ou vous désinscrire complètement.

Nos clients

is growing fast!

We are looking to expand our presence in France!

As a Business Development Manager you will:

  • expand business in France
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!