Dernière mise à jour : 09/10/2024
Cette formation vous fournira une solide introduction technique à l'architecture Spark et au fonctionnement de Spark. Vous apprendrez les éléments de base de Spark, notamment les RDD et le moteur de calcul distribué, ainsi que les constructions de niveau supérieur, qui fournissent une interface plus simple et plus performante, notamment Spark SQL et DataFrames.
Vous verrez également des capacités plus avancées telles que l'utilisation de Spark Streaming pour traiter les données en continu, et aurez un aperçu du traitement graphique Spark (GraphX et GraphFrames) et du Machine Learning Spark (SparkML Pipelines).
Enfin, vous explorerez les éventuels problèmes de performance, le dépannage, les techniques de déploiement de grappes et les stratégies d'optimisation.
La montée en puissance de Scala
Introduction à Spark
Les RDD et l'architecture Spark
DataSets/DataFrames et Spark SQL
Créer des applications Spark
Spark Streaming
Caractéristiques et optimisation des performances
Aperçu de Spark GraphX
Aperçu de MLLib
Conclusion
Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :
En amont de la formation
Tout au long de la formation
A la fin de la formation