Formation Big Data, introduction à la plateforme Hadoop et à son écosystème
E-learning
100% à distance
- Programme
- Participants / Prérequis
Cette vidéo a pour objectif de vous présenter le Big Data en général et plus spécifiquement la plateforme Hadoop et ses concepts clés, afin de comprendre son fonctionnement et ses possibilités. Après avoir défini les notions de NoSQL et de Big Data, nous lancerons l'installation d'un environnement Hadoop. Celui-ci étant complexe et composé de nombreuses couches, nous utiliserons les distributions Hadoop comme Hortonworks, MapR et Cloudera. Puis, nous introduirons le paradigme Map Reduce qui permettra de réaliser des algorithmes de calcul distribué. Nous l'illustrerons par un exemple simple en Java. Nous détaillerons, ensuite, les concepts principaux autour du stockage et du traitement des données dans Hadoop. Nous les mettrons en pratique par des exemples simples illustrant la théorie. Enfin, nous terminerons en étudiant une collection d'outils basés sur Hadoop et leurs différentes possibilités et utilités. Nous évoquerons entre autres la base NoSQL d'Hadoop : HBase, les outils de traitement Pig, Hive et Spark.









