Informatique

Présentation Hadoop

Présentation Hadoop

Réf 4-IT-HADO
Durée 2 jours

Objectifs

Découvrir les concepts et les enjeux liés à Hadoop
Comprendre le fonctionnement de la plateforme et de ses composant

Infos

Sessions à venir

09 mar-10 mar 2020
02 jui-03 jui 2020
24 sep-25 sep 2020

Certifications :

Nous consulter

Programme

Introduction à Hadoop

  • Présentation générale d’Hadoop
  • Exemples d’utilisation dans différents secteurs
  • Historique et chiffres clés : Quand parle-t-on de Big Data ?

L'écosystème d'Hadoop

  • Le système de fichier HDFS
  • Le paradigme MapReduce et l’utilisation à travers YARN

Manipulation des données dans un cluster Hadoop

  • Hue : Comment fonctionne cette interface web ?
  • Hive : Pourquoi Hive n’est pas une base de données ?

Requête sur Hive

  • Utilisation de HCatalog
  • Utilisation avancée sur Hive
  • Utilisation de fonctions utilisateurs
  • Paramétrage de requête
  • Pig : Fonctionnement de Pig

Programmation avec Pig Latin

  • Utilisation du mode Local
  • Utilisation de fonctions utilisateurs
  • Tez : Qu’est-ce que Tez ?

Comment et quand l’utiliser ?

  • Oozie : Fonctionnement de Oozie

Création de Workflows avec Oozie

  • Manipulation des workflows
  • Ajout d’éléments d’exploitation dans les workflows
  • Ajout de conditions d’exécution
  • Paramétrage des workflows
  • Sqoop : A quoi sert Sqoop ?

Chargement des données depuis une base de données relationnelle

  • Chargement des données depuis Hadoop
  • Utilisation et paramétrage avancée
  • Les particularités des distributions : Impala, Hawq
  • Quelles sont les bonnes pratiques d’utilisation des différents outils ?

En savoir +

Prérequis

Administrateurs de cluster Hadoop, développeurs, data scientiste
Bonnes connaissances de l'administration Linux

Moyens pédagogiques

Formation avec un formateur, dans une salle dédiée à la formation, équipée d'un vidéoprojecteur, d'un tableau blanc ou à distance dans le cas de solutions de Digital Learning
1 poste de travail par stagiaire adapté aux besoins de la formation + 1 support de cours et/ou un manuel de référence au format numérique ou papier
Modalités pédagogiques : Exposés – Cas pratiques – Synthèse

Possibilité de certification

Nous consulter.