Hadoop – Infrastructure sécurisée
25 HeuresFormation Hadoop – Infrastructure sécurisée
Objectifs de la formation Hadoop Sécurité
L’augmentation du volume de données structurées et non structurées au sein des grandes entreprises, et la volonté des entreprises d’utiliser ces données, sont les principaux facteurs de la croissance du marché de la plateforme de traitements distribués. Le framework Hadoop répond à ces attentes. Mais comment faire pour sécuriser son infrastructure ? Cette formation vous apprendra à penser et à appliquer la sécurisation Hadoop sur tous ses aspects, des accès aux données.
À l’issue de cette formation Hadoop Sécurité, vous saurez notammment :
- Comprendre les mécanismes de sécurité Hadoop
- Les mettre en œuvre
À qui s’adresse cette formation ?
Public :
Ce cours Hadoop sécurité intéressera les chefs de projet, administrateurs et plus globalement toute personne souhaitant sécuriser une infrastructure Hadoop.
Prérequis :
Pour suivre cette formation sur la sécurité avec Hadoop, il est nécessaire de connaître les principes de base d’Hadoop et des bases de données.
Contenu du cours Développement Hadoop
Introduction
- Rappels rapides sur l’ecosystème Hadoop
- Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
- Les risques et points à sécuriser dans un système distribué et plus particulièrement avec Hadoop
Architecture : la sécurité Hadoop
- Sécurisation réseau
- Système d’exploitation
- Les rôles Hadoop
- Stratégies
Kerberos
Principe de fonctionnement
Travaux Pratiques :
Kerberisation d’une grappe Hadoop
Sécurité des accès
Authentification, autorisations, accounting
Travaux Pratiques :
- Gestion des autorisations dans HDFS, YARN, HBase…
- Mise en œuvre des ACLs dans Zookeeper
Apache Sentry
- Présentation du projet, architecture : sentry server, sentry plugin
- Gestion de l’authentification et des droits d’accès aux données
Travaux Pratiques :
Intégration avec Hadoop
Sécurité des données (Sécurité Hadoop)
- Cryptage des données stockées – Cryptage des données en transit
- Mécanisme de sécurité des données en entrée et en consultation par des accès clients: interface Hadoop en ligne de commande, sqoop, oozie, HBase, webHDFS, httpFS