Formation Cassandra
3 JoursDescription de la formation Cassandra
Cassandra est une base de données distribuée NoSQL connue pour ses capacités à savoir gérer sans défaillance de très grosses quantités de données structurées. Cette formation vous donnera toutes les connaissances nécessaires et l’expérimentation pratique pour mettre en œuvre et administrer Apache Cassandra au quotidien.
Cette formation vous apporte les bases pour mettre en œuvre et administrer Apache Cassandra au quotidien.
Objectifs
Objectifs Opérationnels:
Administrer Apache Cassandra au quotidien.
Objectifs Pédagogiques:
- Maitriser les fonctionnalités principales de Cassandra
- Savoir installer et configurer Cassandra
- Connaitre la notion de grappe au sein de la base de données
À qui s’adresse cette formation ?
Public :
Cette formation s’adresse aux Chefs de projet, gestionnaires de bases de données, et administrateurs qui souhaitent utiliser Apache Cassandra.
Prérequis :
Connaissances générales sur les bases de données.
Contenu du cours Cassandra
Cassandra les fonctionnalités principales
Présentation de l’historique et des fonctionnalités de Cassandra.
Introduction à la licence.
Etude du format des données et “key-value”.
Traitement de volumes importants et haute disponibilité.
Présentation d’un système réparti de base de données.
Installation et configuration de Cassandra
Rappel sur les prérequis.
Présentation des plate-formes supportées.
Etude du fichier de configuration: conf/cassandra.yaml .
Répertoire de travail, de stockage des données, gestion de la mémoire.
Démarrage d’un noeud et test de l’interface cliente cqlsh.
Le CQL
Maitriser les commandes de base: connexion au système de base de données, création de colonnes, insertion, modification recherche.
Le CQL: Cassandra Query Language.
Exécution de scripts.
Comment écrire des requêtes?
Etude des différentes approches.
Gestion de la grappe
Initiation au principe de base.
Préparation du premier noeud : adresse d’écoute.
Configuration de nouveaux noeuds.
Notion de bootstrapping et de token.
Paramètres listen_address et rpc_address.
Réplication : topologie du réseau et EndpointSnitch.
Stratégie de réplication.
Ajout de noeuds, suppression.
Cassandra dans un cloud.
Mise en oeuvre avec OpenStack.
Supervision
OpsCenter: installation, lancement.
Utilisation de base.
Supervision avec nodetool cfstats, ou export JMX vers des outils de supervision comme Nagios.
Exploitation de Cassandra
Maitriser les notions de sauvegarde.
Import/export au format JSON.
Support Hadoop
Présentation du principe de MapReduce.
Implémentation Hadoop.
Maitriser la mise en oeuvre depuis Cassandra.
Support Spark
Description rapide de l’architecture spark.
Mise en oeuvre depuis Cassandra.
Execution de travaux Spark s’appuyant sur une grappe Cassandra.
Travaux Pratiques
De nombreux travaux partiques sont proposés tout au long de la formation