Formation Cassandra Avancé
3 JoursDescription de la formation Cassandra avancé
Cassandra est une base de données distribuée NoSQL connue pour ses capacités à savoir gérer sans défaillance de très grosses quantités de données structurées.
Cette formation explore les fonctionnalités avancées de Cassandra pour vous permettre d’en approfondir votre niveau de maîtrise : mise en place d’un cluster, communication multi-DC, tuning des performances, sécurisation…
Objectifs
Objectifs Opérationnels :
Maîtriser les aspects avancés de la base de données NoSQL Cassandra.
Objectifs Pédagogiques:
- Savoir mettre en place un cluster Cassandra
- Connaître le cycle de vie d’une lecture/écriture sur Cassandra
- Maîtriser les notions de backup, de restauration et de mouvement des données
- Savoir comment superviser et dépanner Cassandra
- Connaître l’aspect sécurité de Cassandra
À qui s’adresse cette formation ?
Public :
Ce cours Cassandra avancé s’adresse aux chefs de projet, gestionnaires de bases de données et administrateurs qui souhaitent maîtriser les aspects avancés d’Apache Cassandra
Contenu du cours Cassandra avancé
Rappel de l’architecture Cassandra
Cluster / Node / Datacenter / Rack
Réplication / Protocole Gossip
Snitches
Noeuds Seeds
Memtables, SSTables et CommitLogs
Niveau de consistance
Hinted Handoff
Query by Design
Data-Driven versus Query-Driver
Liens entre tables et intégrité référentielle
Duplication de données
Étapes de conception d’un keyspace
Mise en place d’un cluster Cassandra
Choix de mémoire, CPU
Contraintes réseau
Choix du stockage
Configuration du cluster (Datacenter, Rack et autres)
Gestion du cycle de vie du cluster
Cycle de vie d’une lecture/écriture sur Cassandra
Mémoire Off-Heap / JVM-Heap et disque
Comprendre le flush, memtable et commitLog
Chemin d’écriture des données
Chemin de lecture des données
Le Read-repair, Merkel Tree et Anti-Entropy
Communication multi-DC sur Cassandra
Raisons de choix d’une architecture multi-DC
Communication synchrone vs asynchrone entre DCs
Gestion de la défaillance d’un DC
Utilisation des Racks au lieu de Datacenter
Backup, restauration et mouvement des données
Backup incrémental et full
Restauration des données à partir d’un Snapshot
Restauration de données avec sstableLoader
Import/Export des données en masse
Supervision et troubleshooting
Gestion des nœuds d’un cluster
Monitoring avec l’outil nodetool
Configuration et exploitation des logs
Tuning des performances de Cassandra
Utilisation de Tracing pour analyser les performances
Tracer les lectures et les écritures
Tuning des Bloom Filtres
Cache de données
Paramètres globaux de gestion de cache
Tests de montée en charge avec cassandra-stress
Stratégies de compaction
SizeTieredCompactionStrategy
LeveledCompactionStrategy
TimeWindowCompactionStrategy
Tuning de la JVM
Sécurisation de Cassandra
Configuration Authentification
Gestion des rôles
Cryptage de la communication dans Cassandra avec SSL
Activation du cryptage inter-nœuds
Activation du chiffrement client
0022
600 Dt
Avancé
Possible