loader image

Gate Training

logo-png
Bases de données

Formation Cassandra Avancé

3 Jours

Description de la formation Cassandra avancé

Cassandra est une base de données distribuée NoSQL connue pour ses capacités à savoir gérer sans défaillance de très grosses quantités de données structurées.

Cette formation explore les fonctionnalités avancées de Cassandra pour vous permettre d’en approfondir votre niveau de maîtrise : mise en place d’un cluster, communication multi-DC, tuning des performances, sécurisation…

Objectifs

Objectifs Opérationnels :

Maîtriser les aspects avancés de la base de données NoSQL Cassandra.

Objectifs Pédagogiques:

  • Savoir mettre en place un cluster Cassandra
  • Connaître le cycle de vie d’une lecture/écriture sur Cassandra
  • Maîtriser les notions de backup, de restauration et de mouvement des données
  • Savoir comment superviser et dépanner Cassandra
  • Connaître l’aspect sécurité de Cassandra

À qui s’adresse cette formation ?

Public :

Ce cours Cassandra avancé s’adresse aux chefs de projet, gestionnaires de bases de données et administrateurs qui souhaitent maîtriser les aspects avancés d’Apache Cassandra

 

Contenu du cours Cassandra avancé

Rappel de l’architecture Cassandra

Cluster / Node / Datacenter / Rack
Réplication / Protocole Gossip
Snitches
Noeuds Seeds
Memtables, SSTables et CommitLogs
Niveau de consistance
Hinted Handoff

Query by Design

Data-Driven versus Query-Driver
Liens entre tables et intégrité référentielle
Duplication de données
Étapes de conception d’un keyspace

Mise en place d’un cluster Cassandra

Choix de mémoire, CPU
Contraintes réseau
Choix du stockage
Configuration du cluster (Datacenter, Rack et autres)
Gestion du cycle de vie du cluster

Cycle de vie d’une lecture/écriture sur Cassandra

Mémoire Off-Heap / JVM-Heap et disque
Comprendre le flush, memtable et commitLog
Chemin d’écriture des données
Chemin de lecture des données
Le Read-repair, Merkel Tree et Anti-Entropy

Communication multi-DC sur Cassandra

Raisons de choix d’une architecture multi-DC
Communication synchrone vs asynchrone entre DCs
Gestion de la défaillance d’un DC
Utilisation des Racks au lieu de Datacenter

Backup, restauration et mouvement des données

Backup incrémental et full
Restauration des données à partir d’un Snapshot
Restauration de données avec sstableLoader
Import/Export des données en masse

Supervision et troubleshooting

Gestion des nœuds d’un cluster
Monitoring avec l’outil nodetool
Configuration et exploitation des logs

Tuning des performances de Cassandra

Utilisation de Tracing pour analyser les performances
Tracer les lectures et les écritures
Tuning des Bloom Filtres
Cache de données
Paramètres globaux de gestion de cache
Tests de montée en charge avec cassandra-stress

Stratégies de compaction

SizeTieredCompactionStrategy
LeveledCompactionStrategy
TimeWindowCompactionStrategy
Tuning de la JVM

Sécurisation de Cassandra

Configuration Authentification
Gestion des rôles
Cryptage de la communication dans Cassandra avec SSL
Activation du cryptage inter-nœuds
Activation du chiffrement client

Réf:

0022

Tarif:

600 Dt

Niveau:

Avancé

Classe à distance:

Possible

Pas de sessions disponibles