A propos de cette formation
Le cours de la formation « Adminitstrateur CDP Private Cloud » à la demande fournit les connaissances fondamentales nécessaires pour effectuer les tâches de planification, d’approvisionnement, de configuration, de surveillance et de gestion requises d’un administrateur pour la Cloudera Data Platform (CDP) en tant que déploiement bare metal ou en tant que déploiement en Private Cloud.
Objectifs pédagogiques
- Connaitre la plateforme CDP
- Gérer un portefeuille de projets data science
Qu'allez-vous apprendre ?
A l’issue de cette formation détaillant l’ensemble des caractéristiques d’un projet de Data Science à l’aide d’exercices interactifs, vous serez en mesure de :
Utilisez Cloudera Manager pour installer un cluster CDP Private Cloud Base.
Installer Cloudera Manager
Configurer et surveiller le cluster à l'aide de Cloudera Manager
Optimiser
les performances
des clusters
Contrôler et
mesurer la
performance projet
Effectuer les tâches de maintenance de routine du cluster
Le programme de la formation
Consulter le programme du JOUR 1
Matin [3h]
M1 – Qu’est-ce que Cloudera CDP ?
1. Cloudera CDP : Pourquoi et comment gérer cet asset ?
2. Hands-On Exercise
M2 – CDP Private Cloud Base Installation
1. Installation Overview
2. Cloudera Manager Installation
3. Hands-On Exercise: Installing Cloudera Manager Server
Après-Midi [4h]
M1 – CDP Private Cloud Base Installation
1. CDP Runtime Overview
2. Hands-On Exercise: Cluster Installation
M2 – Cluster Configuration
1. Overview et configuration
2. Modifying Service Configurations
3. Configuration Files
4. Managing Role Instances
5. Adding New Services, adding and Removing Hosts
6. Identifier les besoins et le type de données à traiter avec les métiers (use cases)
7. Exemple de cas d’usages classiques Data
8. Retour d’expérience sur quelques cas déjà instruits chez Quantmetry
9. Expression de besoin d’un use case data (Cadrage du besoin avec la méthode SMART)
M3 – Cluster Configuration – HANDS-ON
1. Configuring a Hadoop Cluster
Consulter le programme du JOUR 2
Matin [3h]
M1 – Data Storage
1. HDFS Topology and Roles
2. HDFS Performance and Fault Tolerance
3. HDFS and Hadoop Security Overview
4. Working with HDFS
5. HBase Overview
6. Kudu Overview
7. Cloud Storage Overview
M2 – Hands-On Exercise
1. Working with HDFS
2. Storing Data in Amazon S3
Après-Midi [4h]
M1 – Data Ingest Part 1
1. Data Ingest Overview
2. File Formats
3. Ingesting Data using File Transfer or REST Interfaces
4. Importing Data from Relational Databases with Apache Sqoop
5. Hands-On Exercise: Importing Data Using Sqoop
M2 – Data Ingest Part 2
1. Ingesting Data Using NiFi
2. Instructor-Led Demonstration: NiFi User Interface
3. Best Practices for Importing Data
4. Hands-On Exercise: NiFi Verification
Consulter le programme du JOUR 3
Matin [3h]
M1 – Data Compute Part 1
1. YARN Overview
2. Running Applications on YARN
3. Viewing YARN Applications
4. YARN Application Logs
5. MapReduce Applications
6. YARN Memory and CPU Settings
7. Hands-On Exercise
M2 – Data Compute Part 2
1. Hive on Tez
2. ACID for Hive
3. Spark Overview
4. How Spark Applications Run on YARN
5. Monitoring Spark Applications
6. Phoenix Overview
7. Hands-On Exercise
Après-Midi [4h]
M1 – Managing Resources
1. Managing Resources Overview
2. Node Labels
3. Configuring cgroups
4. The Capacity Scheduler
5. Managing Queues
6. Impala Query Scheduling
7. Hands-On Exercise
M2 – Planning Your Cluster
1. IGeneral Planning Considerations
2. Choosing the Right Hardware
3. Network Considerations
4. CDP Private Cloud Considerations
5. Configuring Nodes
Consulter le programme du JOUR 4
Matin [3h]
M1 – Advanced Cluster Configuration
1. Configuring Service Ports
2. Tuning HDFS and MapReduce
3. Managing Cluster Growth
4. Erasure Coding
5. Enabling High Availability for HDFS and YARN
6. Hands on
M2 – Cluster Maintenance
1. Checking HDFS Status
2. Copying Data Between Clusters
3. Rebalancing Data in HDFS
4. HDFS Directory Snapshots
5. Hands on
Après-Midi [4h]
M1 – Cluster Upgrade
1. Host Maintenance
2. Upgrading a Cluster using CM
M2 – Cluster Monitoring
1. Cloudera Manager Monitoring Features
2. Health Tests
3. Hands-On Exercise: Breaking the Cluster
4. Events and Alerts
5. Charts and Reports
6. Monitoring Recommendations
7. Hands-On Exercise: Confirm Cluster Healing and Configuring Email Alerts
Consulter le programme du JOUR 5
Matin [3h]
M1 – Cluster Troubleshooting
1. Overview
2. Troubleshooting Tools
3. Completed
4. Misconfiguration Examples
M2 – Security
1. Data Governance with SDX
2. Hadoop Security Concepts
3. Hadoop Authentication Using Kerberos
4. Hadoop Authorization
5. Hadoop Encryption
6. CM autotls
7. Securing a Hadoop Cluster
8. Apache Ranger
9. Apache Atlas
10. Backup and Recovery
Après-Midi [4h]
M1 – CDP Private Cloud Base Installation
1. CDP Overview
2. Private Cloud Capabilities
3. Public Cloud Capabilities
4. What Is Kubernetes?
5. Workload XM Overview
6. Auto-scaling
M2 – Quizz test
Les modalités pédagogiques
RESTE A FAIRE
100% d'exposé
A COMPLETER
60% de pratique
A COMPLETER
Interactive
A COMPLETER.
Remis pédagogiques : vous repartez avec ...
- Un book de fiches mémoires résumant les points clés de la formation
Publics et Prérequis
Aux administrateurs de systèmes qui ont une expérience de base de Linux. Il n’est pas nécessaire d’avoir une connaissance préalable de la plateforme CDP, ni des plateformes antérieures telles que CDH de Cloudera ou Hortonworks HDP.
Prérequis : Aucun



Cette formation vous plaît ?
Faites la connaitre !

Aurélia
Expert IA / Data
Diplômée de Toulouse School of Economics et Paris Dauphine, avec
une spécialisation en économétrie et statistiques, elle a notamment travaillé sur des projets graphes, en lien avec le véhicule connecté, ou encore sur les modèles génératifs.
-
#jiujitsubrésilien
#toulouse
#catlover
Aucune formation