A propos de cette formation
Python est l’outil le plus populaire en data science et à juste raison : sa simplicité, sa polyvalence, et sa communauté en font un language pratique pour toutes les entreprises ayant vocation à mettre en valeur leurs données.
Guidé par un expert Quantmetry enseignant expérimenté, devenez opérationnel en 2 jours : installez votre écosystème de travail, sachez exploiter les librairies datas clés et commencez à manipuler efficacement vos premiers jeux de données.
Objectifs pédagogiques
- Connaître les bases du langage python
- Concevoir des algorithmes performants
- Manipuler efficacement vos jeux de données
Qu'allez-vous apprendre ?
A l’issue de cette formation pratique et opérationnelle, portée par l’échange autour d’exemples et de cas d’usages vous serez en mesure de :
Maîtriser les bases de la programmation
avec Python
Mettre en place un espace de travail professionnel et sécurisé
Utiliser les librairies datas : numpy, pandas, matplotlib, scikitlearn
Importer , explorer et restituer graphiquement des données
Utiliser efficacement un algorithme de machine learning
Manipuler de larges flux et volume de données
avec pySpark
Le programme de la formation
Une formation sur 2 jours (2 x 7 heures) avec un parcours d’apprentissage clair et progressif dont l’objectif est de vous rendre rapidement Nous veillons à ne pas vous perdre en chemin et faciliter la mémorisation des connaissances dont vous avez besoin pour avancer.
Consulter le programme du JOUR 1
Matin [3h] : Pourquoi et comment utiliser python
M1 – Introduction et environnement de travail
Histoire et mise en place d’un espace de travail
1. Histoire et écosystème python, principaux avantages du langage : open source, modules spécifiques, communauté
2. L’environnement python : dans quels cas et comment utiliser anaconda, ipython, l’IDE spyder, les jupyter notebooks.
3. Bonnes pratiques de développement en python : modularité, versionnage du code, documentation
M2 – Les bases du langage
Maîtrise des fondamentaux
1. Le rôle de l’indentation dans la définition des blocs de code
2. Les différentes manières d’importer une fonction d’un module externe : avantages et inconvénients
3. La gestion des erreurs : comment les interpréter, comment les intégrer dans la logique du code (try/except)
4. Les types d’objets et leurs spécificités : numériques, chaînes de caractères, listes, dictionnaires
Exercices pratiques
Après-Midi [4h] : Opérateurs de contrôle et fonctions
M1 – Les opérateurs de contrôle
Boucles, itérations, exécutions conditionnelles
1. Comment contrôler l’exécution d’un code grâce aux instructions if / elif / else
2. Les boucles d’itération : for, while et comment les utiliser. Comment sortir d’une boucle grâce aux instructions break et continue
3. La list comprehension, une manière synthétique et flexible de créer une nouvelle liste
Exercices pratiques
M2 – Les fonctions
Rendre son code plus modulaire
1. Définition et instanciation d’une fonction, et ses éléments clés : nom, paramètres, corps de la fonction, output
2. Le concept de portée des variables (locale vs. globale). La portée locale des variables utilisées dans une fonction
3. Paramètres avec ou sans valeur par défaut : intégration dans une fonction, respect des contraintes, appellation des fonctions
4. Un concept utile en cas de traitement ad hoc : les fonctions anonymes et leur usage
Exercices pratiques
Consulter le programme du JOUR 2
Matin [3h] : Programmation orientée objet et bibliothèques principales
M1 – Modules, classes, bibliothèques
Vers des utilisations plus avancées de python
1. Définition et usage d’un module. Comment le construire, l’importer, l’utiliser
2. Définition et usage d’une classe. Attributs et fonctions. La notion d’héritage.
3. Les principales bibliothèques à connaitre : numpy, scipy, datetime, pandas, scikit-learn
M1 – Data visualisation
L’art de mettre les données et leurs interactions en valeur
1. Packages pour la visualisation (matplotlib, seaborn, plotly…) : principes et exemples d’utilisation
2. Exemples de représentations statiques ou dynamiques : comment trouver inspiration dans les galleries en ligne
3. Construire un dashboard à partir d’un code python : introduction à Dash
Après-Midi [4h] : Hands-on pour mettre en pratique les connaissances acquises
M1 – Importer, traiter, visualiser une base de donnée
Les premières étapes d’un projet data
1. Exploration d’un dataset, fréquence et distribution des valeurs, premières visualisation
2. Feature engineering : binning de variables continues, extraction d’information de chaînes de caractères, mélange de variables
3. Gestion des valeurs manquantes : les méthodes fill_forward, fill_backward, et autres techniques plus avancées
M2 – Introduction au ML en Python
Notre premier modèle d’apprentissage supervisé
1. Les grands principes du Machine Learning : apprentissage supervisé ou non supervisé, régression vs classification
2. Echantillonnage des données, entraînement des modèles. Le problème de l’overfit et comment l’éviter
3. Prédictions des valeurs cibles, calcul des métriques de performance, comparaisons entre différents modèles
4. Identification d’axes d’amélioration
Modalités d’évaluation d’atteinte des objectifs de la formation
• QCM d’évaluation pour valider l’acquisition des connaissances et l’atteinte des objectifs de chaque formation
Modalités et délais d’accès
Les inscriptions ont lieu au travers du processus d’admission suivant :
• Une qualification de besoin recueillie avec le client
• Qualification des profils en ateliers avec le formateur et le client
Le délai d’accès à la formation est de 11 jours ouvré avant le premier jour de la formation.
Accessibilité aux personnes en situation de handicap
Nous contacter en cas de besoin d’accessibilité particulier pour un participant.
Coordonnées du référent handicap : Mathylde Vilain - mvilain@quantmetry.com
Les modalités pédagogiques
Une formation qui se veut « Hands-on » avec 30% de pratique et nous espérons beaucoup d’échanges constructifs entre vous et avec nous.
70% d'exposé
Un cours synthétique de programmation avec Python dispensé par un véritable pédagogue
30% de pratique
Un passage rapide à la pratique avec de multiples exercices et la revue en profondeur du code
Interactive
Echangez avec le groupe et votre formateur expert sur vos problématiques et trouvez des réponses
Remis pédagogiques : vous repartez avec ...
- Un book de fiches mémoires résumant les points clés de la formation
- L'ensemble des codes présentés lors de la séance
Publics et Prérequis
Toute personne ayant un profil technique souhaitant devenir rapidement opérationnel en Data Science avec Python.
Prérequis : Aucun


