A propos de cette formation
Big data, intelligence artificielle, machine learning, data science, autant d’expressions largement utilisées mais souvent mal comprises. A l’ère du digital, la donnée est pourtant devenue un enjeu crucial qu’il convient de maîtriser, source de valorisations et de plus-values.
Cette formation généraliste vise à démystifier la Data Science et à apporter une vision globale. Au côté des experts Quantmetry, répondez au pourquoi (les grandes définitions), au comment (les technologies et la méthodologie), et au quand (les cas d’usages) de la Data Science.
Objectifs pédagogiques
- Découvrir l’univers Data Science et les grandes familles de problèmes
- Savoir modéliser un problème Data Science
- Constituer la boîte à outils du Data Scientist
Qu'allez-vous apprendre ?
A l’issue de cette formation détaillant l’ensemble des caractéristiques d’un projet de Data Science au moyen d’exemples et de cas d’usage concrets, vous serez en mesure de :
Avoir une vision claire de la Data science et de ses domaines d'application
Comprendre les possibilités et les limites
de la Data Science
Savoir distinguer les différentes étapes d'un projet de Data Science
Connaître les principaux outils de Data Science et savoir quand les utiliser
Prendre de la hauteur et construire une vision globale de vos besoins
Mieux exprimer vos besoins et communiquer
avec des Data Scientists
Le programme de la formation
Une formation d’une journée qui vous explique clairement les l’enjeux et applications potentielles de la Data Science et vous donne les grands principes de la mise en place d’un projet.
Consulter le programme
Matin [3h] : Comprendre la Data Science
M1 – Le déluge des données et comment en tirer parti
Détail du contexte actuel, caractérisation de la big-data, ses outils, ses acteurs
1. L’émergence de nouvelles sources de données : présentation et demystification des 5 V du big data
2. Nouvelles solutions face aux nouvelles complexités : calcul distribué, cloud computing et bases de données non structurées
3. Comment les géants industriels d’aujourd’hui se sont créés grâce à l’exploitation des données : les GAFAM, Netflix et autres
M2 – Définitions et cas d’usage métier
Comprendre la datascience par l’exemple
1. Où chercher la donnée : données internes, externes, open data. Comment y accéder grâce aux APIs ou au web scraping
2. Les grandes familles de cas d’usage par ordre croissant de complexité : analyse descriptive, prédictive, prescriptive
3. Les principaux cas d’usage marketing : score d’appétence, tarification, anti-churn
4. Les principaux cas d’usage NLP : Extraction de thème, analyse de sentiment, synthèse automatique, chatbot
5. Recommandation : suggérer le bon produit au bon moment à la bonne personne, “content based” vs “collaborative filtering”.
Après-Midi [4h] : Mise en place d’un projet de Data Science
M1 – De l’analyse statistique au machine learning
Comprendre et choisir un modèle adapté au contexte
1. Définition de Machine Learning, et principales étapes de son évolution
2. Les deux grandes catégories de problèmes : apprentissage supervisé et apprentissage non supervisé
3. Choisir un algorithme adapté : statistique vs algorithmique, compromis performance / intelligibilité, principales classes d’algorithmes
4. Comment mesurer la qualité d’un modèle : Principales métriques de performance, standard ou ad hoc
5. Le problème du sur-apprentissage et comment l’éviter
6. Comment présenter ses résultats : introduction aux principes et aux outils de datavisualisation
M2 – Infrastructures et outils informatiques
Quelles sont aujourd’hui les meilleures technologies ?
1. Points de force et de faiblesse des principaux outils analytiques : python, R, SQL, SAS, DataRobot …
2. Un environnement technologique nouveau adapté aux besoins Big Data : Hadoop, Spark, Hive, Apache …
3. L’architecture data : comment répondre à un ensemble de besoins grâce à une vision plus globale.
M3 – Démarche projet
Apprendre à structurer un projet Data
1. La démarche globale d’un projet big data et les questions à se poser à chaque étape : cadrage / POC / pilote / industrialisation / run
2. Clarification sur les différents rôles dans un projet data, et sur leurs compétences et responsabilités
3. Les réflexes qui aident un projet à avancer dans la bonne direction : agilité, communication, suivi, code review, documentation
4. Les contraintes réglementaires à respecter, l’exemple du RGPD. Définitions, obligations, sanctions prévues.
Les modalités pédagogiques
RESTE A FAIRE
100% d'exposé
A COMPLETER
60% de pratique
A COMPLETER
Interactive
A COMPLETER.
Remis pédagogiques : vous repartez avec ...
- Un book de fiches mémoires résumant les points clés de la formation
Modalités d’évaluation d’atteinte des objectifs de la formation
• QCM d’évaluation pour valider l’acquisition des connaissances et l’atteinte des objectifs de chaque formation
Modalités et délais d’accès
Les inscriptions ont lieu au travers du processus d’admission suivant :
• Une qualification de besoin recueillie avec le client
• Qualification des profils en ateliers avec le formateur et le client
Le délai d’accès à la formation est de 11 jours ouvré avant le premier jour de la formation.
Accessibilité aux personnes en situation de handicap
Nous contacter en cas de besoin d’accessibilité particulier pour un participant.
Coordonnées du référent handicap : Mathylde Vilain - mvilain@quantmetry.com
Publics et Prérequis
Toute personne souhaitant mieux comprendre les possibilités et les principes de fonctionnement de la Data Science.
Prérequis : Aucun



Cette formation vous plaît ?
Faites la connaitre !

Aurélia
Expert IA / Data
Diplômée de Toulouse School of Economics et Paris Dauphine, avec
une spécialisation en économétrie et statistiques, elle a notamment travaillé sur des projets graphes, en lien avec le véhicule connecté, ou encore sur les modèles génératifs.
-
#jiujitsubrésilien
#toulouse
#catlover