A propos de cette formation

Big data, intelligence artificielle, machine learning, data science, autant d’expressions largement utilisées mais souvent mal comprises. A l’ère du digital, la donnée est pourtant devenue un enjeu crucial qu’il convient de maîtriser, source de valorisations et de plus-values.

Cette formation généraliste vise à démystifier la Data Science et à apporter une vision globale. Au côté des experts Quantmetry, répondez au pourquoi (les grandes définitions), au comment (les technologies et la méthodologie), et au quand (les cas d’usages) de la Data Science.

Objectifs pédagogiques

  • Découvrir l’univers Data Science et les grandes familles de problèmes
  • Savoir modéliser un problème Data Science
  • Constituer la boîte à outils du Data Scientist

Qu'allez-vous apprendre ?

A l’issue de cette formation détaillant l’ensemble des caractéristiques d’un projet de Data Science au moyen d’exemples et de cas d’usage concrets, vous serez en mesure de :

Avoir une vision claire de la Data science et de ses domaines d'application

Comprendre les possibilités et les limites
de la Data Science

Savoir distinguer les différentes étapes d'un projet de Data Science

Connaître les principaux outils de Data Science et savoir quand les utiliser

Prendre de la hauteur et construire une vision globale de vos besoins

Mieux exprimer vos besoins et communiquer
avec des Data Scientists

Le programme de la formation

Une formation d’une journée qui vous explique clairement les l’enjeux et applications potentielles de la Data Science et vous donne les grands principes de la mise en place d’un projet. 

Matin [3h] : Comprendre la Data Science

M1 – Le déluge des données et comment en tirer parti
Détail du contexte actuel, caractérisation de la big-data, ses outils, ses acteurs
1. L’émergence de nouvelles sources de données : présentation et demystification des 5 V du big data
2. Nouvelles solutions face aux nouvelles complexités : calcul distribué, cloud computing et bases de données non structurées
3. Comment les géants industriels d’aujourd’hui se sont créés grâce à l’exploitation des données : les GAFAM, Netflix et autres

M2 – Définitions et cas d’usage métier
Comprendre la datascience par l’exemple
1. Où chercher la donnée : données internes, externes, open data. Comment y accéder grâce aux APIs ou au web scraping
2. Les grandes familles de cas d’usage par ordre croissant de complexité : analyse descriptive, prédictive, prescriptive
3. Les principaux cas d’usage marketing : score d’appétence, tarification, anti-churn
4. Les principaux cas d’usage NLP : Extraction de thème, analyse de sentiment, synthèse automatique, chatbot
5. Recommandation : suggérer le bon produit au bon moment à la bonne personne, “content based” vs “collaborative filtering”.

Après-Midi [4h] : Mise en place d’un projet de Data Science

M1 – De l’analyse statistique au machine learning
Comprendre et choisir un modèle adapté au contexte
1. Définition de Machine Learning, et principales étapes de son évolution
2. Les deux grandes catégories de problèmes : apprentissage supervisé et apprentissage non supervisé
3. Choisir un algorithme adapté : statistique vs algorithmique, compromis performance / intelligibilité, principales classes d’algorithmes
4. Comment mesurer la qualité d’un modèle : Principales métriques de performance, standard ou ad hoc
5. Le problème du sur-apprentissage et comment l’éviter
6. Comment présenter ses résultats : introduction aux principes et aux outils de datavisualisation

M2 – Infrastructures et outils informatiques
Quelles sont aujourd’hui les meilleures technologies ?
1. Points de force et de faiblesse des principaux outils analytiques : python, R, SQL, SAS, DataRobot …
2. Un environnement technologique nouveau adapté aux besoins Big Data : Hadoop, Spark, Hive, Apache …
3. L’architecture data : comment répondre à un ensemble de besoins grâce à une vision plus globale.

M3 – Démarche projet
Apprendre à structurer un projet Data
1. La démarche globale d’un projet big data et les questions à se poser à chaque étape : cadrage / POC / pilote / industrialisation / run
2. Clarification sur les différents rôles dans un projet data, et sur leurs compétences et responsabilités
3. Les réflexes qui aident un projet à avancer dans la bonne direction : agilité, communication, suivi, code review, documentation
4. Les contraintes réglementaires à respecter, l’exemple du RGPD. Définitions, obligations, sanctions prévues.

Vous préférez télécharger ?

Les modalités pédagogiques

RESTE A FAIRE

100% d'exposé

A COMPLETER

60% de pratique

A COMPLETER

Interactive

A COMPLETER.

Remis pédagogiques :  vous repartez avec ...

  • Un book de fiches mémoires résumant les points clés de la formation

Publics et Prérequis

Toute personne souhaitant mieux comprendre les possibilités et les principes de fonctionnement de la Data Science.

Prérequis : Aucun

Cette formation vous plaît ?
Faites la connaitre !
Partager sur linkedin
Partager sur facebook
Partager sur twitter
TARIF H.T.
1 297 €
Intra : Sur devis
Prix par stagiaire. Petit-déjeuner et repas du midi inclus.
VOTRE FORMATEUR
Aurélia

Aurélia

Expert IA / Data

Diplômée de Toulouse School of Economics et Paris Dauphine, avec une spécialisation en économétrie et statistiques, elle a notamment travaillé sur des projets graphes, en lien avec le véhicule connecté, ou encore sur les modèles génératifs.
-
#jiujitsubrésilien
#toulouse
#catlover

PROCHAINE(S) SESSION(S)

29maiToute la journéeInitiation à la Data ScienceParis - Saint Augustin

29junToute la journéeInitiation à la Data ScienceParis - Saint Augustin

Cette formation de l'Institut pourrait également vous intéresser