L'essentiel
Code(s) NSF
114b : Modèles mathématiques ; Informatique mathématique
326m : Informatique, traitement de l'information
Formacode(s)
31028 : Intelligence artificielle
31026 : Data science
31023 : Gestion données massives
31025 : Analyse de données
11033 : Mathématiques décision
Date d’échéance
de l’enregistrement
26-06-2031
| Nom légal | Siret | Nom commercial | Site internet |
|---|---|---|---|
| GROUPE DES ECOLES NATIONALES D ECONOMIE ET STATISTIQUE | 13001422800089 | ENSAE-ENSAI Formation Continue (Cepe) | https://www.lecepe.fr/certificats/data-scientist/ |
Objectifs et contexte de la certification :
La certification « Data Science : prédire et décider avec le machine learning opérationnel », s’inscrit dans un contexte de transformation durable des organisations, caractérisé par la montée en puissance des usages de la donnée et de l’intelligence artificielle dans les processus de décision, d’optimisation et de pilotage. La croissance des volumes de données, leur diversification (données structurées, semi-structurées et non structurées) et les progrès des capacités de calcul ont profondément renouvelé les pratiques analytiques, faisant de la donnée un actif stratégique dans l’ensemble des secteurs d’activité.
Compétences attestées :
Formaliser une problématique data science : analyser un besoin métier et le traduire en problématique de data science en identifiant les objectifs analytiques, les variables d’intérêt et les indicateurs de performance.
Identifier et collecter des données pertinentes : identifier et extraire des données issues de différentes sources (bases SQL, NoSQL, API, web scraping ou open data) afin de constituer un jeu de données exploitable.
Préparer et mettre en forme les données : nettoyer, structurer et mettre en forme les données dans un format utilisable par les algorithmes (jointure, filtrage, traitement des valeurs manquantes, ventilation des variables qualitatives) afin d'obtenir un jeu de données fiable et exploitable.
Mettre en œuvre un pipeline de traitements de données : concevoir un pipeline de traitement automatisé permettant d’assurer la reproductibilité des opérations de collecte, préparation et transformation des données.
Réaliser une analyse exploratoire des données : explorer un jeu de données à l’aide de statistiques descriptives et de visualisations afin d’identifier les relations entre variables et les structures sous-jacentes.
Mettre en œuvre des modèles de machine learning : développer des modèles de machine learning pour des problèmes de régression ou de classification supervisée.
Évaluer et comparer les modèles : comparer plusieurs modèles prédictifs à l’aide d’indicateurs de performance et de méthodes de validation (validation croisée, échantillon test).
Mettre en œuvre des méthodes avancées d’apprentissage : appliquer des méthodes avancées de machine learning et de deep learning (gradient boosting, SVM, réseaux de neurones) afin de traiter des problématiques complexes.
Industrialiser un projet de machine learning : mettre en œuvre les principes du MLOps pour structurer, déployer et suivre un modèle de machine learning en production.
Restituer et valoriser les résultats d’une analyse : communiquer les résultats d’un projet de data science à des décideurs ou utilisateurs non spécialistes en produisant des visualisations et des synthèses claires.
Modalités d'évaluation :
Études de cas.
Soutenance orale.
Références juridiques des règlementations d’activité :
Sans objet
Le cas échant, prérequis à l’entrée en formation :
L’accès à la formation certifiante est conditionné à un niveau de formation équivalent au niveau 7, préférentiellement dans des disciplines telles que les mathématiques, l’informatique, la statistique ou l’économétrie. À défaut, peuvent également être admis des candidats disposant d’une expérience professionnelle avérée et régulière dans le traitement et l’analyse de données.
Les candidats doivent par ailleurs justifier d’une expérience professionnelle d’au moins trois années.
Le cas échant, prérequis à la validation de la certification :
| Voie d’accès à la certification | Oui | Non | Composition des jurys | Date de dernière modification |
|---|---|---|---|---|
| Après un parcours de formation sous statut d’élève ou d’étudiant | X | - | - | |
| En contrat d’apprentissage | X | - | - | |
| Après un parcours de formation continue | X |
Le Responsable Pédagogique de l'ENSAE-ENSAI Formation Continue en charge du certificat qui en assure la présidence. 2 professionnels du monde de la Data Science, externes à l'ENSAE-ENSAI Formation Continue. |
30-06-2026 | |
| En contrat de professionnalisation | X | - | - | |
| Par candidature individuelle | X | - | - | |
| Par expérience | X | - | - |
Aucune correspondance
Date du dernier Journal Officiel ou Bulletin Officiel :
24-11-2021
| Date de décision | 26-06-2026 |
|---|---|
| Durée de l'enregistrement en années | 5 |
| Date d'échéance de l'enregistrement | 26-06-2031 |
| Date de dernière délivrance possible de la certification | 26-12-2031 |
Statistiques :
| Année d'obtention de la certification | Nombre de certifiés | Nombre de certifiés par reconnaissance de l'expérience professionnelle |
|---|---|---|
| 2025 | 21 | - |
| 2024 | 27 | - |
| 2023 | 20 | - |
| 2022 | 42 | - |
| 2021 | 34 | - |
Le certificateur n'habilite aucun organisme préparant à la certification
Certification(s) antérieure(s) :
| Code de la fiche | Intitulé de la certification remplacée |
|---|---|
| RS5602 | Data Science : savoir collecter, décrypter, analyser et prédire à partir de mégadonnées |