L'essentiel

Code(s) NSF

114b : Modèles mathématiques ; Informatique mathématique

326m : Informatique, traitement de l'information

Formacode(s)

31028 : Intelligence artificielle

31026 : Data science

31023 : Gestion données massives

31025 : Analyse de données

11033 : Mathématiques décision

Date d’échéance
de l’enregistrement

26-06-2031

114b : Modèles mathématiques ; Informatique mathématique

326m : Informatique, traitement de l'information

31028 : Intelligence artificielle

31026 : Data science

31023 : Gestion données massives

31025 : Analyse de données

11033 : Mathématiques décision

26-06-2031

Nom légal Siret Nom commercial Site internet
GROUPE DES ECOLES NATIONALES D ECONOMIE ET STATISTIQUE 13001422800089 ENSAE-ENSAI Formation Continue (Cepe) https://www.lecepe.fr/certificats/data-scientist/

Objectifs et contexte de la certification :

La certification « Data Science : prédire et décider avec le machine learning opérationnel », s’inscrit dans un contexte de transformation durable des organisations, caractérisé par la montée en puissance des usages de la donnée et de l’intelligence artificielle dans les processus de décision, d’optimisation et de pilotage. La croissance des volumes de données, leur diversification (données structurées, semi-structurées et non structurées) et les progrès des capacités de calcul ont profondément renouvelé les pratiques analytiques, faisant de la donnée un actif stratégique dans l’ensemble des secteurs d’activité.

Compétences attestées :

Formaliser une problématique data science : analyser un besoin métier et le traduire en problématique de data science en identifiant les objectifs analytiques, les variables d’intérêt et les indicateurs de performance.

Identifier et collecter des données pertinentes : identifier et extraire des données issues de différentes sources (bases SQL, NoSQL, API, web scraping ou open data) afin de constituer un jeu de données exploitable. 

Préparer et mettre en forme les données : nettoyer, structurer et mettre en forme les données dans un format utilisable par les algorithmes (jointure, filtrage, traitement des valeurs manquantes, ventilation des variables qualitatives) afin d'obtenir un jeu de données fiable et exploitable.

Mettre en œuvre un pipeline de traitements de données : concevoir un pipeline de traitement automatisé permettant d’assurer la reproductibilité des opérations de collecte, préparation et transformation des données.

Réaliser une analyse exploratoire des données : explorer un jeu de données à l’aide de statistiques descriptives et de visualisations afin d’identifier les relations entre variables et les structures sous-jacentes.

Mettre en œuvre des modèles de machine learning : développer des modèles de machine learning pour des problèmes de régression ou de classification supervisée.

Évaluer et comparer les modèles : comparer plusieurs modèles prédictifs à l’aide d’indicateurs de performance et de méthodes de validation (validation croisée, échantillon test).

Mettre en œuvre des méthodes avancées d’apprentissage : appliquer des méthodes avancées de machine learning et de deep learning (gradient boosting, SVM, réseaux de neurones) afin de traiter des problématiques complexes.

Industrialiser un projet de machine learning : mettre en œuvre les principes du MLOps pour structurer, déployer et suivre un modèle de machine learning en production.

Restituer et valoriser les résultats d’une analyse : communiquer les résultats d’un projet de data science à des décideurs ou utilisateurs non spécialistes en produisant des visualisations et des synthèses claires.

Modalités d'évaluation :

Études de cas. 

Soutenance orale. 

Références juridiques des règlementations d’activité :

Sans objet

Le cas échant, prérequis à l’entrée en formation :

L’accès à la formation certifiante est conditionné à un niveau de formation équivalent au niveau 7, préférentiellement dans des disciplines telles que les mathématiques, l’informatique, la statistique ou l’économétrie. À défaut, peuvent également être admis des candidats disposant d’une expérience professionnelle avérée et régulière dans le traitement et l’analyse de données. 

Les candidats doivent par ailleurs justifier d’une expérience professionnelle d’au moins trois années. 

Le cas échant, prérequis à la validation de la certification :

Validité des composantes acquises
Voie d’accès à la certification Oui Non Composition des jurys Date de dernière modification
Après un parcours de formation sous statut d’élève ou d’étudiant X - -
En contrat d’apprentissage X - -
Après un parcours de formation continue X

Le Responsable Pédagogique de l'ENSAE-ENSAI Formation Continue en charge du certificat qui en assure la présidence.

2 professionnels du monde de la Data Science, externes à l'ENSAE-ENSAI Formation Continue.

30-06-2026
En contrat de professionnalisation X - -
Par candidature individuelle X - -
Par expérience X - -

Statistiques :

Statistiques
Année d'obtention de la certification Nombre de certifiés Nombre de certifiés par reconnaissance de l'expérience professionnelle
2025 21 -
2024 27 -
2023 20 -
2022 42 -
2021 34 -

Le certificateur n'habilite aucun organisme préparant à la certification

Certification(s) antérieure(s) :

Certification(s) antérieure(s)
Code de la fiche Intitulé de la certification remplacée
RS5602 Data Science : savoir collecter, décrypter, analyser et prédire à partir de mégadonnées

Référentiel d'activité, de compétences et d'évaluation :