L'essentiel

Nomenclature
du niveau de qualification

Niveau 7

Code(s) NSF

114b : Modèles mathématiques ; Informatique mathématique

326 : Informatique, traitement de l'information, réseaux de transmission

Formacode(s)

31026 : Data science

Date d’échéance
de l’enregistrement

26-06-2031

Niveau 7

114b : Modèles mathématiques ; Informatique mathématique

326 : Informatique, traitement de l'information, réseaux de transmission

31026 : Data science

26-06-2031

Nom légal Siret Nom commercial Site internet
GROUPE DES ECOLES NATIONALES D ECONOMIE ET STATISTIQUE 13001422800089 ENSAE https://www.ensae.fr/

Objectifs et contexte de la certification :

La statistique — ou les statistiques — est une discipline qui analyse les phénomènes à partir de la collecte des données, de leur traitement, de leur analyse, puis de l’interprétation et de la restitution des résultats, afin de les rendre accessibles et compréhensibles au plus grand nombre. Dans le monde professionnel contemporain, cette démarche s’incarne principalement dans le métier de data scientist, aux côtés d’autres experts de la statistique : un expert qui mobilise ses compétences en collecte, traitement, analyse, interprétation et valorisation des données au service du développement des entreprises et des organisations.  

Egalement doté de compétences spécifiques en modélisation quantitative, le titulaire de la certification "Data scientist en modélisation décisionnelle (MS)" accompagne la prise de décision stratégique aussi bien dans le secteur privé que public.

Activités visées :

Analyse du besoin et cadrage d’un projet d’analyse de données et/ou de modélisation statistique 

Analyse exploratoire et descriptive de données dans une logique d’aide à la décision 

Conception méthodologique et construction d’un modèle statistique ou mathématique à partir d’une problématique métier 

Estimation, évaluation et validation d’un modèle statistique ou mathématique 

Communication et restitution d'analyse et de recommandations pour aider à la prise de décision ou à l’intégration d’un modèle statistique ou mathématique 

Management d’équipe et de projets d'analyse de données en environnement pluridisciplinaire 

Intégration opérationnelle du modèle et accompagnement de sa mise en œuvre dans les processus métiers 

Compétences attestées :

Définir des indicateurs d’analyse statistique pertinents en fonction des objectifs de l’étude, des spécificités des données disponibles et des attentes du commanditaire afin de fournir des mesures fiables, compréhensibles et utiles pour la prise de décision.

Interpréter les distributions statistiques, les tendances et les anomalies en mobilisant des méthodes statistiques descriptives avancées, des outils numériques et des représentations graphiques adaptées afin de formuler des diagnostics clairs et étayés contribuant à la compréhension d’un phénomène.

Analyser un cas d’usage pour en extraire les variables clés et comprendre les mécanismes sous-jacents, en mobilisant l’analyse exploratoire et les modèles concurrents et en formulant des hypothèses de travail testables sous forme statistique ou algorithmique en anticipant les contraintes opérationnelles, techniques et éthiques afin de construire un modèle adapté.

Définir un cadre méthodologique rigoureux pour la modélisation en sélectionnant les modèles ou la famille de modèles statistiques en fonction du contexte métier, des caractéristiques des données et des contraintes de l’organisation en lien avec les standards professionnels pour permettre la mise en œuvre d’un modèle fiable, transparent et conforme aux attentes métiers, et garantir leur exploitabilité et leur appropriation par les utilisateurs finaux.

Formaliser mathématiquement ou algorithmiquement les hypothèses définies en amont dans un projet de modélisation, en retenant les variables sélectionnées, en traduisant les relations supposées entre variables en équations ou en code, et en documentant le raisonnement et les choix méthodologiques, afin de construire un modèle cohérent, traçable et exploitable.

Concevoir un outil ou un algorithme mobilisant des bibliothèques et outils avancés pour répondre à une problématique de traitement, d’analyse ou de visualisation de données en utilisant des langages de programmation adaptés à la data science ou à l’ingénierie des données.

Estimer les paramètres du modèle en mobilisant des outils techniques avancés et en les ajustant au jeu de données afin qu’il puisse prédire, expliquer ou représenter au mieux le phénomène étudié.

Contrôler la qualité et la robustesse du modèle et de l’algorithme associé à l’aide de tests statistiques, face à l’incertitude et aux cas extrêmes, afin d’utiliser le modèle en étant conscient de sa performance.

Détecter les biais, notamment discriminatoires, les incohérences et les erreurs de performance d’un modèle statistique, mathématique ou de machine learning, en mobilisant des méthodes de validation adaptées, afin d’évaluer son équité, sa robustesse et sa pertinence pour la problématique métier traitée et de corriger d'éventuels écarts dans le modèle.

Interpréter les résultats d’un modèle ou d’une analyse statistique, en identifiant leurs implications opérationnelles, leurs limites et leurs biais éventuels afin d’éclairer la prise de décision ou de formuler des recommandations fondées.

Définir une problématique d’analyse statistique ou économique structurée à partir d’un contexte complexe, en transformant une demande initiale en un questionnement opérationnel ou scientifique, afin de produire des analyses utiles à la prise de décision

Évaluer l’opportunité et la faisabilité d’un projet d’analyse statistique ou économique, notamment lorsqu’il porte sur des données complexes et multi-sources, en évaluant la qualité de ses données et leur complétude au regard de la problématique d’intérêt, en intégrant les dimensions techniques, économiques, organisationnelles, juridiques et éthiques de l’organisation, afin de sécuriser les choix stratégiques, technologiques et sociétaux de l’organisation

Proposer une organisation de projet d’analyse de données structurée, en planifiant les phases, les ressources nécessaires, les livrables intermédiaires et les modalités de pilotage afin de cadrer le déroulé avec les commanditaires.

Favoriser le travail collectif au sein d'une équipe de travail en analyse de données en assurant la clarté des échanges, l’inclusivité, la cohérence des contributions et la mobilisation des expertises, en utilisant les outils de gestion collaboratifs dans le respect des standards de développement de l’équipe et en assurant un climat de confiance propice à l’expression des idées, afin de mobiliser les compétences de l’équipe au service de la résolution collaborative d’un problème complexe.

Coordonner les activités de l’équipe et des différentes parties prenantes (équipes techniques, métiers, clients internes, partenaires…) dans le cadre de projets d’analyse statistique ou économique, en veillant à la bonne circulation de l’information et au respect des engagements, en anticipant et arbitrant les éventuels conflits de priorités ou de ressources, en suivant l’avancement individuel et collectif, en menant des points de régulation pour ajuster les priorités, et en accompagnant les membres dans la gestion des tensions ou imprévus, en lien avec les objectifs stratégiques du projet afin d’assurer la cohérence, l’efficacité et la réussite du projet.

Évaluer en continu les choix organisationnels et techniques, en fonction des contraintes opérationnelles et des retours d’usage, afin de les ajuster et d’assurer la continuité de l’activité, et de garantir l’agilité du projet.

Adapter son discours au niveau technique et au contexte culturel des interlocuteurs, y compris en environnement international, en expliquant de manière pédagogique les concepts clés, en synthétisant les enjeux du projet, les arbitrages réalisés et les orientations prises afin d’acculturer des métiers non techniques à la méthodologie proposée ou de leur faire comprendre un processus d’analyse de données.

Produire une documentation claire, structurée et adaptée au public cible, en tenant compte des exigences de transparence, de traçabilité afin de faciliter la prise de décision.

Concevoir des représentations visuelles des données et résultats, en utilisant des logiciels de visualisation de données et en s’appuyant sur des principes et guides de datavisualisation reconnus pour en faciliter la lecture et l’appropriation.

Formuler des recommandations stratégiques ou opérationnelles directement issues des analyses menées, en tenant compte des enjeux économiques, techniques ou réglementaires, afin d’accompagner et sécuriser la prise de décision.

Défendre ses résultats et ses choix méthodologiques dans le cadre d’échanges professionnels exigeants en mobilisant un argumentaire afin de garantir la crédibilité de l’analyse et faciliter la prise de décision éclairée.

Implémenter un modèle statistique ou algorithmique dans un outil interne ou un progiciel à partir d’un protocole défini afin d’assurer une intégration fiable et conforme aux spécifications techniques et fonctionnelles.

Définir les conditions techniques de déploiement d’un modèle ou d’un dispositif d’analyse dans l’environnement cible en échangeant avec des interlocuteurs pouvant avoir une position différente dans la mise en œuvre technique d’un service informatique afin de garantir l’opérationnalité de la solution.

Adapter un modèle ou un livrable analytique à son environnement d’utilisation en s'assurant de l'optimisation du code afin d’assurer sa conformité, sa performance opérationnelle et sa pérennité dans le contexte ciblé et de garantir sa durabilité.

Résoudre les difficultés d’intégration en les identifiant et en appliquant les méthodologies adaptées afin d’assurer la robustesse, l’adoption et la pérennité des solutions déployées.

Accompagner les utilisateurs dans la compréhension, l’appropriation et la prise en main de la solution via des actions de formation, de support ou de conduite du changement afin de garantir une adoption efficace et durable de la solution.

Modalités d'évaluation :

Analyse réflexive de la pratique professionnelle.

Mises en situation professionnelle.

Thèse professionnelle.

RNCP42508BC01 - Traiter des données complexes dans le cadre d'une problématique métier

Liste de compétences Modalités d'évaluation

Définir des indicateurs d’analyse statistique pertinents en fonction des objectifs de l’étude, des spécificités des données disponibles et des attentes du commanditaire afin de fournir des mesures fiables, compréhensibles et utiles pour la prise de décision.

Interpréter les distributions statistiques, les tendances et les anomalies en mobilisant des méthodes statistiques descriptives avancées, des outils numériques et des représentations graphiques adaptées afin de formuler des diagnostics clairs et étayés contribuant à la compréhension d’un phénomène.

Analyser un cas d’usage pour en extraire les variables clés et comprendre les mécanismes sous-jacents, en mobilisant l’analyse exploratoire et les modèles concurrents et en formulant des hypothèses de travail testables sous forme statistique ou algorithmique en anticipant les contraintes opérationnelles, techniques et éthiques afin de construire un modèle adapté.

Définir un cadre méthodologique rigoureux pour la modélisation en sélectionnant les modèles ou la famille de modèles statistiques en fonction du contexte métier, des caractéristiques des données et des contraintes de l’organisation en lien avec les standards professionnels pour permettre la mise en œuvre d’un modèle fiable, transparent et conforme aux attentes métiers, et garantir leur exploitabilité et leur appropriation par les utilisateurs finaux.

Formaliser mathématiquement ou algorithmiquement les hypothèses définies en amont dans un projet de modélisation, en retenant les variables sélectionnées, en traduisant les relations supposées entre variables en équations ou en code, et en documentant le raisonnement et les choix méthodologiques, afin de construire un modèle cohérent, traçable et exploitable.

Concevoir un outil ou un algorithme mobilisant des bibliothèques et outils avancés pour répondre à une problématique de traitement, d’analyse ou de visualisation de données en utilisant des langages de programmation adaptés à la data science ou à l’ingénierie des données.

Estimer les paramètres du modèle en mobilisant des outils techniques avancés et en les ajustant au jeu de données afin qu’il puisse prédire, expliquer ou représenter au mieux le phénomène étudié.

Contrôler la qualité et la robustesse du modèle et de l’algorithme associé à l’aide de tests statistiques, face à l’incertitude et aux cas extrêmes, afin d’utiliser le modèle en étant conscient de sa performance.

Détecter les biais, notamment discriminatoires, les incohérences et les erreurs de performance d’un modèle statistique, mathématique ou de machine learning, en mobilisant des méthodes de validation adaptées, afin d’évaluer son équité, sa robustesse et sa pertinence pour la problématique métier traitée et de corriger d'éventuels écarts dans le modèle.

Interpréter les résultats d’un modèle ou d’une analyse statistique, en identifiant leurs implications opérationnelles, leurs limites et leurs biais éventuels afin d’éclairer la prise de décision ou de formuler des recommandations fondées.

Data Challenge - Restitution finale

Mise en situation professionnelle

Rapport final collectif et soutenance orale avec contribution individuelle

RNCP42508BC02 - Manager un projet d'analyse statistique en situation complexe ou innovante

Liste de compétences Modalités d'évaluation

Définir une problématique d’analyse statistique ou économique structurée à partir d’un contexte complexe, en transformant une demande initiale en un questionnement opérationnel ou scientifique, afin de produire des analyses utiles à la prise de décision

Évaluer l’opportunité et la faisabilité d’un projet d’analyse statistique ou économique, notamment lorsqu’il porte sur des données complexes et multi-sources, en évaluant la qualité de ses données et leur complétude au regard de la problématique d’intérêt, en intégrant les dimensions techniques, économiques, organisationnelles, juridiques et éthiques de l’organisation, afin de sécuriser les choix stratégiques, technologiques et sociétaux de l’organisation

Proposer une organisation de projet d’analyse de données structurée, en planifiant les phases, les ressources nécessaires, les livrables intermédiaires et les modalités de pilotage afin de cadrer le déroulé avec les commanditaires.

Favoriser le travail collectif au sein d'une équipe de travail en analyse de données en assurant la clarté des échanges, l’inclusivité, la cohérence des contributions et la mobilisation des expertises, en utilisant les outils de gestion collaboratifs dans le respect des standards de développement de l’équipe et en assurant un climat de confiance propice à l’expression des idées, afin de mobiliser les compétences de l’équipe au service de la résolution collaborative d’un problème complexe.

Coordonner les activités de l’équipe et des différentes parties prenantes (équipes techniques, métiers, clients internes, partenaires…) dans le cadre de projets d’analyse statistique ou économique, en veillant à la bonne circulation de l’information et au respect des engagements, en anticipant et arbitrant les éventuels conflits de priorités ou de ressources, en suivant l’avancement individuel et collectif, en menant des points de régulation pour ajuster les priorités, et en accompagnant les membres dans la gestion des tensions ou imprévus, en lien avec les objectifs stratégiques du projet afin d’assurer la cohérence, l’efficacité et la réussite du projet.

Évaluer en continu les choix organisationnels et techniques, en fonction des contraintes opérationnelles et des retours d’usage, afin de les ajuster et d’assurer la continuité de l’activité, et de garantir l’agilité du projet.

Rapport de stage

Analyse réflexive de la pratique professionnelle

Rapport écrit individuel

RNCP42508BC03 - Communiquer des résultats statistiques complexes auprès de parties prenantes variées

Liste de compétences Modalités d'évaluation

Adapter son discours au niveau technique et au contexte culturel des interlocuteurs, y compris en environnement international, en expliquant de manière pédagogique les concepts clés, en synthétisant les enjeux du projet, les arbitrages réalisés et les orientations prises afin d’acculturer des métiers non techniques à la méthodologie proposée ou de leur faire comprendre un processus d’analyse de données.

Produire une documentation claire, structurée et adaptée au public cible, en tenant compte des exigences de transparence, de traçabilité afin de faciliter la prise de décision.

Concevoir des représentations visuelles des données et résultats, en utilisant des logiciels de visualisation de données et en s’appuyant sur des principes et guides de datavisualisation reconnus pour en faciliter la lecture et l’appropriation.

Formuler des recommandations stratégiques ou opérationnelles directement issues des analyses menées, en tenant compte des enjeux économiques, techniques ou réglementaires, afin d’accompagner et sécuriser la prise de décision.

Défendre ses résultats et ses choix méthodologiques dans le cadre d’échanges professionnels exigeants en mobilisant un argumentaire afin de garantir la crédibilité de l’analyse et faciliter la prise de décision éclairée.

Notes de synthèse

Mises en situation professionnelle

Soutenance de stage

Soutenance orale individuelle

RNCP42508BC04 - Intégrer un modèle statistique avancé en science des données dans le développement ou l’évolution d’un système d’information

Liste de compétences Modalités d'évaluation

Implémenter un modèle statistique ou algorithmique dans un outil interne ou un progiciel à partir d’un protocole défini afin d’assurer une intégration fiable et conforme aux spécifications techniques et fonctionnelles.

Définir les conditions techniques de déploiement d’un modèle ou d’un dispositif d’analyse dans l’environnement cible en échangeant avec des interlocuteurs pouvant avoir une position différente dans la mise en œuvre technique d’un service informatique afin de garantir l’opérationnalité de la solution.

Adapter un modèle ou un livrable analytique à son environnement d’utilisation en s'assurant de l'optimisation du code afin d’assurer sa conformité, sa performance opérationnelle et sa pérennité dans le contexte ciblé et de garantir sa durabilité.

Résoudre les difficultés d’intégration en les identifiant et en appliquant les méthodologies adaptées afin d’assurer la robustesse, l’adoption et la pérennité des solutions déployées.

Accompagner les utilisateurs dans la compréhension, l’appropriation et la prise en main de la solution via des actions de formation, de support ou de conduite du changement afin de garantir une adoption efficace et durable de la solution.

Mise en situation professionnelle reconstituée et Analyse réflexive de la pratique professionnelle

 

Description des modalités d'acquisition de la certification par capitalisation des blocs de compétences et/ou par correspondance :

L'obtention de la certification est conditionnée à :

  • la validation de l'ensemble des blocs de compétences
  • la rédaction et la soutenance d'une thèse professionnelle, s'appuyant sur la réalisation d'une mission en entreprise d'une durée de 4 mois minimum.

Secteurs d’activités :

Activités financières et d’assurance  

Activités informatiques et services d’information  

Conseil ou ingénierie  

Fonction publique d’Etat, territoriale ou hospitalière  

Type d'emplois accessibles :

Data scientist / Scientifique des données 

Consultant en science des données / Data 

Data engineer 

Machine Learning engineer 

Quantitative analyst 

Code(s) ROME :

  • M1403 - Études et prospectives socio-économiques

Références juridiques des règlementations d’activité :

Le métier visé par la certification n’est actuellement pas encadré par une réglementation d’activités spécifique. Comme beaucoup de métiers qui traitent de la donnée, il est impacté par le RGPD européen et sa déclinaison nationale, ainsi que par les règlementations émergentes en matière d’IA, qui sont bien entendu prises en compte dans le référentiel de certification, mais celles-ci ne conditionnent pas l’accès au métier. 

Le cas échant, prérequis à l’entrée en formation :

Sont recevables les candidatures de titulaires d’un des diplômes suivants :

  • Diplôme de Master
  • Titre d'ingénieur diplômé conférant le grade de Master
  • Diplôme d'une école de management conférant le grade de Master
  • Titre au RNCP niveau 7
  • Diplôme de M1 pour les candidats avec trois ans d'expérience professionnelle en lien avec la formation visée.
  • Diplôme étranger équivalent aux diplômes français requis ci-dessus

À titre dérogatoire, dans la limite des pourcentages définis dans le règlement du label Mastère spécialisé de la CGE :

  • Niveau 6 avec 3 ans d’expérience en lien avec la formation visée via une procédure VAPP.

Le cas échant, prérequis à la validation de la certification :

Pré-requis disctincts pour les blocs de compétences :

Non

Validité des composantes acquises
Voie d’accès à la certification Oui Non Composition des jurys Date de dernière modification
Après un parcours de formation sous statut d’élève ou d’étudiant X

2 professionnels qualifiés, à jour des compétences du secteur concerné 

La directrice des programmes Mastère spécialisé ou son représentant 

30-06-2026
En contrat d’apprentissage X

2 professionnels qualifiés, à jour des compétences du secteur concerné 

La directrice des programmes Mastère spécialisé ou son représentant 

30-06-2026
Après un parcours de formation continue X

2 professionnels qualifiés, à jour des compétences du secteur concerné 

La directrice des programmes Mastère spécialisé ou son représentant 

30-06-2026
En contrat de professionnalisation X

2 professionnels qualifiés, à jour des compétences du secteur concerné 

La directrice des programmes Mastère spécialisé ou son représentant 

30-06-2026
Par candidature individuelle X - -
Par expérience X

2 professionnels qualifiés, à jour des compétences du secteur concerné 

La directrice des programmes Mastère spécialisé ou son représentant 

30-06-2026
Validité des composantes acquises
Oui Non
Inscrite au cadre de la Nouvelle Calédonie X
Inscrite au cadre de la Polynésie française X

Statistiques :

Statistiques
Année d'obtention de la certification Nombre de certifiés Nombre de certifiés à la suite d’un parcours vae Taux d'insertion global à 6 mois (en %) Taux d'insertion dans le métier visé à 6 mois (en %) Taux d'insertion dans le métier visé à 2 ans (en %)
2024 21 0 93 67 -
2023 20 0 100 100 100
2022 21 0 92 69 69

Lien internet vers le descriptif de la certification :

Le certificateur n'habilite aucun organisme préparant à la certification

Référentiel d'activité, de compétences et d'évaluation :