Aller à la navigation principale Aller au contenu Aller à la navigation de bas de page
Répertoire spécifique

Analyse statistique de données avec le langage R

Active

N° de fiche
RS5073
Code(s) NSF :
  • 326 : Informatique, traitement de l'information, réseaux de transmission
Formacode(s) :
  • 31052 : Data Warehouse
Date d’échéance de l’enregistrement : 27-01-2023
Nom légal Nom commercial Site internet
THINKR ThinkR https://thinkr.fr
Objectifs et contexte de la certification :

Le titulaire de la certification est capable, dans une démarche de data science menée par son organisation, d’intégrer et de traiter des données, et de produire un rapport en utilisant de manière appropriée le langage de programmation R. Le titulaire de la certification est capable de mettre en place un processus de traitement des données sous R qui est reproductible avec différents jeux de données. 

Cette certification permet à tous les acteurs de l’entreprise d’acquérir les compétences permettant de comprendre et valoriser les données de son organisation ou auxquelles son organisation a accès.

Compétences attestées :
  1. Importer des données dans l’environnement R, en utilisant le(s) package(s) adéquat(s) et les lignes de code adaptées aux données, afin de vérifier leur qualité et réaliser leur mise en forme
  2. Visualiser des données importées dans l’environnement R sous forme de graphiques, tableaux et d’indicateurs statistiques adaptés à leur nature (moyennes, médianes et écarts-types…)
  3. Interpréter les indicateurs statistiques produits dans l’environnement R pour identifier des erreurs de saisie ou de collecte et les corriger à l’aide des lignes de code appropriées, afin de rendre le jeu de données complètement exploitable. 
  4. Sélectionner des variables et des indicateurs statistiques pertinents en fonction des données ou de la commande, produire des tableaux et des graphiques mis en forme, permettant de comprendre et interpréter les données, en rédigeant les lignes de codes adaptées, afin de produire un rapport pour un tiers. 
Modalités d'évaluation :

Cas pratique : 

Sur la base d’un jeu de données, contenant des erreurs, le candidat doit : 

  • Importer les données ; 
  • Corriger les erreurs ; 
  • Décrire et compiler les données dans un rapport mis en forme selon des spécifications précises. 
Le cas échéant, niveaux de maîtrise des compétences :


Le cas échéant, durée de validité en années :
Si durée limitée, modalités de renouvellement :


Possibilité de validation partielle :

Non

Références juridiques des règlementations d’activité :


Le cas échéant, prérequis à la validation des compétences :

Avoir déjà rédigé une ligne de code (dont formule Excel). Connaître les concepts de moyenne, médiane et écart-type. Avoir de l'appétence pour l’analyse et l’exploitation des données, le souhait d’automatiser des analyses et des pratiques, savoir ce qu’est un langage de programmation et connaître le vocabulaire qui s’y réfère et se laisser du temps pour la pratique après la formation. 



Validité des composantes acquises :
Voie d’accès à la certification Oui Non Composition des jurys
Après un parcours de formation sous statut d’élève ou d’étudiant X -
Après un parcours de formation continue X

Le jury est composé du directeur de l’organisme certificateur, d’un formateur agréé et d’un professionnel spécialisé dans le traitement des grands volumes de données. 

En contrat de professionnalisation X -
Par candidature individuelle X -
Par expérience X -
Lien avec d’autres certifications professionnelles, certifications ou habilitations : Oui
Certifications professionnelles, certifications ou habilitations en équivalence au niveau européen ou international :

MASTER Domaine Sciences, Technologie, Santé Mention « Informatique » (Code   RNCP - 30817).  La certification est délivrée   par :  UNIVERSITE LUMIERE - LYON 2,   Ecole Nationale Supérieure des Mines (Saint-Etienne) (ENSMSE), Université   Jean Monnet - Saint-Etienne, Ecole centrale de Lyon (ECL), Université Claude   Bernard - Lyon 1, Ecole normale supérieure de Lyon (ENS), Institut mines   télécom.  Cette certification n’est pas découpée en blocs de compétences. Certains préparateurs proposent des cours en langage R sans que les compétences visées ne soient spécifiées.  Il n’est pas possible d’établir une équivalence.

Certifications professionnelles enregistrées au RNCP en équivalence :
N° de la fiche Intitulé de la certification professionnelle reconnue en équivalence Nature de l’équivalence (totale, partielle)


Liens avec des certifications et habilitations enregistrées au Répertoire spécifique :

     

1/   Data science : Savoir collecter, décrypter, analyser et prédire à partir de   mégadonnées (Inventaire, fiche n°2862).

Il s’agit d’une certification   présentant les compétences similaires à la certification « R niveau 1 -   Utilisateur – Analyse de données ».
La certification est équivalente.


2/   Optimisation numérique et Data Science (Inventaire, fiche n°3231).

La certification est constituée   de 11 modules (6 à valider au choix pour obtenir la certification). 

Le module « Modèles de   prévision avec R » est comparable à la certification «R niveau 1 -   Utilisateur – Analyse de données ». 

- Prise en main et réparation   des données

- Traitement des données

- Production de rapport

L’obtention de la certification comparable ne permet pas en tant que tel d’admettre une équivalence sachant que son contenu est variable. Les titulaires de la certification comparable, ayant validé le module «Modèles de prévision avec R », pourraient obtenir une équivalence avec la certification « R niveau 1- utilisateur – analyse de données  ».


3/   Management en data science pour l'actuariat (Inventaire, fiche n°3921).

La certification est structurée autour de 4 grandes activités professionnelles. 

L’activité « A4. Communiquer et synthétiser l’information pertinente issue d’analyse de données massives   auprès de professionnels du monde de l’assurance, afin d’aider à la prise de  décision opérationnelle » fait référence aux langages R et Python. Il n’est pas précisé si les certifiés acquièrent des compétences dans les 2 langages ou l’un des deux uniquement selon les sessions. La certification est complètement orientée vers des problématiques d’actuariat.

Outre les spécificités de l’actuariat, et sous réserve de que les certifiés démontrent que les compétences acquises l’ont été dans le cadre de l’utilisation de l’environnement et du langage R, une équivalence à la certification « R   niveau 1 utilisateur – analyse de données » pourrait   être reconnue.

Référence au(x) texte(s) règlementaire(s) instaurant la certification :

Date du JO / BO Référence au JO / BO

Référence des arrêtés et décisions publiés au Journal Officiel ou au Bulletin Officiel (enregistrement au RNCP, création diplôme, accréditation…) :

Date du JO / BO Référence au JO / BO

Référence autres (passerelles...) :

Date du JO / BO Référence au JO / BO
Date du premier Journal Officiel ou Bulletin Officiel :
Statistiques :
Lien internet vers le descriptif de la certification :

https://thinkr.fr/r-niveau-1-analyse-de-donnees/


Référentiel d’activité, de compétences et d’évaluation :

Référentiel d’activité, de compétences et d’évaluation
Ouvre un nouvel onglet Ouvre un site externe Ouvre un site externe dans un nouvel onglet