Aller à la navigation principale Aller au contenu Aller à la navigation de bas de page
Répertoire spécifique

Data Science : analyse et gestion de grandes masses de données

Inactive

N° de fiche
RS1918
Code(s) NSF :
  • 326t : Programmation, mise en place de logiciels
  • 326n : Analyse informatique, conception d'architecture de réseaux
  • 326m : Informatique, traitement de l'information
Formacode(s) :
  • 31054 : informatique
Date d’échéance de l’enregistrement : 31-12-2021
Nom légal SIRET Nom commercial Site internet
Telecom ParisTech 18009202500022 - -
Objectifs et contexte de la certification :

Les compétences en Data Science peuvent être mises en œuvre dans de nombreux domaines d’application spécifiques et transverses, qui revêtent des enjeux économiques de taille. Leur valeur ajoutée n’est pas circonscrite à l’industrie informatique mais imprègne tous les secteurs économiques et l’ensemble des fonctions de l’entreprise, en particulier, les technologies et usages liés au Big data : (industrie, santé, énergie, transport, assurances, marketing, prédiction de modèles économiques, avantages concurrentiels liés à l’amélioration des systèmes d’information etc.)

(source : rapport «Industrial Internet Insights Report for 2015 (https://www.accenture.com/tw-en/_acnmedia/Accenture/next-gen/reassembling-industry/pdf/Accenture-Industrial-Internet-Changing-Competitive-Landscape-Industries.pdf) », General Electric / Accenture)

(source : Etude Deloite Tendances Data et Analystics (http://www2.deloitte.com/fr/fr/pages/technology/articles/tendances-data-et-analytics-2016.html))


La certification en data science vise à vérifier l’acquisition des compétences nécessaires à l’exploitation de grandes masses de données et la réalisation d’analyses prédictives de systèmes

Compétences attestées :

C.1 Proposer des axes de gestion et d’analyse de grandes masses de données

C2. Définir une architecture de traitement et une modélisation en déterminant les types de données, les outils statistiques et les méthodes appropriées

C.3 Sourcer, rassembler et nettoyer l’ensemble des sources de données

C.4 Utiliser des outils d'analyse et de gestion de bases de données de types variés dans de grands volumes en faisant preuve de réactivité et d'adaptation afin de surmonter les obstcles rencontrés

C.5 Synthétiser les résultats d'une analyse sous une ou des formes adaptées au besoin

CE1. Prendre en compte les contraintes techniques pour proposer une solution d’analyse de grandes masses de données de types pouvant être variés

CE2a. Proposer une architecture de gestion et d’analyse appropriée aux besoins et aux contraintes d’un système cible.

CE2b. Combiner des outils et des méthodes adaptés et tenant compte des évolutions récentes des techniques.

CE3. Sourcer, rassembler et nettoyer l’ensemble des sources de données en utilisant les technologies adéquates afin de répondre aux besoins du système cible

CE4a. Utiliser et adapter des outils statistiques, de calcul distribué ainsi que des techniques de passage à l’échelle afin de procéder à l’analyse ou à la gestion des grandes masses de données

CE4b. Identifier les obstacles lors de l’implémentation d’un modèle d’analyse et de gestion des

grandes masses de données afin d’établir des préconisations d’amélioration

CE5. Synthétiser les résultats d’une l’analyse sous un ou des formes adaptées (rapport,

graphique, tableau de bord, indicateur...) afin de permettre leur exploitation par les utilisateurs, clients et/ou partenaires du système cible

Modalités d'évaluation :

Méthode Pédagogique et Organisation

La formation alterne cours théoriques et travaux pratiques. Elle a lieu en présentiel et à distance (FOAD).

  • Elle est d’une durée totale de 25 jours (175 heures en présentiel), dont 1 journée d’évaluation finale. Les jours de formation sont répartis par sessions de 2 jours toutes les deux ou trois semaines.
  • Entre chacune des 12 sessions de formation en présentiel, les participants doivent réaliser des travaux en ligne (nécessitant environ 3h de travail individuel) permettant demettre en application les compétences acquises.

La formation est d’une durée totale de 12 mois (dont 3 mois dédiés à la réalisation d’un projet personnel tutoré présenté lors d’une soutenance finale). A titre exceptionnel, 2 mois supplémentaires peuvent être octroyés pour améliorer le projet personnel.

Actions pré-formatives

La formation est précédée d’une action pré-formative constituée :

  • d’une session de formation / évaluation type MOOC
  • d’un entretien de motivation et de positionnement

Ces actions pré-formatives peuvent donner lieu à des ajustements du contenu de la formation, notamment dans le cadre d'un dispositif de formation intra-entreprise.

Le cas échéant, niveaux de maîtrise des compétences :

pas de niveau

Le cas échéant, durée de validité en années :
Si durée limitée, modalités de renouvellement :
Possibilité de validation partielle :

Non

Références juridiques des règlementations d’activité :
Le cas échéant, prérequis à la validation des compétences :
  • Diplôme de niveau bac + 5 ou expérience professionnelle équivalente
  • Bonnes connaissances en mathématiques (optimisation, probabilités/statistique, algèbre linéaire)
  • Bonne expérience de la programmation
  • Validation de l’action pré-formative (MOOC)


Lien avec d’autres certifications professionnelles, certifications ou habilitations : Non
Date d'échéance de l'enregistrement 31-12-2021
Statistiques :
Lien internet vers le descriptif de la certification :

https://www.telecom-paristech.fr/fileadmin/documents/pdf/formation_continue/CES/Data-Scientist.pdf

http://www.telecom-evolution.fr/fr/formations-certifiantes/ces-data-scientist


Le certificateur n'habilite aucun organisme préparant à la certification

Fiche au format antérieur au 01/01/2019
Ouvre un nouvel onglet Ouvre un site externe Ouvre un site externe dans un nouvel onglet