Le Master 2 Statistique et Informatique pour la Science des donnéEs (SISE), du parcours Statistique et Informatique, propose une formation avancée à la data science, avec une forte composante machine learning et statistique d'une part, informatique et technologies big data d'autre part.
La complémentarité de ces compétences constitue le socle de la science des données (data science) et de la valorisation des données massives (big data, big data analytics). Les étudiants peuvent se tourner vers les métiers traditionnels de la data science et de la statistique (data scientist, data analyst, ingénieur machine learning, chargés d'études statistiques, consultant data mining, consultant data science, ingénieur score, ...). Ils peuvent également, de par leurs compétences approfondies en informatique en programmation (R et Python), en technologies big data et leurs applications (ex. hadoop, spark, dataviz, ...), en business intelligence et bases de données (conception et exploitation des entrepôts de données, outils ETL, bases de données NoSql, dataviz, …) valoriser un profil de data scientist / data analyst dans le sens d'une synergie réelle entre la statistique / machine learning et l'informatique.
Le savoir-faire acquis dans les modules consacrés aux spécialisations et applications (text mining, web mining, analyse des réseaux sociaux, valorisation des données de sécurité) leur permet d'être directement opérationnels dans des environnements exigeants. Ils le sont d'autant plus que près de 40% des enseignants du Master SISE sont assurés par des professionnels. Les étudiants sont ainsi au fait des pratiques et préoccupations récentes des entreprises. Ils sont en prise directe avec les évolutions technologiques particulièrement rapides dans le domaine de la data science.
Le Master SISE peut accueillir, au titre de la formation continue, des professionnels en reconversion, qui ont déjà travaillé plusieurs années en entreprises et qui souhaitent s'investir dans la data science. Ils peuvent suivre la formation à titre personnel, ou en accord avec leur entreprise, ou dans le cadre d'un congé individuel de formation, ou disposer de tout autre cadre de financement. Les candidats concernés doivent être pleinement disponibles et suivent les mêmes cours que les étudiants en formation initiale.
Les étudiants de notre Master de Science des Données participent au programme académique de DataCamp (DataCamp for the Classroom). Ils y ont accès gratuitement au titre du Master SISE. Ce programme s'étale sur un semestre, il leur permet d'approfondir leurs connaissances en R, Python, statistique, data mining et machine learning, data visualisation (Dataviz) (la liste des enseignements est visible sur le site). Le programme DataCamp aboutit à une certification en Data Science.
Programme
Le programme du Master SISE est articulé autour des enseignements fondamentaux, des applications et de la professionnalisation.
Les enseignements fondamentaux concernent la maîtrise des méthodes de statistique au sens large, incluant les techniques de modélisation de machine learning et de data mining. L'objectif est que l'apprenant doit comprendre les principes sous-jacents à ces méthodes, leurs mécanismes internes, leur champ d'application. Ils (les enseignements fondamentaux) concernent également l'informatique, qui va largement plus loin que la manipulation des outils. Les étudiants doivent acquérir des compétences fortes dans le développement d'applications de machine learning (développement et déploiement de librairies de calcul, d'applications avec un front-end web, etc.) ; de conception et de gestion des bases de données conventionnelles ou non (NoSQL, lac de données), locales ou dans le cloud ; de manipulation et d'intégration de technologies big data (hadoop, spark, …).
Les applications concernent la mise en œuvre des techniques statistiques et de machine learning dans des contextes et sur des données de nature particulière. Il s'agit notamment du traitement des données non-structurées qui sont pléthores aujourd'hui avec le web, mais aussi des images, des informations en provenance des réseaux sociaux collectées à l'aide d'API spécialisées, des données produits par les outils de la sécurité informatique (fichiers logs, …). Au-delà de la simple déclinaison des méthodes statistiques dans ces domaines, ils permettent de développer des approches et des compétences spécifiques valorisables sur le marché du travail.
La professionnalisation enfin concerne en particulier la mise en situation des étudiants dans le monde professionnel. Ils doivent gérer notamment les manifestations promotionnelles de nos formations durant la partie académique de l'année, entres autres : le forum qui consiste à faire venir les entreprises au contact de nos étudiants ; les journées thématiques (Securiday, Dataday, BI-Day, …) où des professionnels viennent partager leur expérience, avec l'organisation de challenges et d'ateliers sponsorisés, … Les étudiants acquièrent une expérience forte en travaillant dans des situations réelles, avec tous les écueils que cela peut représenter (un intervenant qui se désiste à la dernière minute par ex.).
Stage obligatoire, entre 4 et 6 mois, de la mi-mars jusqu'à fin septembre.
Certifications et métiers visés
Consulter le diplôme, titre ou certificat...
délivrés en fin de formation ainsi que les métiers
auxquels cette formation vous donne accès.
Résultats attendus
Niveau de sortie
Année post-bac de sortie
Bac+5
Niveau de sortie
Master
Compétences visées
Activités visées / compétences attestées
Former les apprenants aux fondements et à la pratique de la data science. Fortes compétences en machine learning et ses applications, méthodes statistiques, d'une part ; informatique, programmation, informatique décisionnelle, technologies big data, gestion et manipulation des bases de données, d'autre part. Plus précisément :
Mener des projets de data science
Concevoir et réaliser des études statistiques
Maîtriser les techniques de data mining et de machine learning, ainsi que les technologies big data (hadoop, spark)
Savoir conduire des études dans les domaines clés de la data science (text mining, image mining, analyse des réseaux sociaux, traitement des données du web, analyse des données de sécurité informatique, etc.)
Savoir valoriser et exploiter des données massives (big data analytics)
Maîtriser les outils informatiques de la data science, entres autres les outils de dataviz
Maîtriser la programmation statistique avec les outils qui font référence (R, Python)
Travailler dans des environnement de big data, en particulier dans le cloud
Connaissances à acquérir
Maîtriser les méthodes statistiques, de machine learning et de data mining avancées
Savoir manipuler les environnements et les technologies big data (hadoop, spark)
Savoir concevoir et manipuler les bases de données conventionnelles (entrepôts de données) et non-conventionnelles (NoSQL)
Mener et déployer des projets de machine learning et de data science
Débouchés professionnels
Secteurs d'activité ou type d'emploi
Les étudiant.es issu.es du parcours Statistique et Informatique pour la Science des donnéEs (SISE) occupent les métiers traditionnels de la data science, du machine learning, de la statistique, et de ses applications : data scientist, statisticien/ne, ingénieur.e statisticien/ne, , data analyst, ingénieur.e machine learning, ingénieur big data, chargé.e puis directeur/trice d'études, biostatisticien/ienne, chargé.e de traitement data mining.
Les étudiant.es expriment leur savoir-faire dans tous secteurs où la valorisation des données massives prend une dimension importante : banques, assurances, industrie,distribution, collectivités territoriales, protection sociale, instituts d'études. Les sociétés de service informatique ont également investi le domaine de la science des données et expriment un besoin fort en compétences statistiques.
Pré-requis
Niveau(x) de recrutement
BAC+4
Formation(s) requise(s)
Un niveau solide, ou tout du moins une appétence certaine, en informatique, statistique et mathématiques appliquées.
Pour les candidatures extérieures à notre M1 Informatique, un programme de remise à niveau est prévu durant l'été qui précède la rentrée d'octobre. Il est obligatoire.