Data Scientist

Si l’on parlait de données brutes, de data center et de statistiques ? Le Data Scientist lui, en a fait son métier. Relativement récent et en constante évolution, ce métier passionnant permet de faire parler des immenses bases de données. Le but est d’en tirer parti dans le cadre d’une activité commerciale. Vous aimez les chiffres, les statistiques et l’information en générale ? N’hésitez-pas à lire cet article pour en apprendre plus sur les missions, compétences, formations et salaire de cette profession.

En fonction de ce qui est recherché, le Data Scientist peut être amené à travailler avec différents services/directions. Service marketing, financier, IT… Cela dépendra du secteur d’activité et de l’entreprise.

Le marché du Big Data connaît une forte croissance ces dernières années. Pesant des milliards de dollars et détenant une croissance à 2 chiffres, les profils Data Scientist se voient de plus en plus plébiscités. Mais dans quel but ?

Missions

Concrètement, les missions du Data Scientist vont concerner le traitement et croisement de données, afin de permettre à l’entreprise de répondre à ses différentes problématiques et d’en faire des prédictions les plus précises possibles. 

Le Data Engineer va en premier lieu récupérer les données de différentes sources hétérogènes. Chaque donnée, le moindre échange, une recherche Web etc. est aujourd’hui source d’informations.

C’est pourquoi il devient de plus en plus complexe de traiter ce volume imposant de données pour en obtenir des insights concrets.

  • Le Data Scientist doit en premier lieu prendre connaissance et comprendre la problématique de l’entreprise ou du service. Est-elle commerciale, marketing, interne (formation, RH), ou concerne-elle la fidélisation…? Quels sont ses besoins, priorités et budget ? Cette étape préalable doit permettre de savoir s’il a toutes les ressources nécessaires pour mener à bien le projet. Ne pas oublier les ressources humaines qui prendront part au projet.
  • Lorsque la première étape est remplie et les hypothèses formulées, il est essentiel de préparer les données à analyser. Le tout doit être rassemblé dans un outil dédié à l’analyse puis préprocessé et conditionné pour pouvoir réaliser le travail de modélisation. Les données sont ensuite extraites, nettoyées, transformée chargée puis analysées,
  • Puis afin de déterminer le modèle, diverses techniques et méthodes permettent d’établir des relations entre ces différentes variables. Plusieurs outils permettent de réaliser une analyse de données exploratoire à l’aide de formules ou d’outils de visualisation. Cette exploration sert principalement à déterminer quels sont les insights pertinents et algorithmes utiles à mettre en place,
  • Construction du modèle à l’aide des outils internes ou de la construction d’un modèle plus puissant qui vous permettra de développer les jeux de données. Dans ce cas précis, il est judicieux de prendre connaissance des différentes techniques de learning afin de construire le modèle (regrouper, associer, classer). Matlab, SPCS Modeler, Statistica, Alpine Miner… sont des outils pouvant le permettre,
  • Création des documents, rapports, briefs… tout ce qui concerne la mise en oeuvre du projet,
  • Evaluer la performance, s’assurer que les objectifs fixés aient été atteints et en tirer des conclusions,
  • Communiquer les résultats aux parties concernées par le projet pour déterminer la bonne réussite de celui-ci.

Compétences du Data Scientist

Véritable expert pluridisciplinaire, les compétences du Data Scientist sont très diverses, intégrant mathématiques, statistiques et informatique. Il doit également avoir un profil de technicien et être capable d’utiliser les outils que l’entreprise lui met à disposition. 

Il doit comprendre les attentes de l’entreprise et l’accompagner dans la mise en place de celles-ci pour améliorer ses performances.

Avoir un esprit méthodique, scientifique et analytique est inhérent à son profil, il est également nécessaire d’avoir des connaissances en Machine Learning.

La maîtrise d’un langage de programmation est un autre prérequis, malgré le fait que Python soit le plus utilisé. Il est tout à fait possible de travailler sur d’autres langages/outils tels que R, SPSS, C/C++, Java

Aussi, certaines entreprises peuvent exiger la maîtrise de SQL et la connaissance de la plateforme Hadoop, ne les négligez donc pas.

Formation

Si le poste de Data Scientist n’avait pas de formation propre il y a quelques années, cela a bien évolué. Maintenant, de nombreux Masters et formations spécifiques au métier existent. Généralement, elles suivent un cursus plus général, universitaire, en école d’informatique ou d’ingénieur, axé mathématiques, statistiques et analyse.

Les formations se présentent de différentes manières, durée d’un ou deux ans, de quelques heures, mois, le choix ne manque pas. Il existe des MOOC pour ceux qui préfèrent ce format là à celui plus traditionnel. Vous avez également la possibilité de suivre des cursus en alternance.

Il est fortement conseillé de suivre un bac +3 et d’aller jusqu’au Master (bac +5) afin d’accéder aux formations spécialisées avec plus d’aisance.

En revanche, nous précision qu’il n’y a pas de règle définie, certaines entreprises s’arrêteront effectivement sur votre parcours quand d’autres valoriseront vos expériences et compétences en premier lieu.

Salaire du Data Scientist

De manière générale, un profil junior peut espérer toucher en début de carrière un salaire entre 38k€ et 45k€. Il peut atteindre les 60k€ pour un profil Data Scientist confirmé et dépasser les 70k€ pour un profil senior. Evidemment, comme dans toutes les professions, ces rémunérations varient en fonction de nombreux critères dont l’entreprise d’accueil, la formation, l’expérience et la localisation.

A titre d’exemple, nous donnons ces fourchettes salariales pour des postes basés à Paris ou IDF.