Si vous vous posez la question de votre (ré)orientation professionnelle, vous avez peut-être envisagé de devenir Data Scientist. Mais avez-vous les qualités et compétences pour ce métier ?

Des milliards de pixels ont été mobilisés pour répondre à la question «Qu'est-ce qui fait un bon data scientist ?». La plupart de ces articles traitaient des compétences et des outils de la data science, tandis que presque aucun d'entre eux n'a discuté des personnalités qui font des scientifiques des bons, voire des grands. Une recherche sur Google intitulée «Data Science Skills» renvoie 38 millions de résultats;  «Data Science Skills» donnent un résultat anémique de 938 000 résultats.

Compte tenu de l'éventail de formations gratuites, quasi gratuites et payantes offertes sur Internet, n'importe qui peut maîtriser les outils et les compétences nécessaires à la pratique de la data science.

Mais acquérir ces outils et bien les utiliser nécessite un ensemble de compétences et de prédispositions difficiles à identifier et encore plus difficiles à maîtriser.

Qu'est-ce qu'une prédisposition ?

Une compétence est un ensemble de connaissances techniques ou pratiques applicables dans un nombre limité de circonstances. La programmation est une compétence, de même que l'analyse statistique. À ce propos, la cuisson l'est aussi. Mais connaître la proportion correcte d'ingrédients liquides par rapport aux ingrédients secs dans un gâteau ne sera probablement pas utile pour construire cet algorithme de tri. Et les caractéristiques d’une distribution gaussienne ne garantira pas que vos biscuits soient légers et feuilletés.

Une prédisposition, en revanche, est une habitude mentale ayant de nombreuses applications dans la vie professionnelle ou privée. Nous pourrions considérer les dispositions comme des vertus au sens ancien ou religieux. Pour revenir à notre exemple de cuisson, Python n’aidera pas la pâte à lever, mais la patience nous empêchera de jeter le bol à travers la pièce quand ce ne sera pas le cas.

Contrairement à la croyance populaire, les traits ne sont pas figés et nous pouvons développer avec le temps ceux qui nous manquent.

J'ai utilisé un algorithme de clustering primitif - mon cerveau de consultant - sur ces quinze sujets et j'ai présenté cinq caractéristiques essentielles d'un grand informaticien : - )

  •     Curiosité
  •     Clarté
  •     La créativité
  •     Scepticisme
  •     Humilité

Curiosité

À bien des égards, la curiosité - cette soif insatiable de connaissances et de compréhension - est le prédisposition primordiale d’un data scientist. Notre travail consiste à poser des questions de données et de personnes. La plupart des gens ne connaissent pas les limitations des données et ne se soucient pas de nous. Nous devons donc être curieux de savoir ce qu’ils font et ce qu’ils veulent réaliser. Et notre domaine évolue si rapidement que nous devons maintenir notre intérêt à maintenir notre avantage.

Pour développer le type de curiosité qui nous aide à développer et à maintenir nos compétences, nous posons des questions auxquelles nous devrions «connaître» déjà la réponse. C’est un trait difficile à développer, et il faut un fort parangon pour l’illustrer: Elle Woods.

La légendaire héroïne de 'Legally Blonde' (si vous n'avez pas vu ce chef-d'œuvre, cessez de lire et de le faire tout de suite) avait le don de poser sans vergogne des questions tout à fait élémentaires, même dans ses domaines de compétence, par curiosité sur les gens et les sujets. Elle semble l'avoir reçu comme un cadeau naturel, donc si nous voulons le développer, nous devrions laisser notre ego de côté et ne pas avoir peur de ne pas être la personne la plus intelligente au monde.

Clarté du raisonnement

La clarté est une conséquence essentielle de la curiosité. Que ce soit pour écrire du code, effectuer une analyse ou tout simplement nettoyer des données en désordre, nous devons comprendre ce que nous faisons et pourquoi nous le faisons. Après tout, il s’agit «de la data science» et non de «l’essai aléatoire de données». On peut penser que la data science repose sur le dos d’une grande tortue, qui à son tour repose sur une autre tortue. C’est en quelque sorte un empilement de tortue, et nous devrions pouvoir expliquer le rôle chaque tortue.

Nous pouvons développer notre clarté de raisonnement en nous posant constamment deux questions: «Pourquoi?» Et «Et alors?». Pour chaque étape de votre analyse, demandez-vous pourquoi vous le faites et ce que cela signifie pour le projet spécifique et pour le contexte général de ce que vous faites. Et, comme un bambin curieux ou un adolescent entêté, continuez à poser ces questions jusqu'à ce que vous obteniez une réponse irréductible. En d'autres termes, utilisez «Pourquoi» et «Alors quoi» pour descendre toute la lignée des tortues.

La créativité

La créativité est probablement le point le plus controversé de cette liste, principalement parce qu’elle peut être comprise de plusieurs manières. Les gens le voient généralement comme binaire: soit quelqu'un la possède, soit ils ne l’ont pas. On pense généralement que Mozart a tiré sa musique de l'éther, publiant des opéras complets à l'âge de huit ans uniquement sur la base de la créativité innée.

L’histoire devient moins romantique quand on apprend que Leopold Mozart, le père de Wolfgang, était un professeur de musique qui a utilisé le jeune Wolfgang comme un rat de laboratoire pour ses méthodes pédagogiques presque dès la naissance de son fils.

Avec tout le respect que je dois à Mozart, qui a certainement eu un génie musical inné, la créativité peut être apprise et développée de la même manière qu'un athlète développe les compétences pour son sport.

Essayez ces activités créatives courantes :

  • Brainstorming
  • Lire des articles qui contredisent tout ce que vous savez
  • Discutez avec des personnes qui ont un sens logique opposé au votre
  • Mais, comme le souligne Maxime Digue, le product owner d’un site dédié à la création d’entreprise, « la créativité n’a d’intérêt pour un data scientist que si elle est canalisée. On attend du data scientist, qu’il analyse de façon originale, parfois inédite, mais surtout pertinente, précise et sans à priori les données » ;
  • Connectez des sujets inconnectables
  • Essayez également de petits changements spontanés dans votre vie, comme modifier votre parcours professionnel ou résoudre un problème familier d'une manière différente, cela vous aidera à développer votre créativité. Je tiens à souligner que des personnes beaucoup plus intelligentes que moi consacrent leur vie à l’étude de la créativité (Google renvoie 167 millions de visites pour "développer la créativité"). Il existe donc tout un monde pour vous aider à renforcer votre créativité. (Personnellement, j’aime beaucoup l’injonction de Lewis Carroll de croire trois choses impossibles avant le petit déjeuner.)

Scepticisme

Même si nous voulons être toujours plus créatifs, nous devons garder au moins un pied sur terre, et un scepticisme sain nous aide à faire exactement cela. Le scepticisme freine notre créativité et nous maintient dans le monde réel plutôt que dans le terrier du lapin.

Mais comment développez-vous le scepticisme tout en maintenant la curiosité optimiste qui vous pousse à continuer à apprendre? Commencez par vous rappeler que, même si vous posez des questions comme Elle Woods, cela ne signifie pas que vous prenez chaque réponse à la lettre. Continuez votre curiosité et explorez vos données, mais rappelez-vous qu’elles sont aussi efficaces que les méthodes qui les ont collectées. Renseignez-vous, puis examinez les hypothèses et les attentes des personnes qui vous ont fourni les données. Lorsque vous construisez votre modèle, examinez vos propres hypothèses et vérifiez si elles correspondent aux hypothèses du modèle et si elles correspondent réellement à ce que disent les données.

Comme le disait George E. P. Box, statisticien éminemment citable, «Tous les modèles sont faux, mais certains sont utiles.» En maintenant cette attitude sceptique, nous pouvons intégrer l’autorégulation à l’optimisme inhérent à la data science.

Humilité

Le professeur Box nous amène au dernier trait unificateur d’un data scientist: l’humilité. La data science n'est pas magique, et nous ne sommes pas des sorciers. Le scientifique curieux sait qu’il ne sait pas tout et qu’il cherche toujours de nouvelles choses à apprendre. La scientifique aux données pures déprime sa fierté et adapte sa présentation à son public, même si cela signifie renoncer à une technique ingénieuse qu'elle a construite. Le scientifique de données créatif pense «en dehors de la boîte», même si cela semble ridicule. Et, bien sûr, la data scientist sceptique sait se méfier de ses données et de ses modèles, les évaluer tous avec une clarté nette et présenter ses résultats avec toutes les mises en garde nécessaires.

eXTReMe Tracker