Évaluez-vous en tant que data scientist
Quelles compétences faut-il pour être data scientist ?
J'ai lu une approche intéressante basée sur les données pour répondre à cette question dans le livre Doing Data Science: Straight Talk from the Frontline.
Dans cet article, je résume cette approche d'auto-évaluation que vous pouvez utiliser pour évaluer vos points forts en tant que data scientist et où vous pourriez vous intégrer dans une incroyable équipe de science des données.
Vous pouvez utiliser praticien de l’apprentissage automatique appliqué comme synonyme de data scientist si vous le souhaitez.
Licornes de la science des données
En passant en revue les emplois des data scientists, les auteurs de Doing Data Science constatent que les employeurs recherchent des licornes.
Les offres d'emploi recherchent des employés qui n'existent pas et qui possèdent des atouts en informatique, en statistiques, en communication, en visualisation de données et en expertise dans un domaine.
Cela n’est pas surprenant étant donné que le terme « data scientist » est mal défini : les employeurs ne savent même pas ce dont ils ont besoin ni même quels problèmes ils doivent résoudre.
Histogramme des compétences
Astucieusement, les auteurs dressent une liste des compétences courantes requises des data scientists à partir des offres d'emploi.
Ils utilisent cette liste et vous suggèrent de vous classer sur une échelle relative (0-100) par rapport à chaque compétence.
Enfin, ils vous suggèrent de présenter les résultats sous forme de graphique à barres ou d'histogramme.
Une seule personne ne possèdera pas toutes les compétences, mais une équipe de science des données bien conçue le fera.
Les compétences de cette auto-évaluation sont les suivantes :
- L'informatique
- Mathématiques
- Statistiques
- Apprentissage automatique
- Expertise du domaine
- Compétences en communication et en présentation
- Visualisation des données
Voici un exemple d’évaluation réalisée pour Rachel à la page 11 du livre :
Je pense qu'il s'agit d'un outil utile pour vous aider à vous concentrer sur vos forces et à reconnaître vos faiblesses que les membres de l'équipe peuvent vous aider à couvrir.
Ensemble d'histogrammes de compétences
De bons résultats en science des données nécessitent une équipe.
Un individu peut avoir une spécialité et être généralement faible dans d’autres domaines. C’est lorsque des personnes aux atouts divers sont réunies au sein d’une équipe que vous pouvez réaliser d’excellents travaux de science des données.
Les auteurs le démontrent visuellement comme suit (tiré de la page 12 du livre)
Évaluez-vous
Quelle est votre force parmi les 7 listées ci-dessus ?
Êtes-vous capable de vous attribuer une note subjective entre 1 et 100 pour chacune de ces compétences ?
Voir ci-dessous ma tentative d’auto-évaluation.
C'est dur. Je pense que mes points forts résident peut-être dans l'informatique, l'apprentissage automatique et la communication. Le graphique ci-dessus suggère que mes compétences en visualisation ne sont pas géniales.
Je pense qu'il est très facile de gonfler vos compétences. Dans quelle mesure est-il bon et comment comparer une compétence à une autre ? Être bon en mathématiques discrètes en informatique n'aide pas votre score en mathématiques si votre calcul est nul. Les statistiques, c'est des mathématiques, n'est-ce pas ? Bientôt. Néanmoins, il faut bien commencer quelque part.
L’apprentissage clé ici est d’identifier et de doubler vos points forts. Vous ne pouvez pas maîtriser toutes les compétences. Apportez votre plus grande compétence à la table.
Publiez vos résultats ci-dessous, je pense que ce serait une manière fascinante de regrouper des personnes sur de petits projets ou des concours de kaggle.
Y a-t-il une compétence manquante ci-dessus ?