On ne soupçonne pas toute la science qui se cache derrière les choses qui nous entourent telles que les applications sur nos téléphones intelligents ou sur nos assistants vocaux. Nous avons rencontré Richard Vermette, scientifique des données chez Desjardins, qui a accepté de nous expliquer son parcours et de mettre en lumière le rôle des professionnels de ce domaine.
Tout au long de mes études secondaires et collégiales, ma discipline préférée était les mathématiques. Il était naturel pour moi de poursuivre à l’université dans un domaine en lien avec les chiffres. J’ai hésité entre trois formations : actuariat, statistique et informatique. Mon choix s’est finalement tourné vers un baccalauréat en statistique à l’Université Laval. Ce qui a guidé mon choix vers ce programme, c’est qu’il me permettait de travailler dans différents domaines tels que les assurances, les finances, la santé, la foresterie, etc. À la suite de mon baccalauréat, j’ai fait une maîtrise en statistique. Bien qu’il ne soit pas nécessaire d’obtenir un diplôme de 2e cycle pour être un scientifique des données, cela constitue toutefois un atout pour pouvoir prendre en charge et guider des projets d’analyse.
Le déroulement de mes journées de travail peut varier selon les tâches que je dois accomplir. Lorsque nous travaillons sur un projet, il faut tout d’abord prendre connaissance des données qu’on a sous la main et par la suite comprendre les objectifs visés par les analyses. Pour ce faire, nous avons des interactions avec les équipes ou les partenaires qui nous soumettent les objectifs à poursuivre afin de s’assurer que l’on comprend bien leurs besoins. Vient par la suite le volet programmation informatique qui consiste à programmer la méthodologie nécessaire pour assurer l’atteinte de ces objectifs. Finalement, on doit présenter le résultat de nos analyses aux équipes ou aux partenaires.
Le travail diffère selon le type de tâches qu’on accomplit dans tout ce processus. Ceux qui sont attirés par la programmation et par l’analyse de données travaillent le plus souvent seuls. Par contre, ceux qui s’occupent de la prise en charge des projets et des relations avec les partenaires passent environ 60-70 % de leur temps en rencontres avec les équipes et les partenaires. Ils travaillent plus souvent en relation avec les autres. Il est donc possible pour un scientifique des données de travailler seul ou en équipe, selon les tâches dans lesquelles il se spécialise. Le travail est généralement effectué au bureau ou en télétravail, bien qu’occasionnellement des déplacements soient nécessaires pour assister à des rencontres ou à des présentations.
Ce que je préfère dans mon travail, c’est de réussir à trouver des réponses aux questions générées par l’organisation en utilisant l’analyse de données. C’est satisfaisant de pouvoir faire ressortir de la valeur ajoutée aux données que l’on possède. J’aime aussi beaucoup le fait qu’il existe une grande diversité d’objectifs que nous pouvons poursuivre en analyse des données. Par exemple, dans la compagnie d’assurance pour laquelle je travaille, certaines analyses que j’effectue peuvent guider l’entreprise dans ses stratégies d’intervention auprès de la clientèle, d’autres peuvent être en lien avec la tarification, ce qui nécessite, entre autres, d’analyser le risque que représente certains clients afin de s’assurer que la prime est adéquate pour supporter ce risque, etc.
Le volet documentation est la partie de mon travail que j’aime le moins. Bien que cette partie soit la plus importante du travail, celle-ci nécessite beaucoup de temps pour s’assurer de bien faire ce qui est requis et correspond moins bien à mes préférences. Les tâches de documentation sont effectuées au début du projet pour bien documenter sur papier les objectifs poursuivis, mais elles doivent également être réalisées à la fin lorsque nous devons présenter les résultats.
Le domaine des statistiques et de la science des données est généralement très vague pour la plupart des gens. Lorsque je dis à mon entourage que j’ai étudié en statistique, l’idée qu’ils ont en tête c’est que j’analyse des statistiques de matchs de hockey et que je travaille avec des tableaux. Ils ne réalisent pas toute la complexité qui se cache derrière le travail d’un scientifique des données ni toutes les applications possibles de nos analyses. Par exemple, les scientifiques des données travaillent à élaborer des modèles prédictifs en intelligence artificielle, à analyser globalement les commentaires publiés sur les médias sociaux (ex. : dégager le taux de commentaires négatifs sur un sujet en particulier et découvrir s’il est plus élevé dans une région plutôt qu’une autre), à améliorer la détection assistée de maladies dans le domaine médical (ex. : dépistage du cancer du sein), à mesurer l’impact des coupes à blanc en foresterie et à planifier où l’on doit replanter et dans quelles conditions afin que ce soit optimal, à développer des assistants vocaux tels que Siri, Google Home, Alexa, etc.
Je dirais à cette personne que le domaine de la science des données est en constante ébullition et que de nouvelles pratiques et méthodologies sont continuellement en développement. Pour bien réussir dans ce domaine, il est important d’effectuer une vigie sur ce qui se passe dans le domaine et d’être prêt à apprendre et à se perfectionner tout au long de sa carrière. À titre d’exemple, les méthodologies et les outils qui étaient utilisés lorsque j’ai terminé mes études il y a dix ans ne le sont presque plus aujourd’hui. Les outils et les méthodes que nous utilisons maintenant permettent entre autres de traiter un plus grand nombre de données que dans le passé. Une bonne capacité d’autodéveloppement est donc importante.
Avant de choisir ce domaine, il faut également s’assurer d’être à l’aise avec le fait qu’un grand pourcentage du travail du scientifique des données concerne la programmation informatique. Il faut être certain d’aimer ce genre de tâches. Un bon sens logique est finalement nécessaire pour pouvoir effectuer efficacement toutes les analyses requises.