Selon William Sanger, l’économie est en pleine transformation grâce aux données massives. Les assureurs doivent « incorporer des solutions exploitant les données massives dans leurs processus de production ».

M. Sanger est chercheur et doctorant responsable du projet Données massives au Centre interuniversitaire de recherches en analyse des organisations (CIRANO). Le chercheur confirme la tendance : les assureurs ne sont plus seulement en concurrence entre eux, mais aussi avec des compagnies qui produisent et détiennent des données.

En une heure, quelque 20 millions de messages sont diffusés sur Twitter, souligne M. Sanger. Dans le même intervalle, près de 210 millions de requêtes seront aussi faites par des utilisateurs sur le moteur de recherche Google, tant par l’entremise de leur ordinateur que de leur téléphone.

« Chaque action que vous faites en ligne produit de l’information », rappelle M. Sanger. Le caractère massif des données permet de modéliser les comportements des individus. Dans un seul statut sur Twitter, les chercheurs estiment que l’on détecte 47 types d’information. Si les sondages classiques comptant 1 030 répondants fournissent des résultats avec une marge d’erreur de 3 %, on peut penser que les messages produits par des milliers de personnes peuvent fournir une bonne idée des tendances. L’équipe du CIRANO a ainsi mené son analyse de huit millions de messages faits pendant la campagne électorale, accompagnés de certains mots-clics sur Twitter.

Machine learning

Les techniques d’apprentissage automatique (« machine learning ») sont désormais multipliées par les capacités de calcul des appareils électroniques. M. Sanger cite en exemple les variations du prix de l’essence. Grâce à l’information fournie par les conducteurs eux-mêmes, on peut étudier le comportement des détaillants ou des enseignes, et arriver à anticiper les mouvements à la hausse du prix.

Le CIRANO a ainsi récolté quelque 25 000 observations du prix à la pompe faites par des usagers du réseau routier en février 2016 dans 240 stations d’essence à Montréal. « Il y a des zones à Montréal où le prix est plus élevé qu’ailleurs, et il y en a où l’écart de prix est très élevé », dit-il. Et on peut observer les anomalies dans l’offre dont peuvent profiter les consommateurs.

Selon un rapport récent de Montréal International, la région de Montréal est un terreau fertile pour l’utilisation des données massives, dit M. Sanger. On y trouve un écosystème de compagnies à l’avant-garde en technologies numériques, un excellent réseau universitaire et des possibilités de financement pour la recherche et le développement. Le Québec compte au moins 2 100 spécialistes des données massives, selon Linkedin, dont 88 % travaillent dans la région métropolitaine.