Article
L’Open Data ou comment contextualiser nos « insights »
Les entreprises et organismes publics partagent leurs données, c’est un fait. Les initiatives fleurissent et il est important d’en être informé pour pouvoir emboîter le pas au bon moment et ainsi développer votre avantage concurrentiel.
Qu'est-ce que l'Open Data ?
C’est assez simple ! L’open data est comme son nom l’indique une donnée ouverte. Cela signifie que chacun peut accéder à l’information et l’utiliser sans coût. Les principes définis par la Sunlight Foundation (organisation à but non lucratif regroupant les partisans de la donnée ouverte) sont les suivants. La donnée doit être :
- Complète
- Primaire
- Opportune
- Accessible
- Exploitable
- Non-Discriminatoire
- Non-Propriétaire
- Libre de droits
- Permanente
- Gratuite
Qui partage des données et quel est leur intérêt ?
Le plus gros partage d’informations est effectué en France par le gouvernement au travers de son portail data.gouv.fr. On retrouve des contributions de l’Etat (administrations centrales, autorités administratives...), les collectivités territoriales (villes, conseils généraux…) ou les entités poursuivant une mission de service public (SNCF, RATP, Pôle Emploi...).
On trouve également de gros contributeurs dans le domaine du privé qui utilisent des API pour partager leurs données. Leur intérêt répond à un devoir de transparence et de mise à disposition des données publiques pour le gouvernement. Pour les organismes privés, l’objectif est la satisfaction client grâce à de nouveaux services gratuits comme le suivi de la consommation grâce au compteur Linky chez Edf par exemple.
Quelques exemples simples de réutilisations
Les réutilisations les plus courantes répondent à des besoins de Data Visualisation. Elles concernent par exemple les transports ou les fréquentations de lieux touristiques en affichage cartographique mais ne sont pas « industrialisables ».
Une autre manière d’exploiter ces informations est la contextualisation des insights. Par exemple, quoi de plus contextuel que la météo ? En effet, celle-ci est au cœur des problématiques de beaucoup d’entreprises, citoyens et… Data Scientists ! Voici quelques questions/réponses :
- Comment expliquer une baisse de fréquentation des stations de ski ? #pasdeneige
- Le rayon Glaces a surperformé en Juin, mais pourquoi ? #canicule
- Les accidents de la route ont augmenté de 428% dans la région sur la première semaine de mars, que s’est-il passé ? #inondations
Dans le cadre d’une implantation d’un nouveau commerce ou d’une agence, on peut également utiliser les données socio démographiques pour « connaître » le chaland et ainsi proposer des services / produits mieux adaptés. En poussant ce raisonnement, on peut même imaginer utiliser ces données pour implanter notre magasin dans une ville plutôt qu’une autre.
Dans le secteur de l’assurance automobile, les données d’accidentologie, de météo et de prévisions de trafic peuvent également permettre de développer un scoring de « risque » et ainsi développer un service de prévention aux usagers. Ainsi, un petit message d’alerte aux usagers des secteurs géographiques concernés peut permettre de faire baisser le nombre d’accidents (et donc de sinistres à régler).
Les données partagées sont de natures très différentes (Santé, Transports, météo, Démographie…) et peuvent concerner chaque secteur d’activités. Il est crucial que vous vous concentriez sur les données disponibles et que vous étudiiez les opportunités qu’elles ouvrent à court terme, moyen terme et long terme pour votre organisation.
Avec l’open data, on peut rester sur notre faim… #frustration !
Lorsqu’on travaille avec des données publiques ouvertes, il faut apprendre à relativiser et à travailler dans des conditions parfois frustrantes. Au-delà du fait qu’il soit souvent difficile de trouver exactement le jeu de données qui nous convient, on peut être déçu de la fraîcheur des données. En effet, certains jeux de données ne sont que très rarement mis à jour (une fois par an, ou même jamais !).
Une autre source de frustration peut être le périmètre des données disponibles : certaines collectivités sont très actives, d’autres sont absentes sur data.gouv.fr. On peut donc se retrouver avec une étude pertinente grâce aux données ouvertes… mais exclusivement sur la ville de Rennes par exemple. Les initiatives Open Data sont nombreuses, ce n’est pourtant que le début et une généralisation est encore à réaliser.
Comment récupérer ces infos et industrialiser les mises à jour ?
Cela reste un des enjeux majeurs : pouvoir accéder aux informations partagées, en temps réel et avec une qualité de données satisfaisante. Le défi est en grande partie relevé grâce aux APIs mises à dispositions par les acteurs et permettant d’interroger les bases de données des fournisseurs d’informations en direct. Bien entendu, il vous faudra peut-être monter en compétences sur les technologies permettant de dialoguer avec les APIs, mais le jeu en vaut très certainement la chandelle !
Pour résumer, l’open data est une formidable opportunité favorisant l’innovation ou le développement de nouveaux services gratuits à destination des clients ou des partenaires. Quel que soit votre secteur, lancer des initiatives Open Data ou au moins effectuer une veille est un élément important pour construire ou garder un avantage concurrentiel. Sachez également que les bonnes idées fleurissent souvent au sein de votre organisation grâce à vos collaborateurs, alors pourquoi ne pas les faire participer à un « Open Data Challenge » pour qu’ils exploitent leurs idées ? C’est un excellent moyen de porter la stratégie de l’entreprise et de satisfaire vos collaborateurs ! #symétriedesattentions
Quelques sources de références sur l'Open Data
- https://www.data.gouv.fr : le site de référence du gouvernement avec de multiples accès aux données
- https://opendata.paris.fr : la ville de paris y partage pas mal d’informations utiles sur ses services (stationnement, parking, etc)
- https://www.infoclimat.fr/climatologie/stations_principales.php : site alternatif à Météo France pour récupérer facilement les données météo dans le cadre de diverses analyses
- https://fr.openfoodfacts.org/ : site de partage d’informations complémentaires sur les produits de la grande distribution
- https://www.insee.fr/fr/statistiques?categorie=1 : source de plusieurs jeux de données démographiques d’un niveau de détail assez fin (iris code, commune)
… Mais il en existe encore d’autres, plus ou moins pertinentes selon votre métier !