[Dossier]
Données de flux

Le géomarketing change de dimension

Auteur : Luc Coiffier
Temps de lecture : 9 min

Dans ce dossier, je vous invite à découvrir en détail les données de flux coéditées par Vectaury et Asterop, de leur création à leur utilisation.

LES RÉPONSES APPORTÉES

Les données de flux répondent à quatre questions :

  1. Combien de personnes passent ici ?
  2. Qui sont-elles ?
  3. D’où viennent-elles ?
  4. Comment sont-elles venues ?

 

Rentrons un peu dans le détail de chacune des questions :

COMBIEN ?

  • C’est la première question. Et juste après vient l’intervalle de temps sur lequel ce comptage est effectué.
  • Nous fournissons les données à l’année, au mois, à la semaine, au jour de la semaine et à l’heure.
  • Nous distinguons également les individus uniques et le nombre de passages. Nous reviendrons sur la distinction entre les deux un peu plus loin.

QUI ?

  • Une fois la question du « combien » résolue, la question du « qui » se pose.
  • Nous mettons à votre disposition les principaux profils sociodémographiques : sexe, âge et CSP.
  • Au total une trentaine d’indicateurs permettent de qualifier les individus.

D’OU ?

  • D’où viennent les personnes qui passe à un endroit ?
  • Cette question a deux déclinaisons : où habitent elles et où travaillent-elles ?
  • Nous répondons aux deux déclinaisons en fournissant les zones d’habitation et de travail sous forme de liste de quartiers Iris (tous les millésimes depuis 1999 sont supportés) et de taux de pénétration.

COMMENT ?

  • Enfin, la dernière question concerne le moyen de transport utilisé.
  • Deux moyens de transport sont distingués : la voiture et à pied.

Au total, plus de 250 indicateurs ont été créés et sont à votre disposition.

ET POUR QUOI FAIRE ?

CAS D’USAGE : LE DIAGNOSTIC RÉSEAU

flux exploitation

Pourquoi ce magasin est sous performant alors qu’il n’y a pas de raison apparente ?

  • Il peut être mal placé et caché : une simple information de flux permet de vérifier ce fait sans se déplacer.
  • Il a besoin d’une rénovation : le taux de transformation entre le flux et le nombre de clients réels est aisément vérifiable et comparable avec les autres points de vente.
  • Il est fermé aux heures de pointe : le flux heure par heure permet de valider les meilleures heures.
  • Il n’a pas de parking : alors que seulement 10% des passants sont des piétons.

 

Il ne s’agit ici que de quelques-unes des questions auxquelles il était compliqué voire impossible de répondre en l’absence d’information de flux.
Nous en avons identifiés des dizaines d’autres que nous intégrons systématiquement lors de la réalisation de nos diagnostics de réseau.
Chacune de ces questions a une répercussion directe potentielle sur l’activité du magasin, et chacune de ces questions dispose la plupart du temps d’une réponse opérationnelle en utilisant simplement les données de flux.

ET POUR QUOI FAIRE ?

CAS D’USAGE : L’ÉTUDE D’IMPLANTATION

Ici il s’agit de répondre à la question posée mille fois : l’emplacement à l’air bien, mais combien de personnes passent devant ?
S’il y avait un cas emblématique de l’utilisation des données de flux c’est bien celui-là.

À ce sujet nos solutions permettent de comparer aisément plusieurs emplacements potentiels, et plusieurs points de vente existants.
Il s’agit d’une fonctionnalité standard, et voici un exemple de tableau de comparaison entre différents points de vente et projet de point de vente.

panier de comparaison analyzer online asterop

ET POUR QUOI FAIRE ?

CAS D’USAGE : L’OPTIMISATION DU CIBLAGE ISA

flux ciblage isa

À ce stade nous n’avons pas encore exploité le « d’où » de notre série de questions.

L’optimisation des opérations de ciblage ISA est une recrue de choix pour l’utilisation de cette donnée.

Vous souhaitez mener une campagne de conquête ? Simplifiez-vous la tâche en sélectionnant les quartiers dans lesquels vous avez des passants mais peu de clients.
À l’inverse, pour une campagne de fidélisation, vous allez insister sur les quartiers peu représentés dans votre zone de chalandise réelle, mais dans laquelle vous avez des clients.

Vous disposez enfin d’une donnée terrain, réelle, représentative et fiable pour prendre vos décisions d’investissement.

LE FLUX DÈS LA PRISE DE DÉCISION

Indépendamment de l’existence de ces données, la grande nouveauté est que l’ensemble de ces indicateurs est disponible directement et instantanément en tout point du territoire métropolitain.
Il est terminé le temps où il fallait plusieurs jours à plusieurs semaines entre la commande et la mise à disposition de la donnée.

Aujourd’hui, si vous disposez d’un abonnement Analyzer Online, vous pouvez créer un projet n’importe où, tester n’importe quel point de vente de votre parc et obtenir toutes les informations de flux associées… en un clic et intégrées à tous les autres indicateurs.

Et si vous ne disposez pas d’un abonnement Analyzer Online, vous pouvez obtenir la même donnée au format base de données en quelques heures, ou utiliser notre API REST pour accéder directement à notre service de DaaS (Data as a Service) ou l’intégrer à votre application.

Comme vous pourrez le constater, nous avons fait tout notre possible pour simplifier et démocratiser le plus possible l’exploitation de ces données dans toutes vos analyses et vos applications.

Cela va sans le dire, mais toutes les études que nous réalisons peuvent également bénéficier des données de flux.
Que ce soit une étude d’implantation pour une pharmacie, ou le rapprochement de deux enseignes, nous disposons de la donnée de flux sur tout le territoire donc tout concoure à en généraliser l’utilisation.

DÉFINITION : PASSANTS OU PASSAGES ?

Avant de continuer, abordons la question du comptage des passages vs le comptage des individus.

Au départ nous avons hésité sur la stratégie à aborder pour la mise à disposition des indicateurs. Nous avons donc interrogé nos clients sur la pertinence de disposer de l’un ou de l’autre.

Forcément les réponses ont été variées en fonction des besoins et des usages. Certains souhaitent compter les individus uniques qui passent devant un magasin, les autres veulent connaitre la fréquentation globale d’une rue commerçante.

Au final nous avons décidé de fournir les deux séries d’indicateurs, parce que… parce que c’était possible et que cela répondait à différents besoins clairement identifiés.
Donc pourquoi se priver ?

Vous disposez ainsi des données de passages et des individus uniques.
Pour donner une analogie avec les statistiques de fréquentation des sites web : les individus uniques correspondent au nombre de visiteurs uniques, et les passages correspondent à l’audience.
Autant l’identification des visiteurs uniques est relativement simple (surtout lorsque vous bénéficiez de la base de profils qualifiés de Vectaury), autant le nombre de passages est un peu plus complexe à déterminer.
Sans entrer dans le détail, il nécessite d’analyser plus finement les données afin d’éviter de prendre en compte les habitants qui font les cents pas en attendant le bus devant chez eux.

Dans tous les cas vous bénéficiez des deux indicateurs, et cela vous donne également accès à l’indicateur composite qui vous indique le nombre de passages par individu, donc le taux de fréquentation répété d’un lieu.

UNE DONNÉE À JOUR

Asterop a investi dans la création et la mise au point de processus garantissant la mise à jour et la qualité des données mises à disposition de nos clients.
Vectaury a investi lourdement dans la mise au point de processus permettant d’automatiser et de sécuriser l’exploitation des centaines de millions d’informations de flux.
La mise en commun de nos expertises a naturellement amené à la création d’une donnée qui bénéficie des meilleurs processus de mise à jour et des données de référence les plus à jour.
En pratique, les données de flux sont mises à jour quatre fois par an.
Elles sont disponibles pour l’ensemble des millésimes d’Iris disponibles et maintenu par Asterop : de 1999 à aujourd’hui. (cf. Dossier Données RPP). Donc, quel que soit le millésime Iris dans lequel vous travaillez, les données de flux sont disponibles.
Elles sont redressées statistiquement en utilisant le dernier recensement RPP disponibles.
Les données emplois utilisées pour le redressement des emplois sont modélisées en utilisant la dernière base SIRENE disponible.

LE PREMIER CHANGEMENT DE DIMENSION : LE VOLUME

La donnée de flux est issue de la collecte des traces GPS de plusieurs dizaines de millions de téléphones portables.
Plus de 120 millions de traces sont ainsi collectées chaque jour, soit près de 4 milliards de positions géographiques par mois.

C’est un peu comme si vous aviez à votre disposition un sondage réalisé sur un échantillon de plusieurs millions de personnes.
Pour vous donner une idée, les premières analyses de flux réalisées par Affimétrie (devenue Mobimétrie) au début des années 2000 utilisaient un échantillon de quelques dizaines de milliers de personnes interrogées sur leurs trajets lors d’une seule journée.

En 2020, La donnée collectée par Vectaury couvre plusieurs millions de personnes, pour tous leurs déplacements personnels et professionnels tout au long de l’année, avec une précision géographique de l’ordre du mètre et une précision temporelle de l’ordre de la minute.

Quelqu’un a dit Big Data ? Nous sommes en plein dedans.

Concrètement, les données utilisées sont au minimum 150 000 fois plus volumineuses qu’il y a quelques années.
Et ce qui n’était pas techniquement possible, ni même envisageable il y a 10 ans, est devenu la réalité d’aujourd’hui.

LE SECOND CHANGEMENT DE DIMENSION : LA STATISTIQUE

Continuons un peu sur l’aspect technique.
Une fois la donnée collectée, elle est analysée par Vectaury :

  1. Pour éliminer les données non significatives. Elle est nettoyée, dédoublonnée, recalée… sur l’ensemble des 25 millions de profils présents dans la base, 90% sont éliminés pour ne garder que les plus représentatifs
  2. Les lieux de résidence et de travail sont déterminés statistiquement à partir des positions géographiques
  3. Les profils sociodémographiques sont déduits des lieux de résidence en utilisant les données du référentiel Asterop
  4. Le réseau routier et ses 60 millions de segments sont utilisés pour valider et qualifier les différents déplacements et les moyens de transport associés

 

Au final, plusieurs méthodologies de redressement ont été imaginées, conçues et mises au point par les équipes de Vectaury et Asterop, avec un seul objectif : sécuriser les données mises à votre disposition pour vos analyses.

ET LA RGPD ?

Le processus de collecte et de traitement des données à caractère personnel mis en œuvre par Vectaury a été validé par la CNIL.
Les données ainsi collectées sont ensuite agrégées au niveau Iris par Vectaury. A ce stade et compte tenu des volumes, la donnée restituée n’a plus aucun caractère personnel.
Pour être limpide, Asterop et Vectaury garantissent la conformité au RGPD de la donnée mise à disposition.

LE TROISIÈME CHANGEMENT DE DIMENSION : LE PRIX

Il n’était pas possible de faire un dossier sur les données de flux sans en aborder la question du coût.

Afin de justifier la présence de ce paragraphe dans un article du blog, il est nécessaire de le replacer dans un contexte général.
En 2009, lorsqu’Asterop a été démarché par les opérateurs téléphoniques pour revendre de la donnée de flux, nous parlions en dizaines de milliers d’euros par site pour des études, avec des réductions en volume.
Il y a quelques années, une proposition a été faite à un de nos clients pour un tarif autour de 3 k€ par site. Et c’était considéré comme une bon prix à l’époque.
À chacun de ces interlocuteurs nous avons indiqué que de tels tarifs ne permettaient pas (a) de démocratiser l’accès à la donnée de flux (b) de rentabiliser les investissements réalisés pour constituer les référentiels de données.
Et pendant ce temps-là nous constations la baisse inexorable des prix. Ce qui nous amène à aujourd’hui…

Dès nos premiers contacts avec Vectaury nous avons partagé la même vision : une donnée de qualité à un prix attractif et fortement dégressif était nécessaire pour répondre aux exigences du géomarketing.

Pour cette raison, nous avons choisi de retenir trois paramètres dans la détermination du coût global :

  • Le nombre de sites : un site correspond à une coordonnée latitude/longitude ou à une adresse
  • Le type de données retenu : piéton ou voiture, piéton et voiture, les saisonnalités et fréquence
  • Le nombre d’années d’engagement

 

En ce qui concerne la dégressivité, elle est cumulative avec le nombre d’années d’engagement : par exemple si vous vous engagez pour 100 sites sur 2 ans, vous bénéficiez du même tarif par site que si vous achetez 200 sites… dès la première année.

Pour donner quelques ordres de grandeurs :

  • Pour 10 sites, les prix démarrent à 56 € par site sans engagement
  • Pour 200 sites/an, les prix démarrent à 37 € par site avec 2 ans d’engagement
  • Et pour 1000 sites/an, les prix démarrent à 18 € par site avec 3 ans d’engagement

 

Si vous avez une question ou un projet, n’hésitez pas à contacter votre chef de projet.

2020 ET L’IMPACT DU CONFINEMENT ?

Pour terminer ce dossier, il nous semblait important d’aborder le cas de l’année 2020.
Cela peut vous paraître obsolète si vous lisez ce dossier en 2022, mais la réalité est qu’en 2020 le flux a été totalement atypique au point qu’il nous a semblé opportun de traiter cette année de façon un peu particulière.
Nous n’allions tout de même pas nous priver d’en tirer des enseignements.

À la base, les données sont mises à jour 4 fois par an et calculées sur 12 mois glissants.
Ainsi, début octobre 2020, les données disponibles vont d’Octobre 2019 à Septembre 2020.
Et en janvier 2021, les données disponibles iront de janvier 2020 à décembre 2020.

Par contre à partir d’avril 2021, vous disposerez de deux jeux de données : toujours les 12 derniers mois glissants mais nous y ajouterons l’année 2020 dans son intégralité.

Ainsi, vous pourrez non seulement garder les données de référence, mais vous pourrez également utiliser les données atypiques de 2020 dans vos études.

Leader de l’optimisation des réseaux de points de vente, Asterop crée des solutions personnalisées et propose des données de qualité pour fiabiliser vos décisions d’implantations et de ciblage.

Intéressé ? Nos équipes commerciales répondent à vos questions

Pour aller plus loin...

Data LSA Quelles nouveautés pour 2020 ?

La base LSA, c’est plus de 100 000 points de vente recensés en France chaque année. Cette base de données...

Analyzer Online, le making of

Les années 2010 ont vu apparaître les smartphones, les tablettes numériques et la généralisation du "Cloud Computing"...

Base de données FINESS : Le répertoire des établissements santé en France

La base de données FINESS répertorie l'ensemble des établissements...