. La tension entre la protection de la vie privée et l'innovation dans ce domaine est exacerbée par l'évolution rapide des technologies de localisation et des méthodologies d'analyse des données, ainsi que par le volume considérable de données disponibles sur les consommateurs. Cet article se concentre sur les risques pour la vie privée associés à ces développements. Dans la mesure où la législation actuelle et proposée en matière de protection de la vie privée protège les données de localisation, cette protection se limite aux données de localisation identifiées (ou dans certains cas identifiables) à une personne. Les exigences ne s'appliquent généralement qu'au collecteur de données initial ; cependant, des comptes rendus médiatiques et des mesures d'application récents décrivent un marché secondaire robuste dans lequel les données de localisation identifiées sont régulièrement acquises et utilisées par des tiers avec lesquels la personne n'a pas de relation directe, et les données de localisation dépersonnalisées ou anonymisées sont régulièrement combinées avec des données personnelles identifiées et utilisées par des tiers avec lesquels la personne n'a pas de relation directe pour compiler des profils complets de la personne. Ces pratiques du marché secondaire ne sont actuellement pas traitées par la loi américaine. Le présent article propose que les risques posés par la localisation et le profilage soient suffisants pour justifier l'examen d'une intervention réglementaire aux points suivants : collecte auprès de l'individu ; utilisation par le collecteur de données initial ; transfert vers et entre les participants du marché secondaire ; identification des données anonymes à un individu spécifique ; profilage de l'individu ; et prise de décision basée sur le profilage.

Suivi des données de localisation en général

La localisation des consommateurs est suivie régulièrement par de nombreux systèmes et appareils. De nombreuses applications mobiles (apps) suivent en permanence la localisation des utilisateurs ; Facebook, Google, Apple, Amazon, Microsoft et Twitter suivent et utilisent tous les données de localisation.

Les individus choisissent souvent de suivre leur localisation par le biais d'appareils personnels et de leurs applications, tels que les moniteurs de fitness, les smartphones et les trackers GPS, afin de permettre à l'application de leur fournir le service sous-jacent, tel que la détermination de la distance parcourue, la fourniture des prévisions météorologiques locales, la localisation et l'obtention des directions pour les restaurants à proximité.

Les cas d'utilisation commerciale des données de localisation individuelles identifiées comprennent la fourniture de biens ou de services de consommation (tels que l'assistance routière) et le marketing et la publicité ciblée. Les données de localisation agrégées (c'est-à-dire les données qui sont identifiables par des points de localisation distincts mais pas par un individu) peuvent aider les urbanistes à atténuer les problèmes de circulation, les responsables de la santé à identifier les schémas d'épidémies et les agences gouvernementales à surveiller la qualité de l'air. Les utilisations commerciales des données de localisation agrégées comprennent le contrôle des stocks et des parcs de véhicules, la planification des emplacements de vente au détail et le géofencing. Des points de données spécifiques peuvent être agrégés sur une période de temps définie, puis présentés en superposition sur une carte géographique. Par exemple, une entreprise de camionnage peut visualiser en temps réel les emplacements de ses camions et la demande de services de camionnage afin d'affecter plus efficacement les itinéraires. L'entreprise de transport routier peut également placer ses camions sous surveillance, ce qui signifie que si un camion sort d'une zone géographique donnée, l'entreprise sera alertée en temps réel. Les données de localisation sont essentielles à certains types d'analyses de données commerciales et publiques.

De récentes enquêtes journalistiques ont révélé que les données de localisation sont suivies par un plus grand nombre de parties, à des fins plus nombreuses et selon des modalités qui dépassent notre compréhension ou notre contrôle. Le volume de données de localisation suivies, divulguées et réutilisées est énorme. De plus, l'utilisation de multiples systèmes de localisation et l'utilisation de l'analyse des données pour combiner les données de localisation avec d'autres données personnelles permettent à la fois l'identification de données anonymes et la compilation de profils complets et précis des personnes suivies.

Sommes-nous arrivés à un point où le lieu lui-même sert d'identifiant pour le consommateur ? Les modèles de suivi de l'emplacement unique peuvent être utilisés pour identifier l'individu et élaborer un profil de l'individu. Le mode de vie d'une personne, ses priorités, ses activités professionnelles et personnelles, ses délits et ses peccadilles peuvent tous être déduits d'un suivi continu des lieux.

Le pouvoir du lieu : Une personne ne peut pas se trouver à plus d'un endroit en même temps.

Justification de la collecte initiale de données de localisation

Les données de localisation sont régulièrement collectées par des appareils, des applications et d'autres services en ligne.

En général, le modèle d'application de base est le suivant. Une personne télécharge une application de cartographie afin d'obtenir un itinéraire. Dans le cadre du téléchargement de l'application de cartographie, la personne accepte que sa position soit suivie afin de fournir des itinéraires personnalisés via l'application. L'application doit savoir où se trouve le point de départ de la personne afin de lui fournir des indications précises jusqu'à sa destination. Le matériel du téléphone intelligent de la personne et le logiciel de l'application utilisent le GPS et d'autres technologies de localisation pour déterminer l'emplacement géographique de la personne : plus les données de localisation sont précises et récentes, plus le service de l'application est précis.

L'opérateur sans fil transmet ces données de localisation en temps réel à une société tierce (l'agrégateur), sous réserve d'un accord de non-divulgation. L'agrégateur transmet les données de localisation à l'application afin que celle-ci puisse générer les indications à fournir à la personne. Les données de localisation sont suivies et divulguées afin de fournir la transaction demandée (c'est-à-dire les indications) à la personne. Le partage des informations avec des tiers est limité à ces fins, et les parties sont liées par des accords de non-divulgation écrits les empêchant d'utiliser ou de divulguer autrement la localisation de la personne.

C'est ce que l'on appelle la transaction initiale entre la personne et le collecteur de données. La justification de ce partage est que il est nécessaire d'honorer la demande du client pour les services d'application et d'assurer la cohérence de la qualité d'utilisation de l'application entre les opérateurs et les appareils, et le client a consenti à la localisation dans le cadre de son inscription au service d'application.

La boîte de Pandore des données de localisation : Le marché secondaire des données de localisation

Monétisation des données de localisation sur le marché secondaire

L'objectif de la collecte initiale des données de localisation est de permettre au collecteur de données de fournir un service à la personne ; l'objectif du marché secondaire est d'utiliser ces mêmes données de localisation pour tirer des conclusions et faire des prédictions sur la personne suivie. Le marché secondaire des données de localisation est utilisé pour monétiser les données de localisation à des fins non liées, par exemple pour permettre à un acheteur ultérieur de dresser un profil de la personne et de lui vendre l'accès (que la personne soit identifiée par son nom ou qu'elle fasse partie d'une catégorie de données, comme "femme engagée faisant des achats au détail"). L'analyse des données de localisation est à la base de diverses stratégies commerciales :

Les données commerciales contiennent généralement des données géographiques ou de localisation qui restent le plus souvent inutilisées. Ces données peuvent être aussi larges que la ville et le pays ou aussi spécifiques que la localisation GPS. Lorsque ces données sont placées dans le contexte de tableaux de bord big data et de modèles de science des données, elles permettent aux entreprises de découvrir de nouvelles tendances et de nouvelles perspectives.

Le marché secondaire des données sur les consommateurs est énorme. IBM affirme que 90 % de toutes les données sur les consommateurs qui sont actuellement en circulation ont été créées au cours des deux dernières années. Ce secteur devrait générer 350 millions de dollars par an d'ici à 2020 Les données de localisation constituent une part importante de cette activité. Le New York Times a rapporté que :

Au moins 75 entreprises reçoivent des données de localisation anonymes et précises de la part d'apps dont les utilisateurs activent les services de localisation pour obtenir des nouvelles locales, la météo ou d'autres informations, a constaté le Times. Plusieurs de ces entreprises affirment suivre jusqu'à 200 millions d'appareils mobiles aux États-Unis, soit environ la moitié de ceux utilisés l'année dernière. La base de données examinée par le Times - un échantillon d'informations recueillies en 2017 et détenues par une entreprise - révèle les déplacements des gens avec des détails étonnants, précis à quelques mètres près et dans certains cas mis à jour plus de 14 000 fois par jour.

Ces entreprises vendent, utilisent ou analysent ces données pour répondre aux besoins des annonceurs, des détaillants et même des fonds spéculatifs qui cherchent à comprendre le comportement des consommateurs. Il s'agit d'un marché en plein essor, les ventes de publicités ciblées par emplacement étant estimées à 21 milliards de dollars cette année.

L'analyse des données de géolocalisation permet de cibler la publicité et le marketing pour la vente au détail et d'autres activités commerciales. Ce profilage vise à individualiser autant que possible l'expérience du client afin d'encourager les achats et la fidélité :

L'ampleur des données recueillies par les premiers utilisateurs de la technologie [de localisation] est stupéfiante. La société d'analyse de localisation RetailNext suit actuellement plus de 500 millions d'acheteurs par an en collectant les données de plus de 65 000 capteurs installés dans des milliers de magasins de détail. Une seule visite d'un client peut donner lieu à plus de 10 000 points de données uniques, sans compter les données recueillies au point de vente.

En outre, le potentiel de combinaison et de réutilisation des données de localisation est énorme :

En combinant les données de localisation avec les données existantes des clients, telles que les préférences, les achats antérieurs et les données comportementales en ligne, les entreprises obtiennent une compréhension plus complète des besoins, des désirs et des comportements des clients que ce qui est réalisable avec les seules données en ligne.

En 2014, Shoshana Zuboff a inventé le terme de "capitalisme de surveillance" pour décrire la façon dont les données des consommateurs sont devenues une entreprise à part entière. Plus récemment, Zuboff a expliqué comment les données de localisation s'inscrivent dans ce modèle :

Il y a eu une courbe d'apprentissage pour les capitalistes de la surveillance, motivée par la concurrence sur les produits de prédiction. Ils ont d'abord appris que plus l'excédent est important, meilleure est la prédiction, ce qui a conduit à des économies d'échelle dans les efforts d'approvisionnement. Puis ils ont appris que plus le surplus était varié, plus la valeur prédictive était élevée. Ce nouvel élan vers les économies d'échelle les a fait passer de l'ordinateur de bureau au mobile, dans le monde entier : votre conduite, votre course, vos achats, la recherche d'une place de parking, votre sang et votre visage, et toujours... l'emplacement, l'emplacement, l'emplacement.

Les données sont généralement vendues sur le marché secondaire en tant que données identifiées (qui sont directement associées à un individu distinct) ou en tant que données désidentifiées ou anonymes (qui sont agrégées et non associées à un individu distinct).