Les configurations de points

Résumé

Les statisticiens peuvent être amenés à étudier précisément des données spatialisées, par exemple la distribution des revenus des ménages, l’implantation sectorielle d’établissements industriels ou commerciaux, la localisation des établissements scolaires au sein des villes, etc. Des réponses peuvent être apportées grâce à des analyses menées à une ou plusieurs échelles géographiques prédéfinies comme au niveau des quartiers, des arrondissements ou des îlots. Toutefois, il est tentant de vouloir préserver la richesse des données individuelles et travailler en conservant la position exacte des entités étudiées. Si tel est le cas, cela revient pour un statisticien à élaborer des analyses à partir de données géolocalisées sans procéder à une quelconque agrégation géographique. Les observations sont appréhendées comme des points dans l’espace et l’objectif est de caractériser ces distributions de points. Comprendre et mat̂riser des méthodes statistiques qui traitent ces informations individuelles et spatialisées permet de travailler sur des données qui sont aujourd’hui de plus en plus accessibles et recherchées car elles fournissent des analyses très précises sur les comportements des acteurs économiques (ELLISON et al. 2010 ; BARLET et al. 2013). Dans ce cadre d’analyse, plusieurs questions méthodologiques importantes se posent alors au statisticien qui dispose de jeux de points à analyser : comment représenter et caractériser spatialement de telles données en utilisant des milliers voire des millions d’observations ? Quels outils statistiques existent et peuvent être mobilisés pour étudier ces observations relatives aux ménages, salariés, firmes, magasins, équipements ou déplacements par exemple? Comment prendre en compte les caractéristiques qualitatives ou quantitatives des observations étudiées? Comment mettre en évidence des éventuelles attractions ou répulsions entre les points ou entre différents types de points? Comment peut-on évaluer la significativité des résultats obtenus? etc. Ce chapitre a pour but d’aider le statisticien à apporter des résultats statistiquement robustes à partir de l’étude de données spatialisées qui ne reposent pas sur un zonage prédéfini. Pour ce faire, nous nous appuierons sur une revue de la littérature des méthodes statistiques qui permettent de caractériser des distributions de points et nous expliciterons les enjeux associés. Nous expliquerons à partir d’exemples simples les avantages et les inconvénients des approches les plus souvent retenues. Le code sous R fourni permettra de reproduire les exemples traités.

Publication
Manuel d’analyse spatiale