Principe 7 : Méthodologie solide

Des statistiques de qualité sont fondées sur une méthodologie solide. Cela nécessite des procédures, des compétences et des outils adéquats.

Méthodes
Dernière mise à jour le : 28/02/2023

Indicateur 7.1

Le cadre méthodologique général utilisé pour les statistiques européennes est conforme aux normes, lignes directrices et bonnes pratiques européennes et internationales, tout en cherchant constamment à innover.

L'Insee s’appuie sur les cadres méthodologiques définis par Eurostat pour les statistiques européennes. Les statistiques sociales produites par l’Institut, comme l’enquête Emploi, répondent ainsi au règlement cadre européen IESS (Integrated european social statistics) et à la réglementation secondaire associée. De même, les statistiques d’entreprises sont conformes au règlement cadre européen EBS (european business statistics).

L’Insee participe également à l'élaboration des normes internationales et communautaires, ainsi qu’à des task-forces pilotées par Eurostat. L’implication de l’Institut est marquée sur des sujets comme le centre d’excellence d’ajustement saisonnier, le big data ou l’exploitation des sources administratives.

L’innovation est au cœur de nombreux projets menés par l’Insee. Concernant les enquêtes ménages, le programme Multimode, lancé en 2016, vise à développer la collecte par internet. Ce programme a été en particulier mis en œuvre pour l’enquête Emploi. D’autres expérimentations ont été lancées comme pour l’enquête Fonction publique d’État ou celle sur Cadre de vie et sécurité (CVS). Avec la période de confinement, conséquence de la pandémie du Covid-19, l’Insee a également innové pour répondre aux nouveaux besoins en collaborant avec des détenteurs de données privées et publiques.

Pour renforcer les capacités d’innovation et d’exploitation de nouvelles sources, l’Insee a progressivement réorganisé ses services. Créé en 2012, le département des méthodes statistiques élabore, promeut et valide les bonnes pratiques d’usage transversal à l’Institut, voire au service statistique public (SSP). Son spectre d’actions est large : sondage, analyse spatiale, conception d’enquêtes, etc. À côté de ce département, un centre de ressources et d’animation autour de la science des données pour la production statistique, le SSP Lab, a été créé en 2018. Il mène de nombreux travaux exploratoires utilisant par exemple les méthodes de machine learning, ou de webscraping. Le SSP Lab a été particulièrement mobilisé pour exploiter de nouvelles sources de données et produire des statistiques à même d’éclairer le débat public lors de la pandémie liée au Covid-19.

Indicateur 7.2

Des procédures sont en place pour garantir une application cohérente des concepts, des définitions, des nomenclatures et de tout autre type de normes au sein de l’autorité statistique.

Depuis 2018, l’Institut dispose d’un référentiel unique, RMéS (référentiel de métadonnées statistiques) centralisant les métadonnées statistiques diffusées, c’est-à-dire toutes les informations permettant de qualifier les résultats produits. RMéS contient les principaux concepts, définitions et nomenclatures en vigueur à l’Insee. Il comprend en outre tous les éléments permettant de décrire les opérations statistiques. La centralisation des métadonnées et l’adoption d’une description conforme aux standards internationaux permet leur partage au sein du service statistique public et leur large réutilisation, notamment par des machines.

Les concepts, normes et définitions sont utilisés de façon homogène dans l’Institut, avec une volonté de suivre les recommandations européennes. Par exemple, le concept d'entreprise profilée est mis en œuvre progressivement dans la production de la statistique structurelle d'entreprise, conformément aux préconisations d'Eurostat. L’harmonisation des concepts est aussi de mise pour les enquêtes ménages via l’existence d’un tronc commun de questions. Plus largement, la bonne utilisation des normes, nomenclatures, définitions dans les enquêtes est vérifiée par le Comité du label de la statistique publique.

Indicateur 7.3

Les répertoires et les bases de sondage utilisés pour les statistiques européennes sont régulièrement évalués et corrigés si nécessaire afin de garantir une qualité élevée.

Concernant la statistique d’entreprises, l’Insee gère le répertoire administratif Sirene et le répertoire statistique Sirus. Ces deux répertoires sont mis à jour en continu et font l’objet d’opérations d’amélioration de la qualité régulières ou spécifiques. L’évaluation de la qualité fait partie des opérations de gestion courante de ces bases.

La qualité des enquêtes sur les ménages s’est fortement accrue grâce à la mise en œuvre du programme Nautile qui s’appuie sur la mise en œuvre de méthodes innovantes de sondage et de tirage des échantillons. Depuis 2019, les échantillons des enquêtes sont désormais actualisés tous les ans à partir de la dernière source fiscale disponible. Cette mise à jour permet aux enquêtes collectées lors de l’année A d’être tirées dans un échantillon de ménages (ou d’individus) dont la résidence et les coordonnées (téléphone et internet) ont été renseignées par les ménages au mois de juin de l’année A–1, ou A–2 pour les enquêtes de début d’année.

Indicateur 7.4

Il existe une concordance précise entre les systèmes nationaux de nomenclatures et les systèmes correspondants au niveau européen.

Dans la mesure où la production statistique est largement conduite par la demande européenne, la convergence entre nomenclatures françaises (destinées à répondre également à des besoins nationaux) et nomenclatures européennes est recherchée au maximum.

Les nomenclatures économiques françaises s'inscrivent dans un réseau international de nomenclatures d'activités et de produits répondant à différents cadres d'utilisation. Des tables de correspondances spécifient les liens établis par construction entre ces différentes nomenclatures.

La nomenclature d'activités française, NAF rév.2, est une nomenclature des activités économiques productives, principalement élaborée pour faciliter l'organisation de l'information économique et sociale. Afin de faciliter les comparaisons internationales, elle a la même structure que la nomenclature d'activités européenne Ouvrir dans un nouvel ongletNACE rév.2, elle-même dérivée de la nomenclature internationale Ouvrir dans un nouvel ongletISIC rév.4 (classification internationale type par industrie, CITI en français). La NAF rév. 2 contient deux niveaux agrégés « standard » (les sections et divisions) qui sont communs à la nomenclature internationale d'activités CITI rév. 4 et à la nomenclature européenne d'activités NACE rév. 2. Pour répondre aux besoins de l'analyse économique et de la diffusion en matière de données de synthèse, la nomenclature agrégée, NA 2008, a été créée. Elle comprend sept niveaux d'agrégation associés à la NAF rév.2 qui permettent les comparaisons internationales.

La classification des produits française, CPF, rév.2.1, vise à classer les biens et les services issus des activités économiques en fonction de caractéristiques communes. Pour chaque code NAF, un lien avec la CPF permet de visualiser les codes et intitulés des produits associés à chaque activité. La CPF s’intègre dans la nomenclature européenne de produits CPA.

La classification européenne des fonctions de consommation des ménages (ECOICOP) permet de décomposer la consommation des ménages par unités de besoin. Ses quatre premiers niveaux de regroupements sont désormais normalisés au niveau international. Elle est utilisée pour la diffusion des indices de prix à la consommation (IPC), l'enquête Budget des familles et les comptes nationaux.

L’Insee utilise au niveau international la classification de professions (Ouvrir dans un nouvel ongletISCO) et celle des groupes socio-professionnels (Ouvrir dans un nouvel ongletESEG).

Deux nomenclatures différentes pour les professions et catégories socioprofessionnelles sont utilisées au niveau national :

  • la nomenclature des professions et catégories socioprofessionnelles (PCS2020) est utilisée pour la codification du recensement et des enquêtes auprès des ménages ;
  • la nomenclature des professions et catégories socioprofessionnelles des emplois salariés des employeurs privés et publics (PCS-ESE) sert aux employeurs des secteurs privés et publics pour codifier la profession de leurs salariés dans les enquêtes statistiques ou certains formulaires ou déclarations sociales utilisés à des fins administratives et statistiques.

Justifiées d’un point de vue théorique et empirique, ces deux nomenclatures ne reprennent pas totalement la notion de profession de la nomenclature internationale Ouvrir dans un nouvel ongletISCO.

Les statistiques européennes localisées sont transmises à Eurostat selon la nomenclature NUTS, au niveau 1, 2, 3 ou LAU (unités administratives locales) selon les demandes. Le niveau NUTS 1 correspond aux nouvelles régions françaises plus les départements d’outre-mer (DOM). Le niveau NUTS 2 correspond aux anciennes régions françaises plus les DOM. Le niveau NUTS 3 correspond aux départements y compris d’outre-mer. Enfin, le niveau LAU correspond aux communes.

L’Insee contribue activement aux découpages territoriaux de la statistique européenne et à leurs implications pour la construction des données. Un investissement a été réalisé pour revoir les zonages existants (notamment les zones d’emploi et les aires urbaines) et les adapter aux demandes en données territoriales tout en les articulant aux découpages européens.

Ainsi, le zonage en zones d’emploi a été révisé en 2020 en s’appuyant sur une méthodologie adoptée par Eurostat qui a permis d’aboutir à des zones d’emploi dont les tailles (en nombre d’actifs) sont moins dispersées que dans la version antérieure.

L’Insee a également mis à jour le zonage en aires urbaines pour l’articuler avec les définitions internationales. Les plus grands pôles du zonage 2020 et leur aire d’attraction sont cohérents avec les périmètres des Ouvrir dans un nouvel ongletCities et de leur aire urbaine fonctionnelle utilisées par Eurostat et l’OCDE. Pour marquer le changement de méthode, le nouveau zonage a changé de nom : les « aires urbaines » ont laissé la place aux « aires d’attraction des villes ».

Par ailleurs, en 2020, l’Insee a mis à jour la grille de densité des communes pour améliorer la cohérence avec la méthodologie européenne. Cette classification reprend les travaux d’Eurostat, en introduisant une catégorie supplémentaire pour tenir compte des espaces faiblement peuplés, plus fréquents en France que dans d'autres pays européens. Ainsi, on distingue parmi les communes peu denses, des communes très peu denses.

Indicateur 7.5

Des diplômés dans les disciplines universitaires pertinentes sont recrutés.

Pour remplir ses missions, l'Insee recrute différents profils (des statisticiens, des économistes, des informaticiens et des chercheurs).

L’Insee recrute l’essentiel de ses cadres statisticiens parmi les diplômés des deux écoles du Ouvrir dans un nouvel ongletGenes (Groupe des écoles nationales d'économie et statistique) : l'École nationale de la statistique et de l'administration économique (Ouvrir dans un nouvel ongletEnsae) et l'École nationale de la statistique et de l'analyse de l'information (Ouvrir dans un nouvel ongletEnsai). L’accès à ces deux écoles se fait sur concours, ouverts à partir du niveau bac+2, avec des candidats issus pour la plupart de classes préparatoires aux grandes écoles. L’Ensae forme les administrateurs avec une formation scientifique pluridisciplinaire en économie, sciences sociales et mathématiques appliquées. L’Ensai forme les attachés statisticiens à la modélisation statistique, avec des compétences associées en économie et en informatique.

Les contrôleurs et les adjoints administratifs sont également recrutés par voie de concours tandis que les enquêteurs sont recrutés en fonction des besoins suite à des entretiens : tous ces agents sont formés au Ouvrir dans un nouvel ongletCefil (Centre de formation de l’Insee à Libourne) en suivant des cursus calés sur les besoins de la statistique publique.

Indicateur 7.6

Les autorités statistiques mettent en oeuvre une politique de formation professionnelle continue pour leur personnel.

L’Insee s’inscrit pleinement dans la mise en œuvre du Ouvrir dans un nouvel ongletdécret n° 2007-1470 du 15 octobre 2007 relatif à la formation professionnelle tout au long de la vie des fonctionnaires de l’État modifié par le Ouvrir dans un nouvel ongletdécret n° 2017-928 du 6 mai 2017. Le plan de formation comprend un volet national, accessible à tous les agents de l’Insee et des volets régionaux plus spécifiques à chaque établissement. La politique de formation de l’Institut est définie par un comité spécifique qui veille également à sa mise en œuvre.

La formation continue est intégrée au dispositif d’entretiens professionnels annuels : chaque année, les agents et leur supérieur hiérarchique direct envisagent les formations qui seraient utiles ou nécessaires pour l’année à venir. Ces formations sont directement liées au poste occupé, visent à renforcer les connaissances de base ou à préparer une mobilité professionnelle.

L’offre de formation s’étoffe tant dans son contenu, comme dans le domaine du management transverse, que dans ses modalités avec le développement des formations à distance par exemple. Les formations sont assurées par des spécialistes internes mais l’Insee mobilise également des opérateurs tels que l’ Ouvrir dans un nouvel ongletIGPDE (Institut de la gestion publique et du développement économique), l’ Ouvrir dans un nouvel ongletEnsae-Ensai Formation Continue (centre de formation continue du Ouvrir dans un nouvel ongletGenes - Groupe des écoles nationales d'économie et statistique), les Ouvrir dans un nouvel ongletIRA (Instituts régionaux d’administration) ou encore Ouvrir dans un nouvel ongletEurostat. La formation peut également s’appuyer sur des structures d’enseignement et de recherche reconnues. Par exemple, un partenariat entre l'université de Rennes et l'École nationale de la statistique et de l'analyse de l'information (Ouvrir dans un nouvel ongletEnsai) permet aux attachés statisticiens de l'Insee d'obtenir, sous conditions, un master mention « Mathématiques Appliquées, Statistique » parcours-type « Évaluation et décision publiques » grâce à un dispositif de formation continue diplômante. En 2015, ce master a reçu le label « European master in official statistics » (EMOS). De même, les jeunes chargés d’études de niveau administrateur sont encouragés à conduire une thèse sur travaux, sur la base des études et recherches qu’ils sont appelés à réaliser dans le cadre de leur poste.

Chaque année, près des trois quarts des agents en fonction à l’Insee suivent une action de formation.

Indicateur 7.7

Les autorités statistiques maintiennent et renforcent la coopération avec la communauté scientifique afin d’améliorer la méthodologie, l’efficacité des méthodes employées et d’encourager le développement de meilleurs outils lorsque cela est possible.

L’Insee organise des conférences pour faciliter la valorisation des travaux, les échanges scientifiques et permettre une progression des méthodes. Parmi elles, les Journées de méthodologie statistique (JMS), qui se déroulent environ tous les deux ans, rassemblent des statisticiens du service statistique public français, du milieu universitaire et des instituts statistiques étrangers. D’autres évènements sont régulièrement organisés par l’Institut, comme les Journées sur la correction de la saisonnalité, des séminaires Big data ou des séminaires de méthodologie statistique ouverts à tout le système statistique public. Les présentations de ces séminaires sont accessibles publiquement sur insee.fr.

L’Insee participe également à diverses conférences comme celles organisées par la Ouvrir dans un nouvel ongletSociété française de statistique (SFDS), l'Ouvrir dans un nouvel ongletInternational Statistical Institute (ISI), l’Ouvrir dans un nouvel ongletInternational Association for Official Statistics (IAOS), Ouvrir dans un nouvel ongletEurostat ou l’Ouvrir dans un nouvel ongletUnece.

Définitions