Statistiques sur les ressources et conditions de vie 2021 

SRCV 2021

Sources
Paru le :Paru le17/07/2024
Consulter

Précision et fiabilité

Précision globale

Conformément à l'annexe II du règlement (UE) 2019/1700, les exigences en matière de précision pour tous les ensembles de données sont exprimées en écarts-types et sont définies comme des fonctions continues des estimations réelles et de la taille de la population statistique d'un pays ou d'une région NUTS 2. Pour le domaine du revenu et des conditions de vie, les erreurs types estimées des indicateurs suivants sont examinées en fonction de certains paramètres définis :

  • Ratio du risque de pauvreté ou d'exclusion sociale par rapport à la population (indicateur AROPE)

  • Ratio du risque de pauvreté persistant sur quatre ans par rapport à la population (taux de persistance dans la pauvreté)

  • Ratio du risque de pauvreté ou d'exclusion sociale par rapport à la population dans chaque région NUTS 2 (indicateur AROPE par région).

Erreur aléatoire

SRCV est une enquête complexe impliquant différents plans d'échantillonnage dans différents pays. Afin d'harmoniser et de rendre les erreurs d'échantillonnage comparables entre les pays, Eurostat (avec le soutien méthodologique substantiel de Net-SILC2) a choisi d'appliquer la technique de "linéarisation" couplée à l'approche de "grappe ultime" pour l'estimation de la variance.

La linéarisation est une technique basée sur l'utilisation de l'approximation linéaire pour réduire les statistiques non linéaires à une forme linéaire, justifiée par les propriétés asymptotiques de l'estimateur. Cette technique peut englober une grande variété d'indicateurs, y compris les indicateurs SRCV. L'approche par "grappes ultimes" est une simplification qui consiste à calculer la variance en ne tenant compte que de la variation entre les totaux des unités primaires d'échantillonnage (UPE). Cette méthode exige que les fractions d'échantillonnage du premier degré soient faibles, ce qui est presque toujours le cas. Cette méthode permet une grande flexibilité et simplifie les calculs de variances. Elle peut également être généralisée pour calculer la variance des différences d'une année à l'autre.

L'hypothèse principale sur laquelle se basent les calculs est que le seuil de "risque de pauvreté" est fixe. En fonction des caractéristiques et de la disponibilité des données pour les différents pays, différentes variables sont utilisées pour spécifier les strates et regrouper les informations. En particulier, les pays ont été divisés en 3 groupes :

1) BE, BG, CZ, IE, EL, ES, FR, IT, LV, HU, PL, PT, RO, SI, UK et HR dont le plan d'échantillonnage peut être assimilé à un type stratifié à deux degrés. DB050 (strates primaires) est utilisé pour la spécification des strates et DB060 (unité d'échantillonnage primaire) pour la spécification des grappes;

2) DK, DE, EE, CY, LT, NL, LU, AT, SK, FI, CH dont le plan d'échantillonnage pouvait être assimilé à un type stratifié à un degré, DB050 est utilisé pour la spécification des strates et DB030 (ID du ménage) pour la spécification des grappes ;

3) MT, SE, IS, NO, dont le plan d'échantillonnage peut être assimilé à un échantillonnage aléatoire simple, DB030 est utilisé pour la spécification des grappes et pas de strates ;

Erreur de mesure

Afin de limiter les erreurs de mesure et d'améliorer la qualité de la mesure des revenus individuels dans SILC, les données concernant les revenus (imposables) et les prestations sociales, qui étaient collectées par voie d'enquêtes jusqu'en 2007, sont depuis lors collectées par appariement avec les données fiscales et sociales (DGFIP, CNAF, CNAV et CCMSA).

Cet appariement n'est toutefois pas exhaustif : l'appariement se faisant sur la base des adresses, les jeunes adultes de 18 à 25 ans qui figurent dans la déclaration de revenus de leurs parents à une adresse différente de l'adresse de déclaration peuvent être difficiles à retrouver (ces jeunes sont interrogés sur le montant de leur salaire). De même, les personnes qui ont déménagé depuis le 1er janvier de l'année de référence peuvent être difficiles à trouver.

Lorsque l'appariement ne peut être effectué (environ 4 % des individus pour les données fiscales), les revenus fiscaux et sociaux sont imputés.

Enfin, seules les prestations sociales d'une part et les revenus déclarés à l'IR d'autre part sont obtenus par appariement. Par conséquent, le questionnaire contient encore quelques sur des montants de revenus exonérés d’impôts sur le revenu et absents de la source sociale : revenu des apprentis, bourses de scolarité, heures supplémentaires exonérées...

Dans le cas des prestations de sécurité sociale, toutes les prestations familiales et de logement sont couvertes. Ce n'est pas le cas pour le minimum vieillesse. En effet, la CNAV et la MSA ne prennent en charge que 70 % du montant total.

Erreur de non-réponse

Les erreurs de non-réponse sont des erreurs dues à une tentative infructueuse d'obtenir l'information souhaitée auprès d'une unité éligible. Deux types principaux d'erreurs de non-réponse sont considérés :

1) la non-réponse unitaire, qui correspond à l'absence d'informations sur les unités entières (ménages et/ou personnes) sélectionnées dans l'échantillon. Selon l'annexe VI du règlement (UE) 2019/2242

  • le taux de non-réponse des ménages (NRh) est calculé comme suit :

NRh=(1-(Ra Rh)) 100

Où Ra est le taux de contact avec l'adresse défini comme suit :

Ra= Nombre d'adresses/personnes sélectionnées (y compris téléphone, courrier le cas échéant) contactées avec succès/Nombre d'adresses valides/personnes sélectionnées (y compris téléphone, courrier le cas échéant) sélectionnées et Rh est la proportion d'entretiens complets avec les ménages acceptés pour la base de données.

Rh=Nombre d'interviews de ménages réalisées et acceptées pour la base de données/Nombre de ménages éligibles aux adresses contactées (y compris le téléphone,

le courrier le cas échéant) sélectionnés et Rh est la proportion d'interviews de ménages complètes acceptées pour la base de données.

  • Le taux de non-réponse individuelle (NRp) est calculé comme suit :

NRp=(1-(Rp)) * 100

Où Rp est la proportion d'entretiens personnels complets au sein des ménages acceptés pour la base de données.

Rp= nombre d'entretiens personnels achevés/nombre d'individus éligibles dans les ménages dont les entretiens ont été achevés et acceptés pour la base de données.

  • Le taux global de non-réponse individuelle (*NRp) est calculé comme suit :

NRp=(1-(Ra Rh Rp)) 100

Pour les États membres où un échantillon de personnes plutôt qu'un échantillon de ménages (adresses, téléphones, courriers, etc.) a été sélectionné, les taux de non-réponse individuels seront calculés pour "le répondant sélectionné".

2) La non-réponse à l'item

Il s'agit de la situation dans laquelle une unité d'échantillonnage a été recensée avec succès, mais où toutes les informations requises n'ont pas été obtenues.

Erreur de traitement

Les programmes de traitement des données intègrent des contrôles de cohérence et de format des données (certains programmes de contrôle fournis par Eurostat ont été recodés en R au sein de la chaîne de traitement).