Le Census Bureau dépose un outil de confidentialité controversé pour une enquête


Le US Census Bureau a déclaré mercredi qu’il suspendait son intention d’appliquer d’ici 2025 une méthode controversée pour avoir protégé la vie privée des participants à son enquête la plus complète sur les Américains après avoir été repoussée par d’éminents chercheurs et démographes.

La science n’existe pas encore pour appliquer des algorithmes différentiels de confidentialité à l’enquête annuelle sur la communauté américaine, qui couvre plus de 40 sujets allant du revenu, de l’accès à Internet, du loyer, des handicaps et de la langue parlée à la maison, a déclaré l’agence statistique dans un article de blog.

« Il n’est pas non plus clair que la confidentialité différentielle serait finalement la meilleure option », a écrit Donna Daily, chef de l’American Community Survey Office.

Le Census Bureau a adopté pour la première fois l’utilisation d’algorithmes de confidentialité différentiels avec la publication l’année dernière du premier cycle de données du recensement de 2020, et il avait déclaré que la méthode serait appliquée aux données de l’American Community Survey d’ici 2025. Les algorithmes différentiels de confidentialité ajoutent des erreurs intentionnelles aux données pour masquer l’identité d’un participant donné. Il est plus visible dans les zones géographiques les plus petites, telles que les îlots de recensement.

D’éminents démographes et d’autres chercheurs avaient demandé dans une lettre adressée l’été dernier au directeur du Bureau du recensement, Robert Santos, indiquant que l’agence abandonnait son intention d’utiliser les algorithmes pour les futures publications de données, affirmant que cela mettrait en péril la facilité d’utilisation des chiffres qui sont à la base de l’infrastructure de données du pays.

Le questionnaire du recensement de 2020 posait des questions limitées sur la race, les origines hispaniques, le sexe, l’âge, les relations familiales et si une maison était possédée ou louée pendant le décompte des résidents très américains. L’American Community Survey, en revanche, est beaucoup plus complexe en raison des près de quatre douzaines de sujets qu’elle couvre lors de l’échantillonnage des résidents de 3,5 millions de foyers.

Le Census Bureau a déclaré que les algorithmes de confidentialité différentiels sont nécessaires car, sans eux, la croissance de données tierces facilement disponibles combinée à l’informatique moderne pourrait permettre aux pirates de reconstituer l’identité des participants à ses recensements et enquêtes en violation de la loi. . Les statisticiens du Bureau continueront d’étudier les méthodes de confidentialité pour l’American Community Survey, a indiqué l’agence statistique.

___

Suivez Mike Schneider sur Twitter : @MikeSchneiderAP





Source link -39