Anonymisation des données dans Excel, tutoriel
Ce tutoriel explique comment utiliser la méthode d'anonymisation des données dans Excel avec le logiciel XLSTAT.
Jeu de données pour réaliser une anonymisation des données
Le jeu de données est un échantillon de 12 observations venant des résultats d’une enquête sur le salaire de personnes. Il présente pour chaque observation 4 variables : le genre, le code postal du lieu de résidence, le niveau des études et le salaire. L'objectif de ce tutoriel est de transformer ce jeu de données pour le rendre illisible à tout le monde.
Paramétrer une anonymisation des données dans XLSTAT
Une fois XLSTAT lancé, cliquez sur le menu Préparation des données / Anonymisation des données comme ci-dessous.
La boîte de dialogue Anonymisation des données apparaît.
Dans l'onglet Général, sélectionnez les données sur la feuille Excel que vous souhaitez transformer et cochez l’option anonymiser les libellés si vous souhaitez que le nom des variables genre, code postal, niveau d’étude et salaire soit aussi transformé.
Sélectionnez ensuite l'option Feuille pour afficher les résultats sur une nouvelle feuille, cochez l’option Libellés des variables pour considérer la première ligne de la table de données comme celle des étiquettes et ajoutez la colonne avec les libellés des observations.
Dans l'onglet Options, choisissez la méthode aléatoire puis cochez l’option supprimer les espaces à gauche et à droite de mon texte.
Dans l'onglet Données manquantes, vous optez pour la première option qui est de ne pas accepter les données manquantes.
Dans l’onglet Sorties, vous choisissez l’ensemble des propositions. Cliquez alors sur le bouton OK pour que les calculs commencent. Les résultats sont affichés dans une nouvelle feuille nommée Anonymisation des données.
Interprétation des résultats
Le premier résultat est un tableau résumant les données initiales qui sont affichées dans le même ordre que celui de la feuille de données.
Le deuxième tableau correspond à la transformation aléatoire de ces données sélectionnées. Les données qualitatives ont été remplacées par des chaines de caractères et les données quantitatives ont été mélangées sur chaque colonne. Le libellé des variables ont aussi été remplacées par des chaines de caractères aléatoires.
Le dernier tableau décrit la correspondance entre la valeur des données initiales et celles anonymisées pour les variables qualitatives.
Cet article vous a t-il été utile ?
- Oui
- Non