bandeau_edess


Bienvenue, Invité
Nom d'utilisateur: Mot de passe: Se souvenir de moi

SUJET: Anonymiser un flux Esppadom

Un script Notepad++ 17 Mai 2021 14:33 #247

  • François ROUGERIE
  • Offline
Notepad++ permet d'utiliser des scripts en Python pour automatiser des tâches

via Modules d'extension / Gestionnaire des modules d'extension, installer le module Python Script

via Modules d'extension / Python Script créer un nouveau script, l'enregistrer sous le nom anonymiser.py

le code du script est très court :

# script Python pour des remplacements multiples dans un fichier

with open('C:/temp/anonymiser.txt') as f:
for l in f:
s = l.replace('\n', '').split('\t')
if s[0]:
editor.rereplace(s[0], s[1])


le script lit le fichier anonymiser.txt placé dans le répertoire C:\temp et applique toutes les instructions de substitutions de balises

pour exécuter le script : Modules d'extension / Python Script / scripts / anonymiser
Pièces jointes:
L'administrateur à désactivé l'accès en écriture pour le public.

Les balises à anonymiser 04 Mai 2021 13:44 #246

  • François ROUGERIE
  • Offline
Les balises les plus sensibles à anonymiser sont :

Name, FirstName, LastName, SIRET, LineOne, LineTwo, PersonName, CompleteNumber, URIID, CityName, PostcodeCode, email, BirthDate

Mais rechercher et remplacer sans précautions une chaine de caractères comme Name demande un peu de technique si on ne veut pas aboutir à des résultats bizarres

- utiliser un éditeur comme Notepad++ très puissant et surtout gratuit

- pour retrouver les balises dans un fichier XML, utiliser des expressions régulières comme par exemple PersonName>.*< qui a pour signification PersonName> suivi d'un nombre quelconque de caractères suivi de <

- via la commande remplacer tout, choisir le mode expressions régulières et remplacer PersonName>.*< par PersonName>Nom<

c'est simple, non ;-)
un petit fichier contenant les expressions à rechercher et comment les remplacer

Fichier attaché:

Nom du fichier: anonymiser.txt
Taille du ficher:0 ko


... à suivre un script Notepad++ pour automatisation
L'administrateur à désactivé l'accès en écriture pour le public.

Anonymiser un flux Esppadom 03 Mai 2021 15:17 #244

  • François ROUGERIE
  • Offline
Les messages Esppadom comprennent des données personnelles = les bénéficiaires des aides. La structure des messages est complexe mais anonymiser le contenu avant de le faire traiter par le Thagomizerest relativement simple. Les balises "sensibles" sont les suivantes :

- nom, prénom, date de naissance
- adresse, code postal
- numéro de téléphone, adresse de messagerie

... à suivre, un script permettant d'anonymiser un flux Esppadom XML avec l'éditeur de texte gratuit Notepad++
L'administrateur à désactivé l'accès en écriture pour le public.
Propulsé par Forum Kunena